生命体的遗传稳定性在于基因组,功能多样性在于蛋白质组。蛋白质组是由若干蛋白质所构成的集合体,其构成原则即其丰度整体分布规律,属于重大理论问题。贺福初院士所领导的军事医学科学院放射与辐射医学研究所、北京蛋白质组研究中心、蛋白质组学国家重点实验室及复旦大学生物医学研究院科研团队近来在多物种间揭示了蛋白质丰度的整体分布与蛋白质的进化、结构和功能存在规律性的相关,其成果“Regular patterns for proteome-wide distribution of protein abundance across species”,于2012年3月9日在线发表于PLoS ONE。
自然界的各类现象都有其制约规律,生命体的表征也不例外,蛋白质作为生命活动的关键执行者之一,其重要性不言而喻。蛋白质组学研究表明细胞内不仅表达数千至数万种蛋白质,而且丰度差异高达6个数量级。如此巨大的差异是随机产生的,还是存在本质的调节规律呢?贺福初院士率领的科研团队针对这一有趣的现象展开了探索。该团队选取了在整个生命进化史中具有代表性的6个物种(大肠杆菌、酵母、线虫、果蝇、小鼠、人)为研究对象,综合它们的定量蛋白质组数据,最终发现了存在于蛋白质丰度整体分布的三个普适性规律:1)在进化上,蛋白质丰度与其起源时间和序列保守性呈正相关;2)从结构角度,蛋白质丰度与其结构域数目呈负相关,而与其结构域的覆盖度呈正相关;3)蛋白质的功能决定其丰度:参与基础物质流的蛋白质其丰度高于调控精细信息流的蛋白质。蛋白质丰度分布规律的揭示对深入认识生命体的蛋白质构成原则具有重要的理论意义,同时也为从海量数据到知识归纳提供了有效的实践模式。
自然科学的重要目标是发现普遍规律与原理,其普遍的发展范式是:从数据的大量积累到经验性规律的不断发现,继而催生新的学说与理论。在 领域,近年来的组学研究导致了海量数据的“大爆炸”式积累,如没有理性条件下的系统化梳理、归纳、综合(就像十九世纪的细胞论、进化论,二十世纪的基因论),将不可避免地形成“灾难性”野性开采。近20年前四条分子进化规律性的发现、5年前生物分子网络组织规律的发现,生命体20种氨基酸的选择对于细胞内蛋白质等电点分布一劳永逸的解决方案的报道,以及不久前“促成生物学复杂性的蛋白质结构域特征因素规律性利用模式”的发现,证明当前 领域急需系统化的数据挖掘、并初步显示出此类尝试的有效性。此文就是荟萃分析(meta-analysis)和深度挖掘方法系统应用于蛋白组学数据的一个成功范例,为今后更加合理有效的利用组学数据进行理论生物学研究提供了方法和思路。(来源:蛋白质组学国家重点实验室)
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。