凤凰中心
■本报见习记者 边慧
中国科学院院士贺福初有一个比喻:基因组和蛋白质组的关系就像词典与文章、元素表与化工厂。基因组学中微小的差异,在蛋白质组学中可以被千倍甚至近万倍地放大。因此,要真正阐释生命,必须从蛋白质组中寻找答案。
北京市昌平区中关村 园的主入口处,一栋由南北双楼组成的银白色建筑呈一字型展开。这里是国家蛋白质科学中心—北京(凤凰中心)的总部大楼,也是“中国人类蛋白质组计划”(以下简称CNHPP)的主要研究基地,从2014年6月至今,有关人类蛋白质组的庞大数据在这栋建筑中陆续被测量和解读。
偶尔从门口经过的人也许无法想象,这些数据有一天会完全改变眼前的生活。基于人类基因组这部“天书”而发展起来的精准医疗,将因为人类蛋白质组信息的清晰而变得更加精细和普适。
不久前,凤凰中心主任、北京蛋白质组研究中心主任、蛋白质组学国家重点实验室副主任秦钧在第一届生命组学与精准医学大会上对CNHPP作了介绍,《中国科学报》记者就该计划对其进行了专访。
只有蛋白质组才能从根本上阐释生命
《中国科学报》:人类基因组计划完成了对人类23对染色体上全部DNA携带的遗传信息的总和——30亿个碱基对的测序工作,人体“天书”已完整地呈现在了人类面前。现在对人类蛋白质组展开研究,其意义是什么?
秦钧:科学界曾经认为,只要绘制出人类基因组序列图,就能了解疾病的根源,但事实并非如此。
基因是人类遗传信息的载体,是生命奥秘最原始、最根本的物质基础。蛋白质是基因表达的产物,是构成有机体的主要成分,是所有生命活动的载体和功能执行者,是细胞执行生长、发育、衰老和死亡等各种生命活动的基本单位。蛋白质与基因密切相关,但是在此基础上又产生很多变化,造就了生物体不同的形态、形状,或者执行不同的功能。
一个有机体只有一个基因组,但是同一个有机体的不同细胞中的蛋白质的组成和数量却随细胞种类和功能状态的不同各有差异。比如,人体不同组织器官的基因组是一样的,但是各个组织器官的蛋白质组不完全一样。人和鼠的基因组的差别仅为1%,但是其形态、性状差别非常大,这就是蛋白质组不一样的体现。
中国科学院院士贺福初有一个比喻:基因组和蛋白质组的关系就像词典与文章、元素表与化工厂。确实如此,基因组学中微小的差异,在蛋白质组学中可以被千倍甚至近万倍地放大。因此,要真正阐释生命,必须从蛋白质组中寻找答案。
《中国科学报》:在CNHPP开展之前,中国科学家已经主导执行过“人类肝脏蛋白质组计划”(HLPP)。和HLPP相比,CNHPP对研究方法和技术提出哪些新的要求?
秦钧:与前期的HLPP相比,无论从研究思路、技术方法,还是平台和团队,CNHPP都有较大的改进和完善,研究范围也显著扩大。特别是对数据质量、数据产出的速度等要求也越来越高。比如,蛋白质组的分析速度、精度以及在定量、可视化等方面要求不断提升。在CNHPP中,我们将对象扩展到心脏、肝脏、胃、肺脏、肾脏等人体器官,获得的实验数据不仅可以在器官内比较,更可以在器官间分析,获得全面的认识。
样本检测效率可提升6倍
《中国科学报》:为了绘制人类蛋白质组的精细图谱,CNHPP都将展开哪些研究?
秦钧:主要开展的研究包括:建立样本采集方法标准、样本预处理和生物质谱分析策略;进行含有定量信息的正常组织和疾病、疾病旁组织蛋白质表达谱、磷酸化谱、转录因子谱构建;建立临床蛋白质组大数据平台;通过数据分析、知识挖掘,发现若干疾病人群特征性信号通路变化的线索以及它们和病人手术后存活的关系。
这其中包含了很多难题。首先需要攻克的是蛋白质分离鉴定的速度、样本通量,除此之外,还有微量或痕量蛋白质的分析、蛋白质组大数据构建和多维度组学对接、蛋白质组数据的深入分析和知识挖掘的方法策略等。
《中国科学报》:CNHPP从2014年6月启动,迄今取得了哪些进展?
秦钧:主要包括五个方面的进展。
首先,建立了样本采集方法标准,并推广至全体项目团队,各临床团队已完成100组以上的样本,包括正常组织、疾病组织、疾病旁组织的收集。第二,建立了样本预处理和生物质谱分析策略,包括表达谱、磷酸化谱、转录因子谱方法标准。第三,建立了一种新蛋白质组分析策略,可在接近和达到样本蛋白表达数量的水平上,将检测时间缩短至传统蛋白质组技术的1/7左右。该分析策略已作为本项目的技术规范应用在所有样本的检测分析中。第四,通过测定和分析个体的蛋白质组数据,进行含有定量信息的正常组织和疾病、疾病旁组织蛋白质表达谱、磷酸化谱、转录因子谱构建。最后,通过初步数据分析,发现若干疾病人群特征性信号通路变化的线索。
蛋白质是最终解决精准医学问题的出路
《中国科学报》:你刚才提到了对蛋白质组数据的分析,其实将所得到的海量数据转换成有意义的海量信息才是研究的主要目的,现有的信息分析技术能够达到这一目标吗?
秦钧:我们通过联合相关生物学家、临床学家以及生物分析学家分析海量实验数据,一是通过各种生物信息学分析方法,努力从数据中挖掘有用的信息;二是依靠生物学家、临床学家,从生物学问题,临床问题、临床需求等方面研读数据。
现有的生物信息技术还不能完全按照我们的要求和期望分析蛋白组学数据。从规模和深度来看,CNHPP产生的数据对当前生物信息学是个挑战。因此,我们还在不断开发和整合新的生物信息技术,希望构建一个整合、快速、功能强大、完善的生物信息分析平台,以满足不断产生的海量数据的分析,这其实也是CNHPP的一个主要发展方向。
《中国科学报》:CNHPP的科学价值如何切实造福人类?
秦钧:从现阶段看,至少在以下几个方面可造福人类。
一是通过对重大疾病发生发展过程中的重要调控通路和重要调控蛋白质进行研究,揭示重大疾病的发生发展机制,同时获得一批重要疾病诊断标志物、药物靶标,从而提高重大疾病的防诊治水平。比如,通过筛选更多更具有诊断和判别意义的生物标志物,提高重大疾病的早期诊断能力或者为疾病早期预警、健康体检监测等提供重要依据,通过对疾病发生发展密切相关的蛋白质及其信号通路等的研究,为精准医疗提供判别依据和相应的手段。二是可以通过新的诊断试剂、创新药物以及相关科学仪器、诊疗设备等多种产品的市场化推动生物医药经济的发展。
《中国科学报》:CNHPP如何促进精准医疗的发展?
秦钧:我要特别强调CNHPP对目前正在筹划、即将启动的中国精准医疗计划的启示。美国的精准医疗计划没有包含蛋白组学的内容,是个很大的缺陷。中国的精准医疗计划在蛋白组学上有考虑和布局,是一个显著的进步。
蛋白质最终会是精准医学的出路。现在蛋白组学刚刚起步,相当于基因组学10~15年前的水平,但其发展势头已展现出蓬勃生机。中国的蛋白组学起步早,进步快,在世界的蛋白质组学领域占有一席阵地。最近建成、投入试运行的国家蛋白质组学大科学设施——凤凰中心已在CNHPP的实施中发挥了作用。其强大的蛋白质组解析能力,正在发展的蛋白质组生物信息学技术和方法,统一的样本准备流程,均一的质量控制方法和与临床医生的紧密合作、无缝连接,已对CNHPP高质量数据的产出和分析提供了坚实的基础和保障。
《中国科学报》 (2015-12-29 第6版 前沿)