中国工程院院士 樊代明
随着高通量测序技术的快速发展以及医疗信息化水平的不断提高,生物医学领域产生了大量数据。生物医学大数据蕴含了极其丰富的信息和知识,是关乎国家持续发展、国人生存健康的重要战略资源。生物医学大数据涉及与人类健康相关的各个领域,具有明显的多维、海量以及多源异构的特点,对生物医学大数据的分析与应用已成为当前国内外一个极具挑战性的问题。
首先,生物医学大数据的利用必须以临床需求为导向,围绕疾病的病因、诊断、治疗、预后等相关问题展开。精准医学将组学大数据应用到临床,体现了生物医学与大数据技术的融合,但也要正视精准医学的局限性:多数基因和疾病关联度很低,说明基因不是实现精准医疗的唯一途径,只是提供了新的可能性。生物医学大数据需要整合基因组学、临床数据与其他相关风险和预测因素才能真正实现价值。
其次,对于生物医学大数据的监管难度很大,现有的制度设计还不够,对生物医学大数据的管理和利用进行立法刻不容缓。对生物医学大数据的综合利用,必然会带来新的社会、伦理和法律等相关问题,必须用法律法规形式进行监管。要对数据从采集到使用进行全链条管理,既要考虑如何保障数据的安全性,但更要考虑如何实现数据的共享,可通过建立负面清单等制度来促进数据利用。
最后,传统的生物医学数据分析思维和方法难以适应大数据分析的需求。生物医学大数据实现了以患者为维度的多源数据的整合,需要分析的数据如此之多,因此,不再只依赖分析少量随机抽样的数据,也不再热衷于探求数据之间难以捉摸的“因果关系”,而是更多关注数据的“相关关系”。与传统随机对照研究常用差异性统计分析方法不同,生物医学大数据更多采用数据模型以及控制混杂的统计分析方法。
生物医学是一门综合性学科,涉及生物学、医学与社会学等多种学科,大数据技术在生物医学领域的应用也日益广泛。在这样的时代背景下,建立生物医学大数据正确的发展观对于落实健康中国、健康医疗大数据等国家重大战略具有重要意义。