中国工程院院士 刘昌孝
自从人类基因组计划启动以来,以第二代高通量测序技术等为代表的各类组学技术飞速发展,推动了基因组、转录组、表观遗传组等
组学数据的指数级增长,把生物医学数据推进到了大数据时代。大数据分析正在成为生物医学领域的下一个前沿,集数据存储、数据共享、数据分析和数据质量控制等融合数据形成大数据应用产业发展和全新机遇。
然而,在被学术不端充斥的今天,我也遇到一些困惑,如数据来源、挖掘分析、数据共享、诊断治疗应用、医学伦理和遗传机密问题等,可能会干扰数据信息的发展和应用。
1.保密问题:随着二代基因测序技术、基因治疗、以及基于遗传信息开展的药物试验等技术逐步成熟,人类遗传资源的采集方式所形成的人类遗传医学数据中含有大量机密资源,其采集、保藏、利用和对外提供的管理已引起相关部门的重视。应禁止外国组织、个人或实际控制的机构采集、保藏、对外提供中国人类遗传资源。
2.伦理问题:来源于人的数据,应保护人的生命和健康,维护人的尊严,尊重和保护受试者的合法权益,规范涉及人的生物医学研究伦理审查,否则是不许可随便使用和传播的。
3.数据来源真实性问题:在
和临床医学研究中产生大量研究和检测数据,有些则会被永久保存做后续分析,或形成关键数据库,或索引数据源。其数据来源的真实性就是第一关。
4.医学数据应用问题:对于医疗行业,从疾病的早期发现、预防到诊断、监测的创新、高性价比、及时和可靠的诊断系统和解决方案,有助于医务人员提高患者的治疗效果,减少社会医疗成本。但是应该注意到医疗大数据只是起到协助医生精准判断、预测治疗方案及疗效大的作用。说明数据存在局限性,或需要会诊、需要人智力的判断后得出结论,并不能完全代替医疗专家。
5.数据共享问题:对于共享平台形成大的共享数据,如蛋白数据库、基因数据库为生物医学科学数据领域相关研究提供了有益的参考和借鉴。其在数据获取方式、数据管理及共享模式、服务方式等方面均符合自身数据特点的数据管理链条及流程,在应用时必须符合其运用、引用和存取的规范。