将蛋白质组大数据与人工智能相结合,致力于开发基于蛋白质组和其他分子组学的辅助临床诊断新方法,以期实现肿瘤等人类重大疾病的精准辅助诊断……由西湖大学郭天南实验室提供核心技术,近日,西湖欧米(杭州)生物科技有限公司获得数千万元种子轮融资。
据了解,西湖欧米有望实现临床转化的首个项目,是基于蛋白质标志物的甲状腺结节的良恶性诊断。
西湖大学
学院特聘研究员郭天南介绍道,蛋白质组学是继基因组学、转录组学后人类对生命活动奥秘探究的又一突破。人类的几乎所有生命活动都是由人体内的蛋白质执行的,疾病治疗的效果也取决于蛋白质机器的调控。蛋白质组学+AI技术的运用场景,将远不止于甲状腺结节。
为蛋白质称重 捕捉细微变化
人们在吞咽的时候,颈部随着吞咽动作上下活动的器官即甲状腺。甲状腺虽小,一发生病变或将形成甲状腺结节,导致颈部有肿物、疼痛以及甲状腺功能减退症。
早在2010年,中华医学会内分泌学分会曾公布中国首次十城市社区居民的甲状腺疾病流行病学调查结果,显示居民甲状腺结节患病率为18.6%。
“按此估测,如今每5个成年人中就可能有1人患有甲状腺结节。”郭天南介绍,相关临床调查显示,约有60%的甲状腺结节呈良性,10%呈恶性,剩下约30%,无论通过血液检测、B超、CT还是甲状腺组织穿刺活检,均难以辨别良性还是恶性。
“治疗甲状腺结节,很多人不得不选择切除甲状腺,代价是终身服药补充甲状腺素,以维持体内的甲状腺激素在正常水平。但其中相当一部分人,患有的实际上为良性结节。”郭天南表示,科学家们曾寄希望于基因检测,来解决这一难题,但经过十几年的尝试发现,基因诊断能够达到的特异性也仅在10%~50%左右,主要是因为甲状腺结节恶性程度低等原因,基因水平上的改变并不频繁、也不明显。
据介绍,一个人从生到死,从健康到疾病,绝大多数情况下基因都是不变的。但在不同健康状态下,人体内的蛋白质会发生变化。郭天南实验室选择从“蛋白质”入手,开展诊断疾病的技术研究。难点在于,这种变化非常细微,怎么才能检测到?
郭天南说,所有的蛋白质,即使肉眼能看到,因其复杂的结构也很难准确辨识。“我们通过测量它的重量,来鉴定、区分不同的蛋白质。蛋白质称重的这杆‘秤’叫质谱仪,我们使用的质谱仪可以达到约小数点后30位(kg)的精度。”
“将蛋白质称重是第一步,还不足以实现对甲状腺结节的良恶性辨别。两种蛋白质的差别是由质谱数据中众多因素的复杂关系所决定的,是一个模式识别问题。”西湖大学工学院李子青教授强调。
研究团队构建算法模型将2622个蛋白质组学数据进行了约2的1019次方的运算,再将筛选的20个关键蛋白进行良恶性的打分。受访者供图
设置算法评分 准确率达89%
在西湖大学工学院李子青教授看来,从甲状腺结节质谱大数据中鉴别其良恶性,就像从一张图像中辨识 “两张”长像类似的人脸。
他带领研究团队采用机器学习的方法,从原始质谱数据中选择出2622个有意义的候选特征蛋白质,并通过神经网络技术构建了一套适用于蛋白质组学数据的独特算法模型,将2622个蛋白质组学数据输入了这个模型,进行了大约2的1019次方的运算,终于找出了能够帮助医生辨别患者结节良恶性的20个关键蛋白。
李子青介绍,用这套模型,研究人员给这20个蛋白的总体情况打分(分值在0-1之间):当综合得分大于等于0.5,即为恶性结节;小于0.5,就是良性结节。临床试验显示,这种检测方法的综合准确率达到了89%。
“这项技术还可以用来筛选治疗肿瘤的药物。”郭天南说,电影《我不是药神》提到白血病中有一类叫慢性髓系白血病,几乎90%的这类患者体内都会出现一个特殊的融合蛋白BCR-ABL,科学家找到“伊马替尼”这种药,可以有效抑制这个融合蛋白的功能,有效率可以达到90%以上。
郭天南说,研究表明,每个肿瘤都可能有一个或多个这样的引起疾病的异常蛋白,并且还可能随着疾病的演进出现改变。如果能通过蛋白质组学+AI技术,实时找到当前疾病阶段的异常蛋白,就能实现“对症下药”。相信随着分子医学、大数据技术和人工智能的快速发展,蛋白质组学在精准医疗领域将展示出越来越大的应用潜力。
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。