作者:王敏 来源:中国科学报 发布时间:2023/3/8 0:17:31
选择字号:
“机器化学家”是怎样炼成的?

自主阅读海量文献汲取前人智慧,制定实验方案,在无人干预的情况下完成实验全流程,思考出最优解,创造新的化学品和材料。

这正是中国科学技术大学(以下简称中国科大)化学与材料科学学院教授罗毅、江俊团队的作品:8年攻关,他们开发和集成移动机器人、智能化学工作站、智能操作系统、科学数据与模型库,研制出“全球首个数据智能驱动的全流程机器化学家平台”(以下简称机器化学家)。

研究成果论文发表在《国家科学评论》期刊上。审稿人评价,该成果的“机器人系统、工作站和智能化学大脑都是最先进的” “将对化学科学产生巨大影响”。

“这主要得益于中国科大多学科交叉的背景,促使不同学科的科研人员汇集在一起共同做一件事。我们的目标是建成机器化学家大科学装置,解放化学家双手,加快新的化学品和新的材料研发创制。”江俊向《中国科学报》介绍。

日前,罗毅、江俊团队获得了2022年中国科学院年度团队称号。


罗毅、江俊(中)团队部分成员在实验室合影 张大岗 摄

“最强化学大脑”引领化学研究智能化

提及为何会研发机器化学家?江俊自嘲是因为自己手笨。早在2003年,还在中科院上海技术物理研究所攻读硕博连读学位的江俊,经常需要做实验。“但是我的手特别笨,所以做实验失败是常有的事。”江俊笑着说,后来他师从罗毅教授,专攻理论化学研究。

在做理论研究中,江俊发现中国人在学术上非常“被动”。“我们做了大量的研究工作,最终成果发表在外文期刊上。但引用这些论文数据时还得花钱买,并且只有访问权,不允许大量下载。”江俊认为,“我们应该做中国人自己的材料数据库”。

狄拉克说“公式都是优美的”,底层规则是非常清晰和简单的。但是一旦将理论应用到实践中,解答其方程的复杂度往往高到无法想象,人类无法计算求解。因此,由于算力和人类思考能力的局限,理论和实践常常处于“脱节”状态。

长期的理实“脱节”,带来了传统化学研究的最大“痛点”:科研人员主要依赖于“穷举”“试错”的手段去创制新物质,导致实验成本高、周期跨度长;随着化学研究对象日益复杂化、高维化,面对庞大的化学空间,配方和工艺的搜索常常止步于局部最优,无法进行全局探索。

逐渐兴起并快速迭代进化的大数据与人工智能技术为解决这些难题提供了新的机遇。罗毅、江俊及其团队提出“机器化学家”概念,并开展相关科研工作。从2014年到2022年,他们攻坚克难,成功研制出机器化学家。

机器化学家由“化学大脑”、机器人实验员和智能化学工作站三部分组成。其中最核心的“化学大脑”通过分析大量化学实验和理论数据建立知识图谱,实现了阅读理解文献、设计化学实验、自主优化方案的能力,并配备了人机交互的操作系统,可以便于“无编程基础”的科研用户使用。机器人实验员和16个化学工作站之间能进行数据交换和互动,精准配合执行化学实验。

以研制潜力巨大的高熵化合物催化剂为例,江俊展示了机器化学家的“绝技”:阅读16000篇论文,自主遴选出5种非贵金属元素,融合2万组理论计算数据和200组全流程机器实验数据,建立了理实交融的智能模型,从55万种可能的金属配比中找出最优的高熵催化剂。将传统需要消耗大量人力、物力、时间等的“炒菜式”遍历搜索所需的1400年,缩短为5周。

业内专家认为,机器化学家的研究工作脱离了传统试错研究范式的限制,展现出“最强化学大脑”指导的智能新范式的巨大优势,引领化学研究朝着知识理解数字化、实验操作指令化、材料创制模板化的未来趋势前进,确立了我国在智能化学创新领域的全球领跑地位。

“从不摆烂、从不应付交差”

如此“聪慧”的机器化学家,其研发团队成员近30人,多数是90后、95后。他们分工明确,配合默契。

化学实验经验丰富的朱青等人负责实验方案设计,并对机器人实验员的操作质量进行评估;黄炎等人负责理论模型的计算;张百成编写程序,让机器人读论文、提出科学假设、形成实验报告和方案;肖恒宇和赵路远等主攻系统整体软件架构以及各个化学工作站的软硬件开发;自动化系的尚伟伟、张飞老师团队负责研制机器人。

“研发的一个难点在于实现机器人对化学实验操作的精准模仿。”江俊说,人可以自然而然或是通过训练做出很多动作,但是机器人做不到。为解决该难题,尚伟伟与张飞把科研人员做实验的各种动作拍成视频,然后一点点分解,最后实现精准模仿。

另一个难点在于改造智能化学工作站。很多传统的化学工作站与机器人之间并不具备远程通讯互动的功能,这就要求团队自主开发。

赵路远和师弟曹嘉祺在编写固体进样仪器的驱动程序时,由于信息掌握不充足,无法准确理解并调用仪器接口。他们多次联系了国外仪器厂商和代理商,但是得到的回应都是“无可奉告” “商业机密”。为此,他们决定自力更生。

“当时,我们用了3个星期的时间,重复做了3000次发送信号、等待反馈、记录响应的实验,逐步逆向试出底层控制逻辑,成功实现了对机器人的远程控制。”赵路远说,令她自豪的是,后来国外仪器厂商主动联系,希望可以购买他们研发的驱动程序。

2021年12月2日,机器化学家迎来第一次“大考”——系统整体试运行。团队成员信心满满,结果却差强人意。“化学设备单独运行时是正常的,但参与到系统联调时却无法使用。” 肖恒宇说,团队成员通宵达旦排查原因,仍无头绪。

肖恒宇想到化学设备和机械臂均使用了红外探测设备,可能会互相干扰。于是,他将机械臂换一个朝向,解决了问题。

在往后的开发调试中,不同领域的仪器设备,不同系统的程序通讯间,都出现了类似的“磨合”难题,团队通过交叉学科思维,将它们逐一击破。

面对的问题越复杂,就越考验跨学科的思考能力。令江俊欣慰地是,团队成员在面临技术难题时,从不摆烂,从不应付交差。一个方案受挫,他们集智攻关,敢于突破,大胆创新、反复测试,在不断地挫折和失败中汲取经验。

计划三至五年建成机器化学家大科学装置

一般,人们通过“望闻问切”就可以了解实验进展情况,比如奇怪的味道、不同的颜色,但机器人不能实时判断出这些变化。这也是江俊团队正在攻克的难题:用现代化手段赋予机器人物质级别的感知能力。

何谓物质级别感知能力?“简单来说,就是增强机器人摄像头‘本领’——既有红外视觉又有可见光视觉,使得机器人可以识别出颜色变化;此外,还可以加上光谱。科研人员根据光谱变化,进而了解实验中微观物质演化情况。”江俊解释。

对于未来,江俊希望他们可以建成一个机器化学家大科学装置:在一整栋大楼里,布置上百个机器人、上千个智能化学工作站。一边,全国的化学家、材料学家只需在网上提交自己的任务;另一边,团队成员通过智能操作系统分时安排机器人完成任务,最后将方案反馈给化学家们。

值得一提的是,基于这样一个大平台,不仅可以让各个课题组的实验数据交汇、共享,产生海量数据,实现自动提炼出数字化的知识图谱和人工智能的模型,进而指导机器人自动优化产生更好、更高效率的化学品或新材料。而且在完成各个实验过程中,机器人通过与科研人员互动,默默学习人类的操作逻辑、思维模式,可能在若干年之后,机器人有望变成一个真正智能、创造力比肩大学教授的机器化学家。

“我们希望争取到国家的支持,在2至3年内建成拥有几十台机器人的小型装置,3至5年后建成一个大科学装置。在这期间,我们还需要不断训练机器人和智能化学通用模型。”江俊规划着未来的研究蓝图。他们最终目标是改变传统化学研究范式,解放化学家双手。

近年来,各种交叉学科、各种新技术层出不穷,常常给人带来一种错觉,似乎各种知识都要抓紧学习。对此,结合自己的研究经历和体会,江俊建议青年学者首先保证“基础宽厚实”,其后要“涉猎广泛”。

“从开发机器化学家这套系统来看,我发现始终是底层的物理化学规则最重要。所以刚开始不要着急,先把本专业知识点学扎实、逻辑理清楚,然后适时地把其他专业内容嫁接过来。”因此,江俊认为青年学者既要开放式思维做交叉科学,但同时一定要保证精通自己的专业内容。此外,他建议,一定要多相信年轻人,让他们尝试有挑战的大课题。

版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
打印 发E-mail给:
相关新闻 相关论文
图片新闻
3颗火山玻璃珠证明月球1.2亿年前仍活着 实验室培养干细胞或成为癌症治疗突破点
大规模调查揭示万余种食物相关微生物 科学家揭示超铁元素核合成新机制
>>更多
一周新闻排行
编辑部推荐博文
Baidu
map