|
|
ChemGPT 2.0大模型及具身智能机器人化学家发布 |
|
11月11日,在华东师范大学化学学科建设与学科交叉发展论坛上,化学领域大模型ChemGPT 2.0正式发布,同期发布的还有以具身智能机器人化学家“华24”为核心的自动化化学合成平台。
ChemGPT 2.0的研发团队以化学基础词汇为起点,构建了一张庞大的知识图谱,累积了超过1000万条高质量指令数据,100多万条高质量对话数据集。同时,团队利用来自pistachio 2024版数据库的反应数据,经过精心筛选和去重,建立了378万条用于模型微调训练的高质量逆合成数据。
值得一提的是,研究团队分析了ChemGPT 1.0版本上线后积累的用户问答信息,进一步重塑任务分流模型,实现了对多个子模块的精准匹配与调用。
作为基础模型,ChemGPT 2.0模型参数量升级至720亿。研发团队负责人,华东师范大学化学与分子工程学院教授何晓介绍:“ChemGPT 2.0在多领域展现出强大的潜力,在化学问答、专业推理、逆合成预测等场景表现出色,且在C-Eval评估套件中,针对初中、高中以及大学化学的学科能力测试中全面领先GPT4。”
在逆合成预测方面,ChemGPT 2.0在基准数据集上表现更加出色,还能更精准地预测复杂3D结构分子的反应物。
何晓。
在发布会现场,何晓还演示了以具身智能机器人化学家-“华24”为核心的自动化化学合成平台。该平台构建并优化了自动化合成反应的整体流程,以微流控芯片为基础,节省时间达80%。
“华24”已经实现了端到端的农药分子全连续自动合成,并通过训练多模态具身机器人,系统掌握了370余条动作,实现了化学实验基本操作的自动化。
何晓表示,该系统将帮助人类化学家专注于提出科学问题,而具身智能则将胜任实验执行、预测、分析及反馈,开启人机协作的化学研究新模式,让化学研究的全过程更为高效。
具身智能机器人化学家做实验。图片由华东师范大学提供
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。