在2024年诺贝尔物理学奖和化学奖接连颁发给人工智能(AI)领域科学家之后,科学家们开始认真审视AI对科学的进击和影响。
尤其是当诺贝尔化学奖将“AI蛋白质结构设计及预测”捧上神坛后,人们不淡定了:结构生物学家的饭碗是不是保不住了?甚至,在某知识问答社区,许多人尤其好奇和关切国内个别结构生物学家对今年诺贝尔化学奖结果的评价。
对于那些真正的一线科学家而言,这些似乎并不是一个重要的问题——至少做客《中国科学报》直播间的5位科学家持这种看法。他们中既有系统生物学家,也有AI领域的研究者和科学工作者,在他们看来,就AI今时今日的发展阶段而言,追问“AI的极限在哪里”可能还为时过早,但如果能够厘清“AI更擅长做什么事”“哪些是AI无法替代的”这些问题,无疑是当下更为重要的事。
因为,这些问题的答案将直接影响科学家工作的方式,以及他们在未来的科学叙事。
10月14日,5位嘉宾参与《中国科学报》直播活动。 毕菲鸿 制图
?
诺奖“出圈”?科学史上新的一页
相比诺贝尔物理学奖颁发给约翰·霍普菲尔德(John Hopfield)和杰弗里·欣顿(Geoffrey Hinton)这两位机器学习“大牛”给人们带来的惊讶,今年诺贝尔化学奖授予戴维·贝克(David Baker)、德米斯·哈萨比斯(Demis Hassabis)和约翰·江珀(John M. Jumper)显得更加众望所归。
原因无他,在贝克发明Rosetta算法和来自美国DeepMind公司的两位天才祭出AlphaFold之前,蛋白质折叠和结构预测的问题,都还是
领域遥不可及的目标。一些基础生物学家穷极一生,也仅能取得一点点进步。
“这是一个革命性的改变。”中国科学院系统生物学重点实验室主任、国家蛋白质科学研究(上海)设施主任吴家睿说,AlphaFold横空出世之后,人类精确预测蛋白质三维结构的手段已经从传统的实验技术进阶到用数据库和计算机软件的阶段。
众所周知,用于蛋白质结构发现的冷冻电子显微镜(cryo-EM)、核磁共振或 X 射线晶体学等实验技术背后,都离不开耗费巨大的硬件设备和人力投入,而这也在过去的数十年里成为“大机构大平台”的“大佬”们的专属。单个蛋白质分子结构的解析往往能够成为一篇顶刊上的论文,以至于很多
研究者单纯把“获得结构”本身作为目标。
但AI的闯入改变了这一切。用中南大学化学化工学院教授张翼的话说,AlphaFold2的诞生,让一些资金有限、缺少资源的“平民科学家”也有机会参与到
领域一些高水平的科研中。
2024年诺贝尔化学奖授予“AI蛋白质结构预测”漫画。 图源:瑞典皇家科学院
?
AI对科学研究的撼动,并不止于蛋白质结构预测领域。
就在与诺贝尔化学奖公布的近几天里,科学家们陆续报道了他们使用AI实现钙钛矿等多种纳米晶的智能制备、用AI发现5颗超短周期行星、发现16万种RNA“暗物质病毒”等等成果。AI对科学的“渗透”之深,已经超出了许多人的想象。
“现在人工智能,特别是机器学习,已成为物理、化学、生物等基础研究的重要工具,‘AI for Science’正在引起一场科研范式的大变革。”计算机专家、中国工程院院士李国杰在点评此次诺贝尔奖的“出圈”时写道:“这(指诺奖先后颁发给AI领域学者)不是物理学界和化学界的‘悲哀’,可能在科学史上翻开新一页。”
科研范式变革改变了什么?“问的问题”
问题是,AI for Science引领的科研范式变革,到底改变的是什么?
“它改变了你可以问的问题。”英国牛津大学蛋白质信息学实验室负责人、结构生物信息学教授夏洛特·迪恩言简意赅:“从事跨学科领域的科学工作者应该感到兴奋,因为人工智能不仅开始解决真正困难的问题,还改变了我们从事科学研究的方式。”
值得一提的是,夏洛特·迪恩正是DeepMind在2021年投稿在《自然》杂志上的论文的审稿人之一。她当年还担心有人“不能完全理解DeepMind的成就”,而今,AI带来的科研范式变革来势汹汹,她不必再困扰。
AI for Science(简写为AI4S),正是北京科学智能研究院院长、深势科技创始人兼首席科学家张林峰的“专业”。2020年,他和团队伙伴凭借深度深势算法DeePMD 获得高性能计算应用领域最高奖“戈登·贝尔奖”。此后他回国创业,致力于AI4S的落地。
在张林峰看来,科学家当下最聪明的做法,就是把AI擅长的部分交给AI。
AlphaFold就是现成的例子。“首先过去蛋白质结构预测这个领域的问题非常明确,其次数据的积累非常扎实——人类当时已经积累了接近20万个蛋白结构和接近20亿条蛋白序列。”张林峰告诉记者,越是清晰的建模需求,越是机器学习的“拿手菜”。
怎么找出科学问题中AI擅长的事情,其实有规律可循。张林峰告诉《中国科学报》,AI4S的研究有个共同点:从现实问题出发,将其转化为AI可以处理的数据输入,通过深度学习网络得到解决方案。他谈到,某种程度上,包括围棋机器人AlphaGo、AlphaFold这样的“AI+”研究,算得上AI4S“低垂的果实”。
“类似的研究还会有很多。”张林峰说,现阶段AI4S应用的广度,取决于现实问题是否能够有效抽象成AI可以学习和处理的形式,以及现实世界是否存在足够多的真实数据来训练深度学习网络。
除了摘取“低垂的果实”,AI还能帮助解决哪些科学难题?
“接下来AI可能涉猎的问题,可能是那些物理原理非常清楚,但过去由于我们表示复杂高维函数的能力有限,很难去充分挖掘利用已有物理规律的问题。”张林峰认为,随着AI更深层次地被用于科研活动的多个环节(如挖掘文献、求解复杂的物理方程、提升实验系统的智能化水平等),智能计算系统和智能实验系统有望进一步有效耦合。届时,科学发现也有望从“小作坊式”切换至“系统性发现”模式。
“AI4S也将进入一个类似‘ChatGPT时刻’的阶段。”张林峰畅想。
“AI4S也将进入一个类似‘ChatGPT时刻’的阶段。”张林峰对记者表示,接下来的重点是全力打造基于AI for Science的基础设施,为下一步赋能更多产业和领域建设具有全栈能力和开放生态的科研新范式体系。
对于AI在科学研究领域的作为,科学家们有太多的寄望。
李国杰提出,近几年科研范式正在发生的重大变化(他称之为AI for Research,智能化科研),主要动力来自“驾驭复杂性”。他认为,科学语言和科学方法适合处理精确问题,具有局限性和相对性;随着简单的物理学问题被解决,包含随机性和不确定性的复杂问题成为遗留难题,而AI“适合处理这种难以精确描述的问题”。
“物理、化学、生物学研究都要靠AI来应对指数爆炸。”李国杰谈道,考虑到人的大脑难以想象三维以上的东西,目前应对“维数灾难”只有两条出路,一是机器学习,二是复杂性科学。他还指出:“中国这两个领域的学者联系不多,今后应加强沟通合作。”
AI潜能无限?人机协作的主导者是人
尽管图景诱人,但目前AI的局限也真实存在。
“绝大多数学者都承认,智能不是一个有与无的问题,而是一个程度的问题。”美国天普大学计算机与
系副教授王培对《中国科学报》表示,当前AI领域最火的是机器学习,机器学习非常有效地总结了人类迄今为止的经验,但它“成也统计学习、败也统计学习”。
“统计学习本身有其局限性,比如它要求对数据有统一、稳定性的假设。而这个‘假设’并非在所有领域都可接受,比如有的领域本身就环境变化很快,数据很快会失效。”王培认为,就模型本身理论而言,所有超出基本预设的东西,都会变成模型的局限性——即便创造这些基础大模型的公司此后还会迭代出更强的版本,“但这个基本约束甩不掉”。
浙江大学人工智能研究所所长、求是特聘教授吴飞认为,当前以深度学习为代表的AI主要是在模仿人脑,但现阶段人们对大脑的理解还只是“管中窥豹”。AI今天所遇到的“天花板”,也在于人们还没有解开人类大脑的终极秘密。
“如果要让AI代替人类完成大多数任务,那就必须要对人类如何完成这些任务的机制机理或可计算的模型进行精确的描述。”吴飞引用北京大学人工智能研究院院长朱松纯的观点说道:“人脑是小数据、大任务,并非依赖于海量数据;相反地,AI虽掌握了海量数据,却不能举一反三或者解决逻辑推理的问题,更不用说涌现灵感、情感。”
这也提醒着人们,在簇拥着AI进入物理、化学、生物等学科之际,科学家们不应忽视的一点是,AI可不是万能的,在人机协作的科研工作中,主导者应是科学家自己。
“人+机器能起到的效果,是1+1远远大于1,但大家不能过高估计AI的贡献,低估人的作用。”北京邮电大学人工智能学院人机交互与认知工程实验室主任、研究员刘伟说,他坚持认为现阶段的“人机协同”中,占主导地位的是人,而非AI。
他对《中国科学报》表示,当前人们多多少少有些对AI期待过高,忽视了它其实仍处于初级发展阶段的事实。比如,OpenAI创始人兼CEO萨姆·阿尔特曼曾提出,OpenAI的产品要经历5个发展阶段:交互、推理、调用、创新、组织。但现在,它们卡在了“推理”阶段。
“原因是什么?丁肇中先生曾说过,人类掌握的物理知识才10%不到,人们对90%以上的物理还不了解其基本机理,机器的推理也就卡在了这里。”刘伟说,排在推理后面的调用、创新、组织等能力,AI跟人的差距还很大。
在吴飞看来,目前来看,靠数据、知识、与环境的交互,AI都无法实现对人类智能活动的模拟。唯有向
、心理学、复杂系统的优化学习,AI才有可能解开人类智能的终极奥秘。
“而在这个奥秘没有揭示之前,我们要善于利用人工智能工具,把人类智能和机器智能都发挥到极致,去破解我们人类自身或者机器单独所不能完成的任务。”吴飞说。
至于AI的未来,李国杰很乐观:“人工智能的突飞猛进,预示人类已经处在进入智能时代的前夜。目前的技术离实现真正的通用人工智能还有一定距离,再经过10~20年的努力,大概率会出现基于重大科学突破的基础发明,为人类进入智能时代打下坚实的基础。”
悄然发生的变化
最近,2021年诺贝尔化学奖获得者、德国马克斯·普朗克煤炭研究所教授本杰明·李斯特(Benjamin List)来中国参加学术活动,并受聘为武汉大学名誉教授。他在接受《中国科学报》记者采访时发表的关于AI for Science的观点,具有一定的代表性。
“实话实说,AI将对我研究的化学表面和催化领域产生多大的影响,我目前还不知道。但直觉告诉我,影响可能很大。”但他话锋一转:“即便人工智能可能做很多事情,我们也不应该放弃自身的创造力。”
李斯特以自身为例说道:“我现在处于职业生涯的中期,我相信自己的智慧和创造力,我更喜欢凭借它们得出判断,而不是依靠那些由计算机得出的结果。如果计算机向我展示了一些我自己想不到的东西,我会很兴奋,然后接着发挥我的智慧和创造力去做其他更深入的事情。”
基础生物学家、中国科学院院士颜宁说过类似的话。她将AlphaFold、冷冻电镜革命等技术进步视为“将结构生物学家从技术挣扎中解放出来”的契机,并认为这些工具能力的提升,将使结构生物学家能够更专注于结构带来的生物学发现本身。
“生命是地球上最神奇的存在,有那么多未知要探索,任何一次技术进步都是契机。”颜宁说:“该考虑的是如何把新技术为我所用,去问出、去探索更有意思的问题。”
李斯特、颜宁等人所说的话都没有任何问题——先进工具解放双手和大脑,去做更具创造力的事情,这是人类文明进阶所一以贯之的。但AI给科学家们带来的一些影响和改变,有时是在悄然间发生的。
比如学科专业之间壁垒,或许正因为AI的介入而逐渐消弭。
李国杰注意到,近百年来,学科越分越细。但他在看了杰弗里·欣顿获奖后的发言后有些感慨。
欣顿在获奖后的受访中说:“我觉得我是一个不知道自己在哪个研究领域的人,但想弄清楚大脑工作原理,然后在研究中协助发明了一项效果惊人的技术。”
“欣顿不经意的回答透露了获得重大科学突破的奥秘:不要在自己头上戴上哪个学科的‘帽子’,要做不知道属于哪个领域的交叉科学研究。”李国杰有感而发,这次“诺奖风波”后,许多学者对长期以来禁锢我们思维的学科和专业“茧房”,可能会有全新的思考,更加重视跨学科的研究。
AI还将与科学探索有什么样的互动?没人能说得清。唯一能确定的是,AlphaFold绝不会是最后一个震撼科学领域的AI工具,更多的AI工具会继续涌现,而最棒的科学家与这些工具配合,将会做出什么样的创举,值得更多期待。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。