“大模型不是万能的”—新闻

作者：赵广立,孙中婵来源：中国科学报发布时间：2024/8/20 14:35:38

选择字号：小中大

“大模型不是万能的”

“大模型不是万能的，不能过度神话它。”

这句话，《中国科学报》记者今年在不同场合听到多次。最近一次，是在“CCF太原大模型赋能文物古建保护与传承论坛”上。

自2022年底OpenAI推出大语言模型产品ChatGPT以来，世界仿佛一下子“觉醒”到大模型时代——不仅各“大厂”都在奋力发展大模型，喊出了“所有软件、应用都值得被大模型重构/重做一遍”的强音；国内各大高校院所、企业也纷纷加入，迄今（统计至2024年5月末）已发布300多个大模型产品。

然而，大模型至今仍未找到它的“超级应用”。相比国内数以十亿计的移动互联网用户数量，大模型产品的日活用户数至多只有百万量级。如此之低的渗透率，不免让人对“大模型不是万能的”这句话更有共鸣。

赋能古建保护？大模型还差点火候

地上文物看山西。山西古建筑资源丰厚，价值极高。数据显示，山西全省目前保存的古建筑有28027座，数量居全国之首；其中遗存最少、价值最高的唐代到金代的木结构建筑，山西拥有120多座，占全国80%以上。由于文物古建不可替代、不可复制、不可再生，科学保护文物古建成为重要课题。

于是，便有了这场研讨会，由中国计算学会太原分部（CCF太原）主办的“大模型赋能文物古建保护与传承论坛”。专家们聚首，探讨如何利用大模型技术为山西省丰富的文物古建资源提供更为精准、高效的保护与传承方案。

事实上，利用人工智能（AI）技术科学地保护古建筑的工作珠玉在前。在“2024中国·AI盛典”上，山西省永乐宫壁画保护研究院院长席九龙等人就分享了利用生成式AI技术修复永乐宫壁画《朝元图》的故事，用AI之笔重现了800年前的中国色彩。不过，在古建文物的保护命题上，一些文物专家对数智化技术的应用仍持观望态度。

太原市文物保护研究院科技信息部副主任韩宏斌谈到，目前文物界对于数字化手段是否可以真正还原文物原貌存在较大争议。“以晋祠为例，用增强现实（AR）等技术修复后的壁画，复原了轮廓，但是色彩的沉稳度、笔触的生动性没有展现。”

而具体到文物古建保护中，大模型所能做的事情似乎更加有限。韩宏斌介绍说，游客呼出的气体、地理地形造成的温度湿度、大气变化、微生物等因素都会造成建筑本体的破坏，尤其是壁画的保护存在较大难度，如何利用智能化技术对病灶进行预测，以及如何抓取利用相关数据、实施可行性保护仍是目前的难题所在。

论坛上多位专家也谈到，文物保护涉及生物、化学、物理等多个学科领域，仅靠大模型“赋能文物保护”有些勉为其难。山西大学自动化与软件学院副院长郭威认为，这受限于目前文物古建筑领域的数据量级及案例有待丰富，反倒是可以尝试先在文化传承领域下功夫，例如用AR技术等数字化手段进行场景化研学、沉浸式游览。

哈尔滨工业大学计算机科学与技术学院副院长、教授冯骁骋谈到，文物古建的修复不一定需要大模型技术。例如，基于物联网技术的“古建筑健康智能监测系统”可以对古建筑进行健康监测和预警保护；基于三维激光扫描技术的无损检测能够对古建筑文物内部结构以及损伤程度进行检测，为修复工作的开展提供更精准的数据支撑等等。

大模型发展仍在初级阶段

一位要求匿名的行业专家告诉《中国科学报》，大模型在古建保护领域“吃瘪”并不是个别现象，现阶段大模型发展虽然十分迅猛，但仍处于初级阶段，规模化落地尚待进一步探索。

个中原因，智源研究院大模型行业应用总监周华认为，目前大模型在原理上还存在一定的“幻觉”，这导致大模型在规模落地方面存在着类似“最后一公里”的问题。

“许多人工智能企业或厂商在通用模型方面做得相当不错，能够通过考试并获得高分，但当涉及到特定行业的应用，尤其是那些需要深度知识和高准确性、可靠性的应用时，行业大模型就还有很大的探索和发展空间。”周华说，现阶段大模型主要落地在一些容错性较高的领域，如在智能客服、文档处理等方面能够发挥更多辅助作用。

大模型作为人工智能领域的关键工具，其层级构建逻辑如下：通用大模型居底层，具备广泛适用性但专业深度有限；行业大模型在通用大模型之上，针对特定领域深化专业性；垂直大模型则进一步聚焦于行业内的细分领域，强化专业服务能力。

是以，国内大模型厂商纷纷转向行业应用，进军“行业大模型”“垂直大模型”。不过，行业/垂直大模型要大展身手，也受限于行业数据和知识共享等因素。

腾讯研究院大模型研究课题组一项研究报告提出，影响行业应用大模型速度的两个关键因素是数据可得性和需求适配度。其解释称，高质量数据越容易获取，行业模型应用进展越顺利；同时，行业核心业务与大模型创意生成和交互能力越匹配，应用落地进展越快。

该报告进一步举例：互联网、数字游戏等数字原生行业，由于数字化程度高、数据积累丰富、技术接受能力强，容易成为大模型落地较快的行业；而文物古建领域由于线下生产流程的复杂性和高度的专业化，尚处于局部试点探索阶段。

“智能体”应用值得关注

今年初，文生视频大模型Sora的出现，一度让影视行业人士高呼“狼来了”。然而，今年的暑期档，影视巨星成龙主演、大量使用了生成式人工智能和数字人技术的电影《传说》登陆大荧幕，却遭遇了票房与口碑的双失利。

“AI对于影视行业来说，其实还是一个工具，它所替代的是原本拍摄过程中工程量很大的那一部分‘技术活’，并不是完全地替代人，因为AI也会出错。而给AI改错这件事，还是得人干。”南京大学副校长、人工智能学院教授周志华呼吁，大家对AI不能过于恐惧，更不要认为它是“万能的”。

“AI永远只是个辅助工具。要实现‘AI制作不出错’这一目标，在现行的技术路线下还是看不到解决方案的。”周志华补充说：“这也是我们前沿的研究问题。”

一般而言，大模型之于人工智能，犹如操作系统之于智能手机，虽至关重要却常隐于幕后，需通过开发各类“智能体”（类似于应用程序）以解决具体问题，诸如预订住宿、出行安排或路线导航等。今年的巴黎奥运会上，上海体育大学就与百度合作开发了体育大模型及对应的智能体，通过提供体育文献、动作识别与技战术分析等，助力跳水、游泳、田径等多支国家队的日常训练和备战工作。

“制作一个智能体通常不需要编码，比互联网时代制作一个网页还要简单。”百度创始人、董事长李彦宏曾在公开场合谈到，未来医疗、金融、教育、制造、交通、农业等领域都会依据各自的场景和特有的经验、规则、数据等，涌现出各种各样的智能体，数量级或将以百万计。因此他也表示，“智能体是我们最看好的AI应用的发展方向”。

“比起通用大模型，AI智能体的开发成本则要低得多——人们只需调用已有大模型的API，再利用一些专用的数据进行训练，就可以得到一个AI智能体。”前述匿名人士告诉记者，人们对个性化、专业化AI智能体的需求更大，因此结合特定需求开发的AI智能体也很容易找到场景并完成变现。他认为，随着更多的资源从大模型转向AI智能体，整个AI行业将有望从现在的泡沫性繁荣走向更为稳健的成长。

编辑部推荐博文
科学网博主姬扬最新译作！揭开半导体奥秘｜赠书 “你的生活取决于你的选择” 必备的五样医疗小器械发现胡先骕：一位科学巨匠的多样人生探秘神农架：香溪源里的蝴蝶奇遇我们不知道答案的125个科学问题(97)生命之树更多>>