■本报记者 赵广立 通讯员 孙中婵
“大模型不是万能的,不能过度神化它。”
这句话,《中国科学报》记者今年在不同场合听到多次。最近一次,是在中国计算学会太原分部主办的“大模型赋能文物古建保护与传承论坛”上。
自2022年底大语言模型产品ChatGPT问世以来,世界仿佛一下子“觉醒”到大模型时代——不仅各“大厂”都在奋力发展大模型,国内各大高校院所、企业也纷纷加入,至2024年5月底,国内已发布300多个大模型产品。
然而,大模型至今仍未实现它的“超级应用”。相比国内数以十亿计的移动互联网用户数量,大模型产品的日活用户数至多只有百万量级。如此之低的渗透率,不免让人对“大模型不是万能的”这句话更有共鸣。
赋能古建保护?大模型还差点火候
地上文物看山西。山西古建筑资源丰厚,价值极高。数据显示,山西全省目前保存的古建筑有28027座,数量居全国之首;其中遗存最少、价值最高的唐代到金代的木结构建筑,山西拥有120多座,占全国80%以上。由于文物古建不可替代、不可复制、不可再生,科学保护文物古建成为重要课题。
如何利用大模型技术为山西文物古建资源提供更为精准、高效的保护与传承方案?在“大模型赋能文物古建保护与传承论坛”上,专家就此展开了探讨。
事实上,珠玉在前。在“2024中国·AI盛典”上,山西省永乐宫壁画保护研究院院长席九龙等人就分享了利用生成式人工智能技术修复永乐宫壁画《朝元图》的故事,用人工智能之笔重现了800年前的中国色彩。不过,在文物古建的保护命题上,一些文物专家对数智化技术的应用仍持观望态度。
太原市文物保护研究院科技信息部副主任韩宏斌谈到,目前文物界对于数字化手段能否真正还原文物原貌存在较大争议。“以晋祠为例,用增强现实(AR)等技术修复后的壁画,虽然轮廓复原了,但是色彩的沉稳度、笔触的生动性没有得到展现。”
而具体到文物古建保护,目前大模型的应用似乎更加有限。韩宏斌介绍说,游客呼出的气体、温度湿度、大气变化、微生物等因素都会造成建筑本体的破坏。如何利用智能化技术对相关问题进行预测,以及如何抓取利用相关数据实施可行性保护,仍是难题。
论坛上多位专家也谈到,文物保护涉及生物、化学、物理等多个学科领域,仅靠大模型“赋能文物保护”有些勉为其难。山西大学自动化与软件学院副院长郭威认为,目前文物古建筑领域的数据量级有限、案例有待丰富,倒不如先在文化传承领域下功夫,例如用AR技术等数字化手段进行场景化研学、沉浸式游览。
哈尔滨工业大学计算机科学与技术学院教授冯骁骋谈到,文物古建的修复不一定需要大模型技术。例如,基于物联网技术的“古建筑健康智能监测系统”可以对古建筑进行健康监测和预警保护;基于三维激光扫描技术的无损检测能够对古建筑文物内部结构以及损伤程度进行检测,为修复工作提供精准的数据支撑等。
大模型发展仍在初级阶段
一位要求匿名的行业专家告诉《中国科学报》,大模型在古建保护领域“吃瘪”并不是个别现象。现阶段大模型发展虽然十分迅猛,但仍处于初级阶段,规模化落地尚待进一步探索。
北京智源人工智能研究院大模型行业应用总监周华认为,目前大模型在原理上还存在一定的“幻觉”,这导致大模型在规模落地方面存在着类似“最后一公里”的问题。
“许多人工智能企业或厂商在通用模型方面做得相当不错,能够通过考试并获得高分,但当涉及特定行业的应用,尤其是那些需要深度知识和高准确性、可靠性的应用时,行业大模型还有很大的探索和发展空间。”周华说,现阶段大模型主要在一些容错性较高的领域落地,如在智能客服、文档处理等方面能够发挥更多辅助作用。
大模型作为人工智能领域的关键工具,其层级构建逻辑是通用大模型居底层,具备广泛适用性但专业深度有限;行业大模型在通用大模型之上,针对特定领域深化专业性;垂直大模型则进一步聚焦于行业内的细分领域,强化专业服务能力。
腾讯研究院大模型研究课题组的报告显示,影响行业应用大模型速度的两个关键因素是数据可得性和需求适配度。高质量数据越容易获取,行业模型应用进展越顺利;同时,行业核心业务与大模型创意生成和交互能力越匹配,应用落地进展越快。
该报告进一步举例说明:互联网、数字游戏等数字原生行业,由于数字化程度高、数据积累丰富、技术接受能力强,容易成为大模型落地较快的行业;而文物古建领域由于线下生产流程的复杂性和高度的专业化,尚处于局部试点探索阶段。
“智能体”应用值得关注
今年初,文生视频大模型Sora的出现,一度让影视行业人士高呼“狼来了”。然而,今年的暑期档,由影视明星成龙主演、大量使用了生成式人工智能和数字人技术的电影《传说》登陆大银幕,却遭遇了票房与口碑的双失利。
“对于影视行业来说,人工智能是一个工具,它替代的是原本拍摄过程中工程量很大的那一部分‘技术活’,并不是完全替代人,因为人工智能也会出错。而给人工智能改错这件事,还得人干。”南京大学副校长、人工智能学院教授周志华呼吁,大家不要过于恐惧人工智能,更不要认为它是“万能”的。
“人工智能永远只是辅助工具。要实现‘人工智能制作不出错’这一目标,在现行的技术路线下,是看不到解决方案的。”周志华补充说,“这也是前沿的研究问题。”
一般而言,大模型之于人工智能,犹如操作系统之于智能手机,虽至关重要却常隐于幕后,需通过开发类似于应用程序的各类智能体以解决具体问题,如预订住宿、出行安排或路线导航等。今年的巴黎奥运会上,上海体育大学就与百度合作开发了体育大模型及对应的智能体,通过提供体育文献、动作识别与技战术分析等,助力跳水、游泳、田径等多支国家队的日常训练和备战工作。
百度创始人、董事长李彦宏曾在公开场合谈到,未来医疗、金融、教育、制造、交通、农业等领域都会依据各自的场景和特有的经验、规则、数据等,涌现出各种各样的智能体,数量或以百万计,因此,“智能体是我们最看好的人工智能应用的发展方向”。
“比起通用大模型,智能体的开发成本要低得多——人们只需调用已有大模型的API(应用程序编程接口),再利用一些专用的数据进行训练,就可以得到一个智能体。”前述匿名专家告诉记者,人们对个性化、专业化人工智能智能体的需求更大,因此结合特定需求开发的人工智能智能体也更容易找到场景并完成变现。他认为,随着更多资源从大模型转向人工智能智能体,整个人工智能行业有望从现在的泡沫性繁荣走向更为稳健的成长。
《中国科学报》 (2024-08-26 第3版 综合)