通用人工智能(AGI)是一个门槛极高的领域,有极大的商业空间和生态需求,目前各个大模型团队都在争取“入场券”,行业竞争无比激烈。“就目前AGI的布局来看,创新的高地在企业端,高校的地位非常有限。未来,实现从跟跑到领跑,高校必须主动出击,发挥大学应有的价值。”昨天,在上海交通大学人工智能未来科技对话会上,中国科学院院士鄂维南的发言引发不少与会者共鸣。
高校若要引领下一代AGI的发展,需要解决哪些瓶颈?发力点在哪里?又该如何更好地输出AI人才与技术?
展望下一代AGI,数据库技术很关键
在鄂维南看来,百万卡规模的算力资源、多模态的数据资源、AI数据库能力,以及新模型框架、算法和工程能力,都是发展下一代AGI所需的基础。而当前,不少人对发展AGI仍存在认知误区,尤其是对高质量数据的重要性认识不足。“现在,很多企业和高校都将主要力量投放到对大模型的研究上。实际上,相比大模型,如何建立高效的数据处理系统,才是更紧迫的任务。”
鄂维南举例说,很多人其实已经意识到高性能芯片的重要性。“但有一点可能出乎意料:从技术角度而言,芯片的性能指标容易刻画,反而是数据的质量难以刻画。”无论是做科研,还是医疗行业或金融行业,各行各业都离不开数据分析和处理。可以说,数据库技术才是发展下一代AGI的关键之一。
具体来说,数据的搜集、清洗、评估、抽取和其他预处理,都离不开强大的AI数据库。“只有建立强大的数据库,才能在大模型训练和维护过程中,及时做到‘缺什么补什么’。”鄂维南介绍,目前,国内外已有企业开始关注AI数据库,并开启新一轮竞速。比如,国际上首个AI数据库MyScale,其开发公司正是墨奇科技,而企业的创始人、CEO邰骋以及CTO汤林鹏,都是上海交通大学的毕业生。“这也是目前我心目中综合性能最好、功能最强的AI数据库。”鄂维南介绍,MyScale能够同时支持海量向量和结构化数据,包括字符串、JSON、空间、时序等多种数据类型的高效存储和查询,其数据密度、查询效率是国内外其他系统的4至10倍。
智力+算力,校企携手共同破圈
会上,有专家谈到,发展通用人工智能有两大要素,一是智力资源,二是算力资源。前者主要集中在高校,后者集中在企业。目前,我国发展AGI的主要困境在于:两种资源没有很好地对接起来。“虽然有些团队通过发挥其工程能力和算力资源,占据了一定的先发优势,但从长远角度看,这是不可持续的,因为行业的门槛在不断提高。”鄂维南强调,高校想要占据下一轮AI高地,必须加强有组织科研,同时,要携手企业做好资源整合与对接。
“根据《自然》杂志的一篇研究文章,如今,科学突破性创新速度在变慢。”清华大学惠妍讲席教授周伯文补充道,科学研究中信息茧房的形成、茧房内信息过载以及茧房间壁垒太高都是背后原因。因此,不仅科研的组织方式需要改进,科研工作者也必须与时俱进,主动破圈。
对此,上海交通大学校长、中国科学院院士丁奎岭同样深有感触。根据学校的调研,上海交大目前已有超过20%的教师和科研人员,即将近750人,在从事和人工智能相关的研究工作。
谈及昨天新成立的上海交大人工智能学院,丁奎岭介绍,学院未来将通过大力汇聚人才、紧密链接人才开展有组织科研,提升“参数量”;通过直面真问题、服务真场景,积极响应学科、行业、社会经济发展需求,提升“数据量”;通过汇聚八方资源,做好算力支撑,提升“计算量”。
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。