作者:赵广立 来源:中国科学报 发布时间:2020/8/25 16:40:16
选择字号:
百度大脑语言与知识技术峰会举行
10年积累、11项发布,百度语言与知识技术剑指产业化

 

自然语言理解(NLP)素有“人工智能皇冠上的明珠”之誉,语言与知识等认知层面的技术突破将进一步促进AI深入发展。8月25日,以“掌握知识、理解语言、拥有智能”为主题的百度大脑语言与知识技术峰会在线举行。在主旨演讲中,百度CTO王海峰首次发布了百度大脑语言与知识产品全景图,涵盖11项语言与知识技术新品,剑指产业智能化。

“在百度语言与知识技术的布局和发展中,我们始终在注意把握两个趋势,即技术发展趋势和产业发展趋势。”王海峰表示,百度语言与知识技术的发展历程,从研究方法、研究对象、研究方向、产业应用等层面,始终与应用的发展趋势、需求一脉相承,与产业接轨。

百度CTO王海峰.jpg

百度CTO王海峰在现场发布百度大脑与知识技术新品

据了解,百度大脑语言与知识技术历经10年发展可观,曾获得包括国家科技进步奖在内的20多个奖项,30多项国际竞赛冠军,发表学术论文超过300篇,申请专利2000多项。同时,百度还打造了业界最大规模的知识图谱,拥有超过50亿实体和5500亿事实,每天在各行各业的应用中被调用次数超过400亿次;去年3月,百度推出知识增强的语义理解框架ERNIE,曾一举登顶全球权威数据集GLUE榜单。

会上,百度集团副总裁吴甜发布了语义理解技术与平台“文心”(基于深度学习平台“飞桨”打造)、智能文档分析平台TextMind和AI同传会议解决方案3款新品,同时发布了6项升级,包括智能创作平台的3个场景方案以及智能对话定制与服务平台UNIT的3项升级。

数据匮乏、算力难济是语言与知识技术研发中面临的瓶颈。为突破瓶颈,百度联合中国计算机学会、中国中文信息学会发起中文自然语言处理数据共建计划“千言”,希图解决数据稀缺问题。据介绍,“千言”一期由来自国内11家高校和企业的数据资源研发者共同建设,已涵盖开放域对话、阅读理解等7大任务,20余个中文开源数据集。

“我们希望有更多的数据集作者能够参与共建‘千言’,共同推动中文信息处理技术的进步,建设世界范围的中文信息处理影响力。”百度技术委员会主席吴华表示:“我们计划在未来3年,面向20多个任务,收集和建设不少于100个中文自然语言处理数据集,覆盖语言与知识技术全部领域。”

吴华还发布了百度“语言与知识技术算力共享计划”,通过百度AI STUDIO平台提供算力支持,让广大开发者破除算力桎梏,专注于技术创新。

 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
这场赛事探索自动驾驶的“最后一公里” 首张另一星系中的恒星照片出炉
《自然》(20241121出版)一周论文导读 清华这位院士搭建了一座室外地质博物园
>>更多
 
一周新闻排行 一周新闻评论排行
 
编辑部推荐博文
 
Baidu
map