作者:赵广立 来源:中国科学报 发布时间:2022/11/4 22:35:50
选择字号:
这个实验室一年内三次摘得常识推理赛事桂冠

 

近日,认知智能国家重点实验室与哈工大联合团队夺得常识推理挑战赛QASC榜首,以多模型准确率93.48%、单模型准确率92.07%的成绩创造榜单最好成绩,超越了第二名谷歌团队90.65%的纪录。

QASC(Question Answering via Sentence Composition)是由艾伦人工智能研究所(AI2)推出的常识推理阅读理解任务,旨在评估机器对常识的理解和应用能力。该挑战赛吸引了谷歌、亚利桑那大学、中山大学等研究机构和知名高校的参与。

值得一提的是,这是认知智能国家重点实验室本年度第三次在常识推理挑战赛事中摘得冠军。今年4月,认知智能国家重点实验室在CommonsenseQA 2.0常识推理挑战赛中,提出融合知识的深度神经网络ACROSS模型,以76.06%的成绩获得第一;7月,认知智能全国重点实验室在科学常识推理挑战赛OpenBookQA上,以准确率94.2%的优势夺冠,常识推理单模型首超人类平均水平,使得机器能够进一步“融会贯通”。

对于常识问答系统来说,模型首先要能从千万量级的海量的知识库中准确检索到相关的知识;同时,模型要能正确地将两条知识进行结合,建立两条常识之间的关系,才能与问题相匹配,最终得到正确选项。由此可见,想要提高回答准确率,出色的常识检索、常识运用的能力是必不可少的条件。

在人工智能技术从感知智能迈向认知智能的攻坚阶段,常识推理是重要一环。据了解,认知智能国家重点实验室本次夺得QASC榜首,是由团队对前述OpenBookQA比赛中夺冠系统X-Reasoner改造升级,推出X-Reasoner++,实现知识检索和运用能力全面提升的结果。

    

 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
这场赛事探索自动驾驶的“最后一公里” 首张另一星系中的恒星照片出炉
《自然》(20241121出版)一周论文导读 清华这位院士搭建了一座室外地质博物园
>>更多
 
一周新闻排行
 
编辑部推荐博文
 
Baidu
map