作者:红枫 来源:中国科学报 发布时间:2016/5/9 10:48:07
选择字号:
寻找计算机学界的“迈克尔·乔丹”
新搜索引擎可对研究人员影响力进行排名

 

美国伊利诺伊州芝加哥联合中心球馆外的篮球运动员迈克尔·乔丹的塑像   图片来源:Karl David/Flickr

去年秋天,美国华盛顿州西雅图市艾伦人工智能研究所通过启动一项叫作“语义学者”的服务,向谷歌学术、PubMed生物医学搜索引擎以及其他在线引擎发起挑战。该项目最初基于对计算机科学领域200万篇论文进行演练,其目的旨在提供一个由人工智能(AI)驱动的搜索引擎,在有限程度上对已发表文献的内容进行理解。随后其语料库已增加到400万篇论文。近日,该研究所给语义学者增加了一项具有同样雄心的新能力:检测一名科学家或科研机构在其相应研究领域的影响力。

这个工具当前仅聚焦计算机科学,但是今年秋季将会扩展到神经科学领域,然后进一步扩展到其他主题,它可以通过具体的影响因子对论文、作者以及机构进行排名。例如,该工具发现最具影响力的计算机科学位于坎布里奇市麻省理工大学。这并没有超出很多人的预料。但是最具影响力的科学家是谁呢?他是来自加州大学伯克利分校的Michael I. Jordan,一名其他领域的人并不熟悉的AI先驱。“他被称作机器学习领域的‘迈克尔·乔丹’。”艾伦研究所主任、创建“语义学者”的Oren Etzioni说。

如果外界人士认为语义学者的排名具有可信度,那么它的排名就可以被招聘和任期委员会采用。这是因为影响力是个难以衡量的东西。传统的老方法是计算引文。这样的计算排名法已经成为学术出版标准的基石,汤森路透、爱思唯尔以及其他出版社都在销售文献目录数据,让用户管理数据。

但是如果所有的引文在建立时都是不平等的,例如,作为整篇文章论文灵感的来源被引用与在研究方法部分进行简单提示完全不同。因此,粗糙的统计会导致对一名科学家的影响力状况产生误判。研究人员抱怨称,基于传统的标准助长了“不发表就死亡”的心态的产生,其形成的压力会让科研人员觉得越快出成果越好,而不考虑研究发现的重要性,只是希望增加引用量。

一些人说,当前所需要的是对一篇论文未来实际影响的更加直接的评价。因此,Etzioni的团队在“语义学者”上建造了一个新工具,可以用来创建“影响力图表”。其数据库中的大多数论文以PDF格式存在,这种格式容易让人阅读,但是对于计算机来说,却像一团松散的难以名状的文本。要让计算机像人一样阅读就需要机器学习,这种技术能够帮助计算机进行精确的推测。例如,它必须不仅能够发现论文的不同部分,如导语、方法以及结果,还能够分辨一篇论文被引用时的语气。因此,艾伦研究所的团队利用机器学习训练一个数据模型分辨所有这些特征。随后,这台计算机可以通过对比人类专家对一篇样本文章的评论,稳定地改善模型。

现在,这个系统仅能监测互相引用的论文的“直接影响”,Etzioni说,但是未来版本将需要说明引用其他论文的间接影响,等等。

这项新工具已于4月20日在语义学者网站亮相。怀俄明大学计算机学家Jeff Clune对其进行了试应用。Clune做的第一件事情是在影响力图表中查找他所在学校的情况。“这非常有趣。”他说,“我看到了哪些科学家对我的职业影响最大,我对哪些科学家的启发最多,他们和其他科学家之间也存在类似的关系。”

大多数结果和Clune的预想非常符合,他的导师影响了他,他影响了自己的研究生和博士后,但是也有一些出乎预料的地方。比如,他对一些人的名字并不熟悉,但是却有人受他的启发作了非常广泛的跟踪研究。

除了娱乐价值之外,Clune相信,这种工具在学界聘用和职位提升上均有价值。传统的制定这些决策的学术委员会受到很大压力,不仅是评估此前取得成功的候选人的压力,还有预测每位候选人未来影响力的压力。“语义学者”则尝试通过评价研究者和研究机构的“速度”以及“加速度”、其他人引用某篇研究的速度以及它是否是趋向性的,来揭示哪些研究是领域中的“热点”。

但是这一方面同时让Clune感到担心。从某种程度来说,“语义学者”就像一个“黑匣子”,Clune说,“人们知道那些数字来自哪里吗?”

Etzioni承认,这种算术公式形成研究结果时存在不透明性。“这是机器学习方面的交易取舍。”他说,“其中一件有益的事情是,当你在思考那些数字时,你能够看得见那些数字来源的案例。”

现在,Etzioni的研究团队正在顺着“语义学者”的方向,继续聚焦关于大脑的研究论文语料库。该工具及其对大脑研究者影响力排名将于今年11月12日在加州圣迭戈神经科学研究团队亮相。(红枫)

《中国科学报》 (2016-05-09 第3版 国际)
 
更多阅读
 
 
 打印  发E-mail给: 
    
 
以下评论只代表网友个人观点,不代表科学网观点。 
SSI ļʱ
相关新闻 相关论文

图片新闻
《自然》(20241121出版)一周论文导读 清华这位院士搭建了一座室外地质博物园
科学家完整构建火星空间太阳高能粒子能谱 “糖刹车”基因破除番茄产量与品质悖论
>>更多
 
一周新闻排行 一周新闻评论排行
 
编辑部推荐博文
 
论坛推荐

Baidu
map