在学术界,论文被引次数和h指数是评价科研人员学术影响力的重要指标。然而,这些指标真的能够做到公正、客观吗?
最近,美国西北大学的博士生Reese Richardson和英国剑桥大学的研究员Nick Wise就借一场黑色幽默实验给出了答案——仅凭几篇由“自动生成器”胡乱生成的论文,他们便让一只名为Larry的宠物猫在谷歌学术上有了自己的账号,成为“世界上被引最高的猫”。
一只猫是如何成为学者的。
揭丑“论文工厂”
在制造这场“人冠猫戴”的恶作剧之前,Reese和Nick看到了一则“论文工厂”广告。
该广告发布于6月28日,它声称,可以帮助客户增加在谷歌学术中的论文被引次数和h指数。两位学者围绕这则玄乎的广告展开了调查。
广告称:“我们可以帮您大量增加被引次数。”
首先,该广告附带有一些“成功”的案例。案例显示,客户谷歌学术主页上的被引次数显著增加。
其次,他们发现,在18位“论文工厂”的老客户中,有11位的谷歌学术档案仍处于活跃状态,还能对其进行访问。除2位客户外,几乎所有客户都隶属于印度的大学。
经“论文工厂”操作后,某客户的被引次数翻了两番,h指数翻了一番。
那么,“论文工厂”具体是如何操纵这些指标的呢?Reese和Nick进一步调查发现,有些客户的大量被引来自同一可疑期刊上的数十篇论文,这些论文结尾的参考文献列表包含了很多压根没有在正文中被引用的文献,这些被凭空硬塞进来的“参考文献”自然就是客户的论文。
还有更加明目张胆的方式——竟然有几十篇以毕达哥拉斯(古希腊数学家)、伽利略(意大利天文学家)、泰勒(英国数学家)和柯尔莫哥洛夫(苏联数学家)这些已经去世的名人为作者的数学论文。
这些论文未发表在任何期刊或预印本服务器上,只是作为PDF文件上传到学术社交网站ResearchGate。它们由免费程序Mathgen随机生成,乍看起来专业,但大部分内容都是胡言乱语。造假者还“贴心”地对论文摘要进行了修改,让摘要包含与标题相关的文字。
2. 用Mathgen自动生成几篇无意义的论文(并将标题和摘要改为更符合引文语境的内容);
4. 将无意义论文上传到ResearchGate;
6. 祝贺客户的“学术影响力”提高(同时还要“毁尸灭迹”,从ResearchGate上删除无意义论文,但客户的相关指标不会降低);
这些步骤无需成本,工作量小,而且可以无限扩展。Nick表示,用这种方法,任何人都可以成为世界上被引次数最多的人,甚至动物也可以。
他们为Reese父母的宠物猫“Larry”设计了一个直白却颇具学者气质的人名“Larry Richardson”,并将猫咪同Reese父亲的一张亲密合影上传ResearchGate作为它的头像,供职机构填写为Reese所在的美国西北大学。
“猫学者”Larry的头像:与Reese父亲的合影。
随后,Reese便借助Mathgen,为“猫学者”Larry生成了12篇学术论文,Larry皆为唯一作者。此外,又生成了12篇并非出自Larry的论文,通过编辑修改,在参考文献中把Larry所著的12篇论文全部罗列出来。如此一来,Larry就能一次性获得144次被引用量,h指数可达到12。
那么,整个过程都没有引起相关责任方的警觉并加以阻拦吗?有,但确实不多。
Reese在ResearchGate上传Larry的相关资料时,被要求以学术邮箱创建个人档案,这样能够免于填写那些烦人的验证步骤。按理说,Larry到这一步就该束手无措了。毕竟,这只小猫在西北大学连一个真正的工位都没有,哪来的学术邮箱?
戏谑的事情出现了。带有“northwestern.edu”后缀的电子邮件地址其实不难获得,甚至可以在网上自行购买到。为证明这一说法,Reese在博文中甚至贴心地附上了相关新闻报道。
用学术邮箱填写好个人资料后,Larry还需要上传自己撰写的论文。但这对一只猫背后的Reese而言更简单,他只需要动动手指,在研究项目填写栏下方点击“添加更多作者”按钮,再手动输入“Larry Richardson”即可。
至此,ResearchGate账户就被建好了,Reese和Nick只需静待谷歌学术上的数据更新。
两个星期后,Larry和Reese父亲的脸出现在谷歌学术档案上,其中赫然列出Larry的显著工作,并指出“这位学者的被引次数达到132次,h指数为11”。
由于一些未知原因,最后显示的被引用量和h指数并没有Reese他们预想的那么好。但Larry依然成为了世界上被引次数最多的“猫学者”,一举“变身”为历史上最具贡献的猫科知识分子。
Reese是西北大学阿马拉尔实验室(Amaral Lab)的一名博士研究生,专业方向为跨学科生物科学。值得一提的是,Reese拥有物理学和应用数学两个学士学位,博士研究领域为计算生物学,是北美旗帜学协会的正式成员,还曾在芝加哥公共卫生局从事超过2年的公共服务工作,是位不折不扣的“交叉型”人才。
研究工作之外,Reese建立了自己的博客网页,定期发布一些探讨“科学可重复性”的案例研究,矛头直指“论文工厂”“实验造假”“研究欺诈”“撤稿污名”等涉及科研诚信及公平的问题。
Reese Richardson。图片源自西北大学官网
和Reese一样,Nick也长期致力于对科研诚信等问题的公共讨论。他的本职工作是剑桥大学的一名研究员,专业方向是工程学与流体动力学;另一重身份则是业内知名的“科学侦探”——通过每天查阅各类研究论文,发现潜在的学术欺诈行为,并对其进行举报。
“在某些情况下,你不需要成为专家或在该领域工作就能发现问题所在。”Nick在美国物理学会网站的报道中说。三年来,在他的监督和检举下,一家出版商甚至撤回了850篇存在抄袭、引用不当等问题的论文。
Nick关注到,社交平台上充斥着很多来自“论文工厂”的广告, 出售已经被期刊接收发表的手稿的作者名额,部分广告中会涉及论文标题。几个月后在谷歌学术上搜索这些论文标题,都与广告互为印证。期刊的影响因子越高,作者名额的售价就越贵。
Nick长期关注并追踪“论文工厂”的恶劣行径。与Reese的此次合作,也是为了进一步证明像ResearchGate这样的科研服务网站和谷歌学术这样的搜索引擎在保障科学公平、研究诚信等方面,仍然存在巨大的漏洞与隐患。
让猫成为“高被引学者”,仅花费了两位学者约1小时的时间。他们想通过这个尝试告诉大家:由谷歌学术和ResearchGate计算出的量化评价指标或能被轻易操纵。
“为了使科学事业更加公平,我们应该完全抛弃被引次数、影响因子和h指数等量化评价指标。如果Google Scholar、Web of Science、Scopus和ResearchGate等不再向用户提供这些指标,我们就可以朝着理想迈进一大步。不过,如果它们执意要保留基于引文的指标,至少应该让指标不那么容易被操纵。”Reese在一篇博文中写道。
7月24日,谷歌学术删除了猫咪Larry的所有原创论文和引用论文。至此,Larry将“世界上被引次数最高的猫”这个头衔保持了一周。奇怪的是,谷歌学术并未对那些“论文工厂”造假的研究成果采取针对性措施。
信息来源:
1.https://www.aps.org/apsnews/2023/06/nick-wise-fluid-dynamics-researcher
2.https://reeserichardson.blog/2024/07/18/engineering-the-worlds-highest-cited-cat-larry/
3.https://www.clare.cam.ac.uk/about/people/master-and-fellowship/college-research-associates/nick-wise
4.https://amaral.northwestern.edu/people/richardson/
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。