“论文工厂”的冰山到底有多大?
自2020年起追踪以来,著名学术“侦探”Elisabeth Bik团队至今已经发现了16个“论文工厂”及其生产的2000多篇论文,绝大多数含有中国作者,这些“学术垃圾”被贴在同行评议网站Pubpeer上。
被举报后,部分期刊会选择撤稿。暨南大学学报副主编王景周对526篇撤回论文的分析发现,这些论文来自20家国际出版商的54种期刊,署名都有中国作者,且集中在基础
和健康科学领域。日前,这一结果以“因‘论文工厂’撤回论文的特征分布及治理路径”为题发表在《中国科技期刊研究》上。
Elisabeth Bik团队成员扮虎告诉《中国科学报》,“国内的论文工厂100%是中国客户,国外的论文工厂有一部分也是中国客户,从全世界来看,最大的买家无疑来自中国。”
扮虎还表示,通过参考文献、图表构图配色、邮箱地址、共同作者等,“侦探”们摸索出了多种办法让造假者“现原形”。
王景周告诉《中国科学报》,“与国际期刊上出现的工厂论文相比,国内期刊以小作坊论文居多,隐蔽性更强、服务更精准。”他曾通过维普数据库的“作者简介”查询项,追踪到了同一个中介在2013—2020年间代理发表的62篇论文。
以下是《中国科学报》与上述两位专家的对话。
“工厂论文:2020以来集中撤稿,中国作者、
领域占比大
《中国科学报》:通过研究或追踪,你发现“论文工厂”论文呈现哪些特征?
王景周:分析撤稿观察数据库(Retraction Watch Database)中的526篇论文工厂论文(截至2021年7月31日)发现,其发表时间集中在2017-2019年(占80.42%),撤回时间集中在2020—2021年(占98.67%)。其中400多篇的撤稿原因都是“第三方指控”,也就是除作者、期刊之外的第三方举报。
第一作者来自国内29个省/市,出现次数最多的省份是山东省(155篇,29.47%),其次为河南省和吉林省。
进一步分析其机构发现,出现次数最多的是吉林大学(57篇,占10.84%),其次为青岛大学和中南大学。
就其学科分布而言,集中在基础
和健康科学领域。
需要指出的是,这些分析仅基于来自撤稿观察的部分论文进行,数据和结论都存在局限性。
扮虎:80%涉及中国作者的撤稿论文是我们团队直接或间接推动的。自2020年以来,我们的打击力度很大,比如上周,团队中最多的一名成员贴出了100多篇造假论文。因此,论文工厂会更隐秘,造假方式也会随之改变。
与2020年相比,目前挖出的数量已经有所减少,但可以肯定的是,还有大量的工厂论文没有被挖出来。
《中国科学报》:是由于
、医学领域产出的工厂论文更多?还是由于学术打假人更关注该领域呢?
扮虎:与其它领域相比,我们没有更关注
和医学领域。事实上它的造假确实比其它领域更多,我认为跟医生的晋升需要有关。
如果在高校、科研院所做
基础科研,会把论文成果产出作为评价指标之一,肯定不会要求看多少个病人。那临床医生为什么一定要发论文才能晋升呢?
当然,我并不是说由于这样的要求,医生就可以找论文工厂。而是这样的评价方式非常不合理。
“虚假注册、换稿、换名,论文工厂造假伎俩多
《中国科学报》:论文工厂有什么投稿伎俩吗?
王景周:比论文工厂存在更久的是代写、代投。早些年很多人认为代投不属于学术不端行为,毕竟内容都是自己的,只是找人帮忙发出去;再比如导师让研究生代投稿件,过去这是很正常的。
近些年来,论文工厂将二者合并,一条龙服务,这就避免了买来论文之后没有期刊接收的风险。
这些论文工厂的伎俩五花八门:比如与掠夺性期刊合作,利用信息不对称,谎称期刊由专业编辑、同行评议、高影响因子等信息,实则以获利为目的。
再如操纵同行评议,他们会利用虚假信息进行注册,投稿时推荐这些虚假审稿人,使稿件回到自己邮箱里提供审稿意见。
或者先投一篇质量较高的文章,投中之后,利用编辑处理稿件过程中的漏洞,更换文章;或者投中之后再拿去卖,更换、增加作者;此外,还有最近出现的操纵专刊等等。
《中国科学报》:目前被揭露的工厂论文大多来自国际期刊,国内期刊的情况怎么样?
王景周:由于国内没有如Pubpeer、撤稿观察等公开集纳的平台,缺乏相关数据,某一家期刊的情况可能不具有代表性。
就我们学报而言,与国际期刊流水线式、批量生产的工厂论文不同,遇见的更多是隐蔽性更强、服务更精准的论文“作坊”,也就是“中介论文”。国内期刊中更多的可能是这类型的,成功率更高。
在稿件处理过程中,我就曾发现中介论文的共同手机号码和邮箱,仅通过维普数据库的“作者简介”查询项,就追踪到了同一个中介2013—2020年代理发表的62篇论文。
“捉住每一个可疑之处,寻找工厂论文的蛛丝马迹
《中国科学报》:学术“侦探”们通常如何捕捉工厂论文?根据哪些蛛丝马迹?
扮虎:一是根据参考文献。最近这段时间抓出了很多,像引用与主题毫不相关的文献,引用同一批文献等等,这些文献有的是同一家工厂出产的,有的是和期刊的客座编辑联手来推动某些人的引用率,有些像买热搜;
二是根据图片构图、图表配色、数据等。我们团队有的成员对构图配色非常敏感,根据构图和配色找到很多可疑的论文,通过团队间的讨论,发现其中绝大多数是有问题的。来自同一家工厂的构图往往很相似,图表都是同一种风格。比如有一个工厂,所有的论文都是先从临床取一些组织样本,之后植入动物,样本数量相差都不大,且不同论文培养的是不同细胞,但是图却相差无几;
三是根据邮箱地址。发现一篇论文不对劲,我们会去搜索作者的邮箱,往往不会搜出很多,但很多作者的邮箱是有规律性的,比如都是张三66@163.com,李四88@126.com这种,起初团队的成员很好奇,还问我66、88在中文里的特殊含义。如果用的是单位邮箱,当发现一篇可疑论文后,我们通常会翻阅相关联的组里所有的论文,往往有很多意想不到的收获,有时能翻出好几十篇,通讯作者包括国内的大咖;
四是通过Pubpeer上的回复。我们挂到Pubpeer上之后,所谓的“作者”会来回复,为自己辩解等等,我们发现其回复的语气都是一样的,所犯的语法错误也是一样的,但这些作者之间又是毫无关联的人,这肯定就是论文工厂的客服了。我还遇到用过一位作者的账号对另一位作者的论文进行回复的情况,估计是忘记切换账号了,且不止一次;
五是根据作者单位、地域等。我们一方面为了避免误判,也为了顺藤摸瓜,确定了问题论文之后,我们也会再次搜索共同作者之间的关系,比如一个吉林的,一个云南的,个人简介中又没有显示他曾经与对方有合作,可能就是合作买了同一篇论文。
《中国科学报》:打击论文工厂的过程中,有哪些令你印象深刻的案例?
扮虎:有次我发现一篇论文,共同作者中只有一个中国人,其他作者都来自中东国家,搜索之后发现这个中国作者的单位是个很小的医学院,且她过往经历显示一直待在教学岗,且论文内容和她的主要方向还不一致,种种奇怪的组合。
那像这样的人,怎么会有相关的国际合作呢?国际合作的经费从哪里来呢?后来我们就深挖下去,就挖出了一个伊朗的实验室,可能是这个伊朗实验室在卖论文,辗转卖到了这位作者手里。
去年我们发现了一个大型数学论文工厂,其中的17个外国作者甚至是被捏造出来的,根本不存在,这些作者出现在23篇和中国作者合作的论文里。被用的最多的是一位叫Beatriz Ychussie的虚假丹麦学者,涉及4篇论文。
最近我们刚发现的一个论文工厂,有457篇论文入列,包括国内Top2高校的附属医院。像这样的案例还有很多,往往是拔出萝卜带出泥。
所以我们在打假过程中,一旦遇到新的造假类型或者批次,都会立即新建一个数据库,比如近来出现的专刊造假,比如同一工厂的论文等。
《中国科学报》:为什么做学术“侦探”,你从中收获了什么?
扮虎:我们团队大部分人都有科研主业,完全利用业余时间进行打假,也没有人给补助。
但大家为什么还要做这样的事?因为这些论文造成的后果太严重了,后来的科研人员是在这些论文的基础上继续研究的,他们会把这些结果当真,那基于这些工厂制造出来的数据和结论,怎么可能做得出来?何谈重大突破呢?
目前确实有不少期刊,从2019年开始对中国作者的论文另眼相待,有的会要求,中国作者的论文必须先提供原始数据,不然都不会送审,直接退稿。
论文工厂在暗处,被我们揪出来之后,他们也可能改头换面再出来作乱,我们的力量还是非常有限的,这也是需要中国政府重拳出击的地方。
有人说我们团队只针对中国,其实是由于大家在国内,更关注国内的情况而已。
中国的打假只占团队工作的1/3左右。团队中实名成员遭受到了很多恐吓和报复,包括一些国际著名公司,因为科研论文是公司产品的基础。
就国内而言,也有很多我们惹不起的人。当了解了这些真实情况,有时候觉得很绝望,到底中国还有多少论文可以让人相信?
也是基于这些,我只能匿名,以保证这项工作能继续下去。
(文中扮虎为化名)
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。