编译 | 陈昊扬
抄袭是最古老、也是最普遍的学术违规行为之一。但近日,美国哈佛大学校长Claudine Gay因抄袭指控而辞职一事引发了一场新的网上大辩论:在论文中引用多少他人的内容才应被认定为抄袭?一些学者主张采用更宽松的论文学术规范,他们认为只要引用来源明确,研究人员完全可以大量直接引用其他学者的成果。
在学术界,所有研究人员都必须原创自身论文内容,这仍然是一个基本共识。但如今随着科技发展,信息获取变得越来越便捷,叠加人工智能算法日益复杂,能够以极高的精度输出全新内容。过往对于论文原创性和抄袭的观点可能会发生一定的转变。
美国加州理工学院计算生物学家Lior Pachter表示:“我认为永远不应该复制别人的话的想法有点过时了,关键是确保信息来源正确。”他还补充说,学术界存在更大的问题,包括数据伪造。
“抄袭风波”怎样刮起?
先简单回顾一下争论的起因。
2023年12月5日,哈佛大学第一位黑人校长Gay在美国国会发表了争议性言论,她与另外两位大学校长——美国宾夕法尼亚大学的Elizabeth Magill和麻省理工学院的Sally Kornbluth一起,回答了有关巴以冲突后校园反犹太主义的问题。她们强调了学校对言论自由的承诺,但未能彻底谴责反犹太主义。
这引起了一批保守派活动人士和媒体的不满,对她们展开了针对性调查,指控Gay在她的博士论文和学术论文中出现了抄袭行为。Gay的支持者认为这起事件是一次出于政治动机的攻击,在没有进行公开透明的深入调查的情况下,草率地生搬硬套了抄袭规则。但最终,Gay还是在巨大压力下选择了辞职。
这场“抄袭风波”并未止步于几名校长,推动驱逐Gay的对冲基金大亨、哈佛校友Bill Ackman同样卷入其中。就在不久前,美国《商业内幕》杂志声称他们在Ackman妻子Neri Oxman的作品中发现了抄袭行为,而Neri Oxman曾在麻省理工学院担任教职。Ackman认为,是他在推动解决高等教育问题的行动导致了对他妻子的攻击。因此,他撂下狠话,要检查麻省理工学院以及其他相关机构的所有教职人员和董事会成员的工作中是否存在抄袭行为,以此来反击对他妻子的审查。
到底什么才是“抄袭”?
美国政府对抄袭的定义仅此一句:“盗用他人的想法、过程、结果或文字,但没有获得他人的适当许可”。
一些学者表示,Gay显然是在论文中没有标明正确出处的情况下复制了他人的内容,为此,她在辞职前宣布对她的论文进行部分更正。对于一些人来说,这是维护公众对科学的信任所必需的过程,如哈佛大学科学历史学家Naomi Oreskes就表示:“我们都会犯错误,一旦事实证明她的研究存在不少问题,那么她下台会是必然的。”
其他人则认为,所谓的违规行为至多只是轻微的疏漏。他们说,作为一名政治学家,Gay只是按照其领域的规范总结了科学文献,与抄袭行为无关。美国西北大学的政治学家Alvin Tillery说:“抄袭指控暴发的那天,身边学者的反应有点像,‘好吧,按这个标准算,我们都成抄袭者了’。”
这些争议背后反映了指控学术抄袭的一大难点:官方定义中没有区分无害的引用和恶意的抄袭。因此,许多学者现在呼吁制定更加明确的抄袭界定规则。
来自芝加哥的美国全国研究诚信官员协会主席Lauran Qualkenbush表示,抄袭本身并不构成研究不当行为。她指出了学术研究主要资助者美国国家科学基金会(NSF)对研究不端行为的定义:要将抄袭行为视为不当行为,必须有证据证明抄袭行为是故意、知情或鲁莽地实施的,而且抄袭行为严重背离了相关学科的公认惯例。“抄袭行为发生的背景很重要。”Qualkenbush说。
Gay身上发生的事情促使一些科学家开始思考:要求学者在每篇新论文的引言和方法部分重新总结已知事实,这是否真的有价值?Gay辞职后,理论物理学家兼作家Sabine Hossenfelder在社交媒体上指出,这对那些母语不是英语的人尤其有利,她写道:“如果只是对别人的成果进行复述,我们完全没有必要要求每个人一遍又一遍地用自己的话总结他们研究领域的最新技术。”
在一种被称为“模块化写作”的方法中,研究人员可以更自由地从同行的工作中进行采样,以描述更广泛的科学文献,当然,前提是他们标注了引用来源。Pachter将这一想法与计算机科学的实践结合起来,在这一领域,程序员经常需要在彼此的工作基础上进行代码构建。他说:“如果每次有人构建新软件时都必须从头开始,那就太奇怪了。”他指出,在版权许可的前提下,科学家已经被允许复制和粘贴论文的整个部分,并注明出处。
事实上,即使是被Gay所“抄袭”的学者本人,也有人表达了对Gay辞职的愤慨。哈佛大学社会科学教授Jennifer L Hochschild于1996年出版的《面对美国梦》一书的致谢部分中,有两句话被Gay用到了自己论文的致谢部分。Hochschild在接受《华盛顿邮报》采访时表示:“我的第一反应是,‘这件事有点奇怪’。我的第二反应是,‘天啊,这些话都是被人用了无数遍的陈词滥调’。”Hochschild告诉《哈佛深红报》,她对那些发起“蓄意破坏她职业生涯甚至可能毁掉Gay”的人感到“愤怒”。
另外一位被Gay“抄袭”的美国迈阿密大学教授Williamson表示,这些“抄袭”她的段落符合抄袭的定义,但她认为这种违规行为并不严重。在Gay更正了自己的论文后,Williamson对校园报纸表示,她“完全满意”。
政治学教授David T. Canon也有几句话被Gay未加引号引用,但他说:“我不关心这些重复段落,这根本算不上学术剽窃的例子。”
两派声音争吵不休,美国俄亥俄多米尼加大学的学者Michael Dougherty表示,即使学术界发生这样的变化,引用的基本规则也不应该被破坏。“如果我们不遵守这些原则,那么我们就无法对所表述内容的真实性和可靠性负责,”Dougherty说,“我们不能丢掉我们的学术责任。”
人工智能将重塑抄袭检测规则?
Gay作品中存在问题的段落是由软件识别出来的,该软件可以检查论文与其他几乎所有数字化出版物(从权威期刊到维基百科)之间的相似程度。Qualkenbush表示,何时使用此类软件通常由教授、院校和调查机关决定,而且做法各不相同。例如,NSF通过此类软件处理所有拨款申请。许多学术期刊,包括Nature,也有这种软件检查稿件。
不过专家也表示,这种软件有局限性。首先,它无法精确捕捉论文的抄袭之处,随着人工智能(如ChatGPT)的使用,这一挑战只会越来越大,因为ChatGPT可以调换单词并改写输入的文本。抄袭检查软件无法灵活运用学术规范和定义,因此难以鉴定是不规范引用还是恶意剽窃,更无法确定“抄袭”部分是否是论文结论的核心内容。
Dougherty说,随着人工智能的成熟,学术抄袭的概念甚至有一天会消失。“既然可以轻松生成新的文本,为什么还要复制其他人写好的?”
参考链接:
https://www.nature.com/articles/d41586-024-00035-6
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。