一项针对700多万份数字出版物的研究表明,超过四分之一的学术文章没有得到很好的保存。近日发表于《图书馆学与学术交流杂志》上的研究结果表明,在线保存论文的系统未能跟上研究产出的增长。
一项研究发现,有200多万篇文章没有出现在一个主要的数字档案中,尽管它们有一个有效的DOI。图片来源:Anna Berkut/Alamy
“我们整个科学和研究的认识都依赖于一连串的脚注。如果你不能核实别人在其他时候说了什么,那你就只是盲目相信那些你自己都看不懂的东西。”英国伦敦大学伯克贝克学院研究员、论文作者Martin Eve解释说。
Eve曾参与数字基础设施组织Crossref的研究和开发,他检查了7438037件标有数字对象标识符(DOI)的作品是否保存在档案馆中。DOI由一串数字、字母和符号组成,是用于识别和链接到特定的出版物的唯一“指纹”,例如链接学术文章和官方报告。Crossref是最大的DOI注册机构,为包括出版商、博物馆和其他机构在内的约2万名成员分配DOI。
研究中包括的DOI样本是随机选择的,每个成员组织注册的DOI多达1000个。其中28%的作品——超过200万篇文章,没有出现在主要的数字档案中,尽管它们有DOI。只有58%的DOI引用了至少存储在一个档案中的作品。其他14%被排除在研究之外,因为它们发表的时间太短,不是期刊文章,或者没有可识别的来源。
Eve指出,这项研究具有一定局限性,它只跟踪有DOI的文章,并且没有在每个数字存储库中搜索文章。例如,他没有检查有DOI项目是否存储在机构存储库中。
尽管如此,文物保护专家还是对这一分析表示欢迎。总部位于英国约克的数字保护联盟的董事总经理William Kilbride表示:“很难知道电子期刊面临的数字保护挑战的真实程度。”该联盟出版了一本手册,详细介绍了良好的保护措施。
芬兰汉肯经济学院研究学术出版的Mikael Laakso说:“许多人都有一个盲目的假设,如果你有一个DOI,它就会永远存在。但这并不意味着这种链接总是有效。”2021年,Laakso和同事报告称,2000至2019年间,超过170种开放获取期刊从互联网上消失了。
美国数字档案服务公司Portico的董事总经理Kate Wittenberg警告称,小型出版商无法保存文章的风险要高于大型出版商。“保存内容是要花钱的。”她补充说,存档涉及基础设施、技术和专业知识,这是许多小型组织无法获得的。
Eve的研究提出了一些可以改善数字保存的措施,包括对DOI注册机构提出更严格的要求,以及对出版商和研究人员进行更好的教育和增强他们的认识。
“每个人都会想到在某个地方发表论文可能会带来的直接收益,但我们真的应该考虑研究生态系统的长期可持续性。”Eve说,“在你去世100年后,人们还能看到你做过的研究吗?”(来源:中国科学报 李惠钰)
相关论文信息:https://doi.org/10.1038/d41586-024-00616-5