■唐莉 胡光元 刘维树
在奖励三角(reward triangle,指的是作者署名、被引用和被提名致谢)中,致谢是被科研评估研究长期忽视的议题。随着科学引文索引(Web of Science)从2008年8月起系统地收录论文的资助信息,对科研成果致谢文本的分析(譬如基金项目标注、合作分工陈述、同行专家审稿致谢等)开始得到应用语言学、科技评价以及信息计量领域学者的广泛关注。科研人员或使用该数据比较中外语类结构潜势及其功能变体的异同,或分析合作者之间的具体分工架构,或跟踪基金资助的系列研究成果来评估科研资助对科研产出的影响。但遗憾的是,目前学界研究还远跟不上实践需求,对该信息的使用假设、固有缺陷及存在问题的讨论更是罕见。
美国情报会志(JASIST)上的一篇论文(ESI高被引论文)对学者最常使用的科学引文索引三大核心数据库(SCIE-SSCI-A&HCI)所收录的2009~2014年期间的数据进行检索,从数据库收录特征、语言及文本内容三个视角对科学引文索引的致谢信息进行分析。研究首次明确提出,科学引文索引所收录的致谢/基金资助信息取决于三个因素——论文所在期刊是否被三库之一的SCIE 数据库收录、论文发表使用的语言以及致谢中是否存在基金资助信息。
研究指出,除了资助机构与基金项目名称的拼写错误和变体,可能存在的漏报、多报或误报基金资助信息之外,科学引文索引在收集致谢信息时还存在以下三类固有偏差:
首先,在三大核心数据库中,只有SCIE索引论文(即科技类论文)的基金致谢信息被系统收录,而仅被SSCI或A&HCI索引的论文(即人文与社科研究成果)的基金信息覆盖率极低;
其次,从语言分布上看,用英文或中文撰写论文的资金资助信息收录较全,相比之下,其他语种该信息的覆盖率极低;
第三,在内容上没有科研基金项目资助内容的致谢信息,其整条致谢信息(如作者分工信息等)则都未被科学引文索引数据库收录。
研究人员基于研究发现,文末跳出数据窠臼,针对当前数据驱动的科研评估实践,提出了致谢内容分析适宜回答的问题和在研究应用中应注意的事项。论文提出,尽管致谢分析为评估科研基金绩效、合作分工、隐形作者等新研究议题打开了窗户,但研究者在使用科学引文索引收录的基金信息进行分析时,需要留意该数据本身的局限性和适宜使用的场景。
结合当前科研评估研究与实践,研究强调,单独使用科学引文索引的基金资助信息不适宜评估基金对人文科学或社会科学成果的资助效果。对中文之外的其他非英语撰写成果的致谢分析,以及对致谢部分中其他内容(如具体合作分工细节)的分析,研究者均需补充或验证其他资料来确保数据代表性。
(作者唐莉系复旦大学教授,胡光元系上海财经大学副教授,刘维树系浙江财经大学讲师,本文转自公众号“林墨”)
《中国科学报》 (2018-09-18 第7版 视角)