本报讯(记者冯丽妃)12月23日,中国科学院计算机网络信息中心发布《中国开放数据白皮书2024》。白皮书显示,中国学者对开放数据的支持度保持在高位,赞成“公开研究数据成为学术惯例”的受访者比例为78%,与去年持平。各方的数据政策在推动数据共享方面,发挥了日益重要的作用。其中,期刊和出版机构的数据政策已成为最重要的驱动因素之一。
中国科学院院士、中国科学院地理科学与资源研究所研究员于贵瑞说:“科学数据的开放共享是科技创新的源泉,是科技事业发展的必然产物和共性规律。”
白皮书显示,2018年至2024年,熟悉或听说过FAIR(可查找、可访问、可互操作、可重复使用)原则的中国学者比例呈上升趋势,从未听说过的学者比例呈下降趋势。
数据引用仍是中国学者共享科研数据的最主要动因。在中国受访者的数据共享动因分析中,“数据引用”在2022年至2024年都是第一动力,且均超60%。这与全球学者的数据共享动因一致。但现实情况是,中国受访者认为自己在数据共享方面的贡献并未获得足够认可。
期刊和出版机构的数据政策对中国学者数据共享行为的影响力在增强。2024年,将其列为驱动因素的中国受访者比例已增至69%,主要原因在于越来越多的国内外期刊要求或鼓励数据共享,推动了更多中国学者在论文发表过程中参与其中。同时,“资金资助方要求”“单位/机构要求”的影响力占比也较之前有明显提升。
白皮书还显示,成果被“抢发”、数据滥用,以及涉敏感信息问题成为中国学者数据共享时的主要担忧。2024年的统计结果显示,“成果被‘抢发’”(42%)、“数据滥用”(39%),以及“包含敏感信息或数据共享前须获研究对象允许”(36%)是占比最高的几项顾虑。
人工智能(AI)工具正被更多地用于辅助数据管理。2024年,中国科研人员更加积极地使用AI工具进行数据收集、数据处理和元数据创建,已经和经常使用(共24%)、计划使用(36%)AI工具的人数较去年都有一定程度上升,不考虑使用的人数明显下降。
在参与本次调查的中国受访者中,70%来自高校,其次是科研机构(13%)和医学院(8%)。在学科分布上,排在前三的分别是医学(21%)、生物学(19%)和工程科学(13%),今年来自社会科学领域的受访者明显增加,居第四位。
据悉,今年是施普林格·自然连续第九年与数字科研公司、Figshare知识库联合开展有关开放数据的年度全球调查,并据此于12月初发布了2024年度《开放数据状况报告》。中国科学院计算机网络信息中心对其中来自中国研究人员的调查结果,即414份有效问卷进行分析,撰写了《中国开放数据白皮书2024》。
《中国科学报》 (2024-12-24 第1版 要闻)