近日,中国科学院发布了《中国开放数据白皮书2024》,全面揭示了中国在开放数据领域的现状、取得的成果、面临的挑战以及未来的发展方向。
根据白皮书调研,2024年中国学者对开放数据的支持度持续上升,期刊和出版商的数据政策影响力显著增强。然而,数据共享过程中仍面临多重挑战,如学者担心成果被提前发表、数据滥用以及涉及敏感信息等问题。不同学科在数据共享方面的担忧因素有所不同,且学者在数据共享方面的贡献往往得不到足够的认可。因此,科研机构、基金资助方等需要加强对科研人员共享数据的引导和激励。
白皮书还展示了中国在多个领域的开放数据实践成果。国家科学数据中心在各自领域取得了显著成效,如国家材料腐蚀与防护科学数据中心通过大量腐蚀大数据联网观测,解决了关键建模难题;国家生态科学数据中心构建了标准规范体系,推动了生态系统野外台站数据的开放共享;国家基因组科学数据中心建立了人类遗传资源数据管理与共享平台;国家青藏高原科学数据中心在数据共享和质量控制方面取得了突出成果,为众多科研项目和区域发展提供了数据支撑。
在数据论文方面,中国学者在全球数据论文发表中表现突出,数量位居全球第二。然而,论文的影响力尚需进一步提升。白皮书指出,科技资源标识服务平台为各类科技资源提供了唯一标识服务,在大科学装置和生物多样性等领域得到了广泛应用,未来还将向智能化、数字化、标准化方向发展。
随着生成式AI的发展,开放科学迎来了新的机遇。白皮书提到,生成式AI可以帮助作者生成高质量的元数据,撰写数据可用性声明,助力数据论文的发表,提高数据共享的合规性和报告质量。然而,技术并不能替代政策制定和编辑的领导力。
中国开放数据事业在各方努力下取得了显著进展,但仍需政策制定方加强引导,建立有效的激励机制,推动数据存储库的建设,并为科研人员提供专业指导,以促进开放数据事业的进一步发展。