中图分类号:G250.2 DOI:10.13833/j.issn.1007-7634.2023.09.001 0 引言 开放科学是解决复杂科学问题的重要支撑和科技发展的主流趋势,其发展需要科学数据治理的支撑[1]。随着数据密集型(data-intensive)科研范式深入发展,科学数据采集、整理和分析成为科研基本活动[2],科学数据治理的重要性进一步凸显。国内外各方重视发挥科学数据治理在促进开放科学发展中的重要作用。联合国教科文组织发布《开放科学建议书》(Recommendation on Open Science),强调实现科学数据公开、透明和重用以推进开放科学实践。国际科技数据委员会(CODATA)、世界数据系统(WDS)等4个国际组织共同筹划Data Together项目,倡导全球科学数据协同治理,推进开放科学平台合作,服务于数据密集型科研发展[3]。我国政府也颁布《科学数据管理办法》《促进大数据发展行动纲要》《数据安全法》等政策,旨在发挥数据要素作用,完善科学数据治理,推动开放科学发展,使科技创新成果惠及更多国家和人民[4]。 基于开放科学环境,学界主要从概念分析与实践调研两方面开展科学数据治理研究。一方面,分析科学数据治理相关概念定义与特征,指出其与开放科学的关联或分析科学数据治理与管理的差异。如认为开放科学改变科研模式,分析其对科学数据管理提出的挑战和要求[5];指出开放数据与开放科学均属于开放运动[6];提出开放数据是开放科学的物质基础,开放科学是开放数据的最终目标[7],对比分析科学数据管理与治理在内涵、功能、目标、原则等方面的异同。另一方面,将开放科学作为背景,探寻治理实践相关政策、主体和平台。政策维度,通过调研权威组织的战略文件、法律制度、条例指南等归纳科学数据管理与开放进展,提出促进开放科学发展的政策建议[8]。主体维度,以政府、高校、图书馆、资助机构等为对象,探讨人才培养[9]和服务供给[10],倡导合作与开放共享,推动开放科研网络建设。平台维度,阐述数据平台或存储库[11]的治理技术、运行机制和实现功能,总结实现开放共享的经验与对策。 当前研究主要存在三个问题:一是将科学数据治理与管理混用,难以把握科学数据治理的内涵与外延特征,也不利于治理政策制定与实施;二是对科学数据治理与开放科学的关系剖析不足,难以发掘开放科学发展对科学数据治理的影响和要求,根据科研发展需求及时完善治理理论与实践;三是仅从特定维度探讨科学数据治理内涵与定义,适用的情境有限,难以全面指导治理实践。 因此,本研究全面获取和分析科学数据治理与开放科学交叉领域文献,旨在辨析科学数据治理及其相关概念,明确其与科学数据管理间异同,梳理开放科学对其的影响与要求,明确治理内涵与定义,在此基础上,构建科学数据治理概念框架,提出研究展望。 1 研究设计与实施 本研究主要采用系统性文献综述法及内容分析法。系统性文献综述法围绕特定主题提出研究问题,全面检索和获取所有相关成果,进行系统评估、整合分析以解决研究问题。包含确定研究范围、制定筛选标准、规划检索、全面收集与筛选文献、分析并展示结果五大步骤[12]。 1.1 确定研究范围与筛选标准 (1)研究范围 本研究聚焦科学数据治理、科学数据管理与开放科学三个概念领域:①科学数据治理与IT治理、数据资产及隐私保障等相关[13],是数据治理在图书馆服务、科研机构管理、数据库建设等领域的应用、拓展与细化,涉及数据获取、开放、共享等内容。由于涵盖科学数据治理整体的研究有限,因此将数据开放、共享等相关研究均纳入分析。②科学数据管理包括科学数据采集、汇交、保存、共享与利用、保密与安全[14]等内容,与科学数据治理具有相似性,故将相关研究纳入,以补充和辨析治理概念。③开放科学具有知识、运动、理念等多重性质[15],包括开放科学基础设施、开放科学知识、科学传播与交流、开放社会参与和跨知识系统对话等内容[16]。开放获取属于其中重要研究点,故纳入开放科学与开放获取相关文献。 (2)筛选标准 参照系统性文献综述及元分析方法(PRISMA)制定的标准[17],对样本文献进行选择。具体包括:①研究主题属于界定的研究范围内。②内容包含对开放科学、科学数据治理的明确定义。③属于研究型论文,具有明确的研究问题、方法、过程和结论,并非技术应用报告、数据库系统介绍等。④摘要形式为结构化摘要,阐明研究目的、过程和结论。 1.2 规划检索、文献收集与筛选 规划检索阶段,通过试检索确定中文与外文检索词(如图1),检索字段为:标题、摘要、关键词与主题。在文献收集与筛选阶段,选取3个中文平台和7个外文平台进行检索。随后进行去重、相关性判断与文献质量评估,最终获取122篇文献,含中文56篇,外文66篇。