时间:2019年06月17日 分类:推荐论文 次数:
摘要文章在构建科研数据管理模型的基础上,探析科研数据管理中的相关利益主体:政策制定机构、基金管理机构、科研活动机构、数据管理机构、数据出版机构以及数据生产机构,明确这些主体在科研数据管理中的作用,在此基础上分析参与科研数据管理中的相关主体之间的互动关系,为e-Science环境下科研数据管理的实施提供借鉴。
关键词:RDM科研数据管理,数据管理,相关利益者
1引言
科学数据的爆炸式增长给前沿科研项目带来了巨大挑战,数据集的增长已经超过数十亿字节。我们正处在一个以数据为中心的科学研究时代,在这个时代里,我们应用科学数据的场景无论从规模上还是多样性上,都在迅速地扩展,这意味着科学实验产生的大量科研数据变得和科学文献一样重要,收集、整合、管理和共享科研数据的任务已被公认为是各国政府与组织面临的最紧迫的任务和挑战之一。
近年来科研数据管理(ResearchDataManagement,RDM)的相关研究工作备受各国政府与组织的关注。事实上,大约十年前科研数据管理就已经受到了英国许多主要研究基金会的关注,这些研究基金会为了方便获取和共享数据,开始要求每个基金项目申请人提交科研数据共享的管理方案[1]。英国的工程和物理科学研究委员会,不仅要求基金申请者提交科研数据管理的方法,还期望研究机构在公共研究经费内适当拨款,酌情作为直接资金和间接资金流,为存储、管理和获取科研数据建立系统和基础设施[2]。
2004年英国联合信息系统委员会(JointIn⁃formationSystemsCommittee,JISC)资助成立了数据监护中心(DigitalCurationCentre,DCC),其目标是促进英国数字化资源的管理。紧随其后,美国和加拿大也在联邦/国家级别上,建立了科研数据管理和分享的强制性执行计划。如美国国家自然科学基金会、国家人文科学基金、美国国立卫生研究院、加拿大卫生研究院、国家科学和工程研究委员会和加拿大社会科学和人文研究委员会等都颁布了科研数据管理和分享的强制性措施[3]。
德国一些机构也意识到了科研数据管理的必要性和重要性,制定相关的政策,并在各个研究领域促进信息基础设施的建立。例如,德国研究基金会(Ger⁃manResearchFoundation,DFG)近年来发布的“提议维护良好的科学实践”[4],保证科研数据符合“现存标准和数据知识库”的要求[5]等指导方针。由此可见,科研数据管理作为一种解决对策,已经成为必需予以要足够重视的全球性的问题,也已经成为国家层面上的一项极为重要的战略任务。
然而,科学数据管理是一项巨大而复杂的工程,涉及众多的相关利益关系人,为确保科研数据管理这一系统工程的顺利运行和持续发展,必须要理顺各参与方的角色定位和责任。本文将沿着科研数据管理流程周期,探析科研数据管理过程中参与的相关利益者的角色作用与互动关系。
2科研数据管理流程
2.1科研数据管理的概念
Whyte和Tedds[6]把科研数据管理(RDM)定义为:科研数据管理是数据组织,是在科学研究周期内通过传播和归档的具有价值的研究成果。Cox和Pinfield[7]提出科研数据管理是,与数据生命周期相关的许多不同的活动和流程,包括设计和创建的数据,存储、安全、保护、检索、共享和重用,考虑到技术能力、伦理道德、法律问题和治理框架。
科研数据的管理不同于科研文献的管理,因为科研数据与科研文献有显著的区别,两者的区别主要有如下几点:(1)正式出版的科研文献有统一规范的格式,而科研数据不同于出版的科研文献,没有统一的形式,科研数据是在科研活动中产生的数字形式的任何数据,包括文本型的、数字型的、图像型的等各种不同的格式;(2)正式出版的科研文献是以文件的格式储存在出版商或者数据库商的数据库中,而科研数据分散储存在各自的研究机构和研究人员的设备中,其数量大且类型复杂,因此其储存方式也多种多样,有电子文件格式、数据库格式以及科学仪器专有格式等不同的格式;(3)正式出版的科研文献是科研活动的最终结果和总结,具有单一性和稳定性的特点,而科研数据是研究生命周期内产生的任何数据,其特点是具有动态往复的数据生命周期,具有数据的时间跨度大、内容的连续性强、数据间的逻辑关系复杂等特点。由此可见,要实现对形式多样的科研数据进行有效的管理,需要经过系统性的、复杂的过程。
2.2科研数据管理流程
在e-Science时代,科研数据的共享和再利用是实现高效科研的有效途径之一,如果能在科研活动生命周期内对其进行有效的管理和共享,则对科学研究活动有着重要的意义。然而,科研数据复杂多样性的特点,决定了人们难以直接利用它,必须建立健全的科研数据共享机制,对其进行有效的系统管理,才能对其有效地利用。
对科研数据进行有效系统的管理,受到很多方面的影响。科学研究的生命周期和数据生命周期理论可以用来解释科研数据管理过程和明确参与其中的不同相关利益者的角色作用。国外已有很多机构对科研数据管理进行了基于科学研究的生命周期和数据生命周期理论的科研数据管理周期模型和科研数据管理流程。
根据地球观测卫星委员会(TheCommitteeonEarthObservationSatellites,CEOS)的统计截至2011年全球建立的科研数据生命周期模型为46个[8],其中典型的数据管理生命周期模型包括DCC管理生命周期模型(TheDigitalCurationCentre,DCC)[9]、Research360机构研究生命周期模型(UniversityofBath)[10]、DataONE数据生命周期模型(NewMexicoStateUniversityLibrary)[11]等。
纵观科研数据生命周期模型,其模型都是基于数据产生、数据保存管理、数据共享的过程构建了科研数据管理流程模型。根据最早建立科研数据管理系统的DCC网站所列的基于数据生命周期的科研数据管理工作流程包括6个阶段:(1)创建或接收数据阶段;(2)数据评估和选择阶段:这一阶段包括质量控制、编目分类、结构化元数据等一系列不同的活动;(3)数据存储阶段;(4)存储数据的说明信息;(5)数据的存取、利用和再利用阶段;(6)重用数据的途径与许可范围[12]。
该模型以高度概括的方式展现了一个成功的科研数据管理所需的生命周期的各个阶段。目前,在我国科研数据管理实践尚处于初期探索阶段,暂无成型的科研数据管理流程模型来进行有效的管理。本文结合参考国外成熟的科研数据管理周期模型,将科研数据管理从战略规划实施到最终再利用分为四层架构来对其构建了流程模型。这四层架构流程为战略规划阶段、数据管理阶段、数据存储与托管阶段、数据共享使用阶段。
每个阶段都有各自的重点:(1)战略规划阶段:这一阶段应制订和开发数据实施规划、共享的相关政策法规等,在这一阶段应强调政策的导向性,加大宣传科学数据共享的理念,以得到科研机构和科研人员的广泛认可,形成共享氛围和共享意识。(2)数据管理阶段:这一阶段要重视数据的评估和质量控制,应强调数据的选择和组织,应选取可靠、有再利用价值的数据,不合格的数据应该返回给始发人进行进一步评估。加强数据的加工分析,便于后期进行解码。(3)数据存储与托管阶段:这一阶段需要考虑数据的完整性与成本的平衡,数据的维护、托管与安全性。(4)数据共享使用阶段,要求发布机制、版权和数据授权,衍生作品的权利,通过重复使用数据,使其产生新的科研数据这一过程实现数据的增值。整个管理阶段的核心内涵则是数据的管理、存储、访问获取。
总的来说,科研数据管理流程模型直观反映了科研数据管理的任务。依据科研数据管理周期模型进行管理,有助于参与的各机构之间的协同合作与互动,提高科研数据管理的效率。
3科研数据管理中相关利益者权益分析
可以说,科研数据管理中保护和管理各参与的相关利益者的权益是科研数据管理和利用能否可持续发展的重要因素之一。为此,需要考察科研数据管理中各相关利益者的权益定位和相互之间的互动关系,以确保科研数据管理的顺利实施。科研数据管理流程的各个环节,为相关利益者提供了一种途径来明确科研数据管理中参与各方的任务和责任,对理顺科研数据管理中的相关利益者的权益和了解相互之间的互动关系具有指导性的意义。
3.1相关利益者及其作用
美国学者R.EdwardFreeman[13]在《战略性管理:相关利益者方法》一书中,对相关利益者(Stakeholder)给出了定义,证实相关利益者是“任何能影响组织目标的实现或受组织目标的实现影响的团体或个人”。随着相关利益者理论的不断发展,该理论在各种组织中得到广泛的应用。关于科学数据管理的相关利益者问题,英国学者Lyon[14]认为与科学数据管理相关的利益主体包括科学家(Scientist):创造和利用数据;机构(Institution):管理和访问数据;数据中心(Datacentre):管理和访问数据;用户(User):利用第三方数据;资助机构(Funder):设置/应对公共政策驱动;出版机构(Publisher):保持完整的科学记录等。
同时参考Ly⁃on对科研数据管理相关利益者的分析以及DCC管理生命周期模型,认为科学数据管理的相关利益主体至少包括如下6种:政策制定机构、科研资助机构、科研活动机构、数据管理机构、数据出版机构、数据生产机构。下页表1所示的是科研数据管理的相关利益者主体与每个主体内的参与者应尽的职责。
3.1.1政策制定机构
政策驱动和制定是科研数据管理顺利实施与否的关键因素。相关政策制定机构包括国家和各机构的科研管理部门相关部门。在复杂的科研数据管理合作中,若想构建科研数据的共享环境,首先需要国家层面的数据管理与共享政策和相关法律法规的制定。如果没有国家层面的政策和法律框架,就很难实现有效的科研数据管理共享的目标。
为此,国家相关政府部门需要制定科研数据管理可持续发展战略,制定全面透明的科研数据管理相关政策法规,例如开放政策、知识产权及法律伦理等,同时建立政策反馈机制,跟踪科研数据管理当前的实施效果、评估未来的潜力,促进科研数据管理这一复杂工程的有效运行。各机构科研管理相关部门需要依据国家相关政策来制定相关战略规划和执行细则。
欧美发达国家已经将数据共享提到国家层面的战略高度,在国家政府层面上相继制定了大量的相关政策。作为数据政策开放的先行者美国政府为了进一步完善政府信息公开制度,于2009年发布了《开放政府指令》(OpenGovernmentDirective)[15],为了贯彻执行这一政府指令,政府层面的Data.gov(http://www.data.gov)数据网站正式上线,各联邦政府机构被要求向Data.gov提供信息,目前该网站拥有成千上万的政府数据库,提供来自美国联邦政府的各个行业的原始数据,其目的是通过政府网站发布更多数据,提升政府资讯的透明度与可用性。
继美国之后,英国政府也颁布了《开放政府》《信息公开法》等一系列法律法规[16],2013年首先提出《八国集团开放数据宪章2013年英国行动计划》[17]。同时,2010年英国政府也建立了Data.gov.uk(https://data.gov.uk/)网,确保所有的开放数据集都发布在官方数据门户网站data.gov.uk上。澳大利亚政府也先后发布了《澳大利亚负责任科研行为准则》(AustralianCodefortheResponsibleConductofResearch),《开放政府宣言》(OpenGovernmentDeclaration),《公共服务大数战略》等一系列政策制度,并推出政府层面的数据门户网站Data.gov.au[17]。
3.1.2科研资助机构
科研资助机构的要求是科研数据管理和开放获取的重要实施动力。政策导向政府和基金管理组织资助科研机构的课题经费。科研资助机构是支持科研项目顺利进行的重要保障,其肩负统筹和资助科研项目的职责,在数据监管与传播方面扮演着重要的角色,有权通过资金与政策支持等强制手段推进科研数据管理与共享机制,监督科研机构提供的数据的真实性与准确性。为提升数据管理效率,各国基金管理组织相继出台相关制度强制性要求科研数据的开放共享。
例如,2010年美国国家科学基金会(NSF)通过其网站发布《开放政府指令计划》(OpenGovernmentDirectivePlan)作为信息公开活动实施的战略蓝本。2011年美国国家科学基金会(NSF)和美国国立卫生研究院(NIH)发布政策规定要求所有项目申请者需要同时提交一份不超过两页的科研数据管理计划[18-19]。英国自然环境研究理事会(NERC)也发布相关数据政策要求具有长期利用价值的项目相关数据需要提交到NERC数据中心[20],以保障数据共享等。
3.1.3科研活动机构
科研活动机构包括科研院所和高校。科研机构的科研人员是科学数据的生产者和拥有者,同时也是科研数据的利用者。从作为科研数据生产者的角度来看,科研人员在科研活动中进行科学实验的过程生产科研数据,同时对生产的数据进行分析、处理和存储。
目前,许多基金管理机构强制性要求每个资助的研究项目,应提交一个结构化的数据管理计划作为同行评议的一个组成部分,申请资助。为此,科研人员需要对科研项目整个科研生命周期内产生的科研数据进行实时管理并定期存放在开放的存取数据存储库中,以达到数据共享的目的。
从作为数据利用者的角度来看,随着第四范式数据密集型计算科学的发现,科研人员也希望科研数据能够被开放共享,以便通过科研数据的再利用提高科学研究的效率,推动科研的创新。同时,科研人员作为数据的拥有者,有权保留或者放弃自己拥有的数据,并且有权获得数据产权保护。
3.1.4数据管理机构
数据管理机构是负责科研数据管理具体实现的关键性机构,在科研数据管理中承担着基础设施建设、技术支撑和提供服务的重要任务,参与的相关机构主要有数据中心、机构IT部门和图书馆等。
(1)数据中心。
数据中心用来在Internet网络基础设施上传递、加速、展示、计算、存储数据信息,是科研数据管理中最核心和最重要的部分。在科研数据管理中数据中心主要承担长期管理数据、满足良好的时间标准、提供技术培训、保护数据提供者的权利、为数据利用者提供工具等任务。
目前,世界范围内已产生了大量的数据中心,(WorldDataCenter)是国际科学联合会下设的科学数据组织,有40多个学科数据中心,分属四个数据中心群:WDC-A美国、WDC-B前苏联、WDC-C欧洲和日本、WDC-D中国。这些数据中心大多是政府主导建立的公益性质的数据管理机构,致力于科学数据的保存和利用,通过汇集一些国家基金支持的重大课题、专题研究的数据成果,为研究的可持续发展提供数据支持。
如美国人类基因组计划[21](HGP)、航空航天局(NASA)数据库[22]、美国国家海洋与大气部[23](NOAA)等,均为各学科领域权威的数据监护中心。这些数据中心通过数据管理和共享以实现学科研究的持续发展,其在科研数据管理方面积累了大量的经验,其数据管理的宝贵经验是机构科研数据管理的基础,可以直接或者间接地加以整合利用。
(2)机构的IT部门。
科研数据的搜集、存储、共享、获取等各个科研数据管理的环节,需要以IT基础设施的建立和维护为基础,因此IT部门作为科研数据管理基础设施的建设者,其重要性越来越凸显。在进行科学数据管理实践时,面对大量科研数据的管理,IT部门需要提供高性能、大规模、可扩展的数值计算、存储和处理的能力,同时还需要支持科研数据管理平台的运行,包括数据获取、访问、迁移、网络安全与认证等应用。
(3)图书馆。
长期以来,图书馆的主要工作包括语义描述及规范、分类编目、数据挖掘及加工以及信息资源建设等。为此,在科研数据管理的内容组织方面,图书馆一直都被认为是最为理想的组织部门。因此,在科学数据管理与传播共享的过程中,图书馆作为科研数据管理的核心服务部门之一,其主要责任是对科研数据内容的组织和为科研数据管理的用户提供科研数据咨询服务。
3.1.5出版机构
出版机构的职能是保持科学记录的完整性。出版机构包括以营利为目的的商业出版商和不以获取利润为目的的非营利性出版商。随着科研数据管理的高度重视与开放共享环境的形成,出版商预期科研数据可用于科学出版物,同时,他们也认识到科研数据的出版是对科学家的学术价值和社会贡献的进一步肯定。科研机构借助出版商出版和开放高附加值的科研数据,可以扩大和提升该科研机构的学术影响力和社会公信力。
目前,在出版标准化的发展方面,出版商们为了链接科研数据与科学文献联系在一起,以支撑出版物的标准化,监控和加强公共标准,请求研究者把研究活动中产生的与研究论文相关联的研究数据作为论文发表的一部分,在长期存储库中发布预发布数据,以便其他人可以获取与共享。
同时,出版商们已经认识到科研文献背后的科研数据的巨大价值,积极与科研数据相关利益者建立密切关系,以科学家作为科研数据的创造者、作者和利用者,以数据中心和机构作为科研数据的供应商,积极构建科研数据的运营模式,例如,制作数据管理相关工具、出版经过同行评议的数据杂志等,推进科研数据进入学术交流体系和评价体系,促进科学数据作为科研成果发布和重用的常态化。
3.1.6数据生产机构
数据生产机构是数据采集者和数据提供者,他们将科研数据进行采集之后上传。数据采集者和数据提供者对其采集或上传的科研数据享有专利,在科研数据管理流程中,应制定相关法规,以保护科研数据知识产权。
3.2相关利益者的互动关系
科研数据的再利用和增值是科研数据管理的关键因素,科研数据管理形成的内在动力在于通过科研数据管理满足社会需求,推动科学进步。它是一个具有持续创造价值源泉,在科研数据高价值的预期的激励下,参与的相关利益者合作,创造出新的价值。在数据管理过程中,利益相关者之间可以通过合作、政策支持等达到各自利益的满足,他们之间不是零和博弈的关系。每个参与的相关利益者对数据管理工作的支持,是数据管理工作得以成功和持续的保证。
围绕着科研数据,科研数据管理链需要以下要素的组合:必须要有上层决策与管理部门的战略规划;必须要有IT技术作为支撑,它为数据管理提供技术保障;最后还得有服务的介入,它为数据管理的顺利实施提供帮助,这是一个科研数据管理的互动链。科研数据必须成为人们共享利用的有效的数据,科研数据管理才是有意义的,否则就是无用功。针对科研数据管理,需要战略规划、技术支撑和服务嵌入这三个要素的协调,参与其中的相关利益者需要形成协作互动的关系,才能为科研数据管理实施提供动力支持。图2为科研数据管理相关利益者互动关系链条。
3.2.1战略规划层的互动
政策导向是科研数据管理成功与否的最主要的影响因素。战略规划层是科研数据管理中的决策首脑部门,为了科研数据管理的顺利实施和协调发展,国家政策制定机构和基金管理组织制定国家层面的数据管理开放政策,他们将这一政策通过相关机构的首脑层传递到各个研究机构,各个研究机构决策部门和科研管理部门对政策进行分析,制定全面且具体的科研数据管理的总体战略,组建一支凝聚力强的科研数据管理组织来开展科研数据管理工作,以提供全面的科研数据管理与服务,管理部门需要制定数据管理规划、参与的相关利益者的权益,数据基础设施的建设、数据管理支持等相关细则。营造数据共享氛围是科研数据管理规划能否顺利实施的主要影响因素之一。
科研数据管理的最终目的是帮助科研人员进行科研活动,实现数据的增值。然而,绝大部分的科研人员在数据管理和共享方面,因缺乏数据共享的理念和认识的不足而没有共享数据或共享的积极性不高。政策决策层通过数据共享的政策导向,例如,制定相关的政策法规,营造科研数据共享的氛围,以引导科研人员树立科研数据共享的理念。
3.2.2技术支撑层的互动
技术管理层是提供科研数据管理服务的支柱,在科研数据管理过程中发挥关键性作用,为此,管理层在科研数据管理规划阶段,需要构建科研数据管理的技术框架。数据中心或图书馆承担科研数据管理的技术支持工作。IT专家负责科研数据管理基础设施的建设。IT技术人员和图书馆员共同为科研数据管理做好技术保障,保证科研数据管理平台的有效运行。
在科学研究逐步转向数据密集型计算的科学研究第四范式的背景下,科研数据产生在科研活动的所有阶段里,科研数据管理也进入科研活动生命周期的整个过程中,对科研活动任何阶段产生的数据进行管理。在科研数据管理整个流程中,科研人员面临着诸多技术方面的难题,科研人员并不了解如何合理地处理他们自身的在科研活动过程中产生的科研数据,也不了解和擅长创建科研数据元数据,图书馆员在标引、分类以及创建元数据标准等信息组织方面有着丰富经验,能够针对不同类型的数据创建相应的元数据标准,如原始实验数据、编码数据、统计数据、问卷调查结果数据等。
因此,在科研数据管理过程中,图书馆员协助科研人员实施科研数据的转换、标引、分类、保存等,对数据集进行有效描述。IT技术人员凭借掌握的专业技术协助科研人员,对数据进行长短期保存和管理,为后续的数据共享做准备。同时,IT技术人员帮助科研人员对数据存储平台相关的技术疑难问题进行培训和解答。科研管理人员为科研人员提供数据收集方法、分析处理建议,学术交流专家提供数据共享中的版权和安全等问题的解决方案。
4结语
科研数据是科学发展的一个重要部分,科研数据管理核心问题是如何通过对科研数据管理过程的有效控制,来客观公正全面地反映参与其中的所有相关利益者的贡献,这也是科研数据管理是否可持续发展的重点,而其难点在于数据管理本身所关注的数据特有的不稳定性以及利益群体的非唯一性等。在现阶段,国内科研数据管理研究和实践都还处于起始阶段,其中涉及的主体和主体责任尚不明确,各相关利益者以什么样的角色参与,做什么具体工作还没有实践经验,人员的职责和组织的措施尚未清晰地规范。
对于参与科研数据管理的多数机构和人员,科研数据管理很可能是一项较新的挑战。了解科研数据相关利益者行为特征,将有助于科研数据管理的可持续性发展。因此,如何更好地理解科研数据管理的生命周期过程,如何更好地平衡和明晰科研数据管理中参与各方的权益、责任与互动关系,如何保障数据贡献者即研究人员的学术权利的同时又能方便数据用户更好地使用数据等,都值得进一步探讨与更多关注。
参考文献
[1]CoxA,VerbaanE,SenB.Anewroleforacademiclibrariansre⁃searchdatamanagement[J].MultimediaInformation&Technol⁃ogy,2012,38(4):29–30.
[2]EngineeringandPhysicalSciencesResearchCouncil[EB/OL].[2017-05-15].https://www.epsrc.ac.uk/.
[3]TenopirC,SanduskyRJ,AllardS,etal.Researchdataman⁃agementservicesinacademicresearchlibrariesandpercep⁃tionsoflibrarians[J].LibraryandInformationScienceRe⁃search,2014(36):84-90.
[4]ProposalsforSafeguardingGoodScientificPracticeRecommen⁃dationsoftheCommissiononProfessionalSelf-RegulationinScience[EB/OL].[2018-04-15].http://www.dfg.de/download/pdf/dfg_im_profil/reden_stellungnahmen/download/empfehlung_wiss_praxis_1310.pdf.
[5]PampelH,VierkantP,ScholzeF,etal.Makingresearchdatarepositoriesvisible:there3data.orgregistry[J].PlosOne,2013,8.11:e78080.
相关论文范文阅读:管理职称论文民政专项资金大数据管理研究
这篇管理职称论文发表了民政专项资金大数据管理研究,大数据时代的到来,民政专项资金管理趋向于更为高效管理模式,论文探讨了民政专项资金管理过程中存在的问题和作用,并分析了如何运用大数据对于民政专项资金进行管理。