我们相信,数据应该是开放的、可获取的和可重复使用的。数据共享有助于加快科学发现的步伐,并给社会带来益处。
作为学术界积极的合作伙伴,施普林格·自然正在开拓数据共享和开放数据的新方法。我们致力于支持研究人员共享数据,并促使数据共享成为新常态。
公开分享研究数据的好处:
全球开放数据现状: 2016年,施普林格·自然、Figshare与Digital Science合作推出了“开放数据现状”(State of Open Data)调研,是目前关于开放数据持续时间最长的纵向研究,也是同类型中规模最大的全球性调研,旨在考察研究人员使用开放数据的态度和经验,科研人员处理研究数据的方式,他们及其所在机构在数据上面临的挑战,以及共享数据对工作量和资源的影响。
在最新的2021年“开放数据现状”报告中,我们分析了来自全球科研群体的4200多份答复,获得了关于研究人员对开放数据的动机、挑战、看法和行为的详细见解。
主要发现总结如下:
在今年的调查中,表示担心数据被滥用、分享数据得不到足够的认可或不确定版权和使用许可的受访者比例与往年相比有所上升。
过去四年对数据共享的担忧。来源:《2021年开放数据现状》调查报告
65%的受访者表示,他们从未因分享数据而获得过认可。数据共享的主要动机包括,论文可获得引用(19%),自己是论文合著者(14%),增加研究的影响力和可见度(11%),以及公共利益(11%)。
尽管对数据的滥用和许可存在担忧,但66%的受访者表示听说过FAIR(可发现、可获取、可互用和可再用)数据原则,28%的受访者熟悉这些原则,这是2018年首次提出这一问题以来的最高数字。超过一半的受访者(54%)认为他们的数据非常符合或在一定程度上符合FAIR原则,也是自2018年首次提出这一问题以来的最高数字。这些发现表明,如果数据能够尽可能地被获取和再利用,从长远来看,对共享数据的担忧可能会减少。 另外,在熟悉FAIR数据原则的人中,58%的人曾再利用过自己的数据,44%的人曾再利用过其他研究团体分享的可公开访问的数据。这表明,符合FAIR原则的数据有可能被重新使用。
如果在开放研究数据方面需要获取帮助,35%的人依靠存储平台,34%的人依靠出版机构,30%的人依靠机构图书馆。 版权和许可方面仍需要最多的支持(55%),寻找合适的存储平台(46%)和数据管理政策(43%)也是受访者需要支持的方面。 机构也可以提供更多关于如何遵守其开放数据政策的指导,58%的受访者表示他们希望得到机构的更多指导。
中国的开放数据现状
2019年,我们与中国科学院文献情报中心合作发布了白皮书《数据分享在中国的挑战和机会》,共有2000多位中国科研人员参与了调研。 白皮书显示,整体上有大量科研人员(93%)曾制定过数据管理计划(DMP),但频率差别很大,仅有58%的科研人员在一半或多于一半的科研项目中会制定DMP,这低于另一类似调查所显示的70%的全球平均水平。
DMP是一个详细说明研究数据将如何收集、存储和分享的计划。有36%的科研人员表示很少制定DMP。48%的科研人员表示首先期望所在研究机构为其提供相关指南和帮助。 DMP中的关键内容是关于数据的存储、收集和分享。只有21%的科研人员将数据分享纳入其中。但多数科研人员都认为数据分享是重要的,有79%的回复者将数据的可发现性认为是至少有些重要,这与全球水平相当。 受访科研人员仅有7%从未私下或公开地分享过数据。中国科研人员更普遍的是与自己的直接同事和合作者私下分享数据,而非公开分享数据。
促使科研人员分享数据的两大主要原因是“推动所在领域科研进展”(46%)和“提高自己研究的可见性”(44%)。35%的人认为期刊不做要求是科研人员没有分享数据的主要原因,而“担心别人滥用我的数据”(48%)和“不确定版权和许可”(32%)是科研人员在分享数据时的主要担忧。
您的研究数据很有价值!没有它,其他研究人员就无法学习和借鉴您的研究。有价值的知识不应只存放在个人的电脑或U盘里。 共享数据不仅可以满足资助者或机构在研究数据方面的要求,还可以为他人的研究建立基础,推动学科领域的发现并为公共利益做出贡献。 施普林格·自然致力于支持研究人员分享研究数据并获得应得的认可。以下服务使您的研究数据分享更快、更容易、更具影响力。
数据存储库通常是分享研究数据的首选方式。与通过补充信息文件来共享数据相比,数据存储库使数据更容易获取和发现,并且可以在类似的数据集中进行搜索。存储库通常还提供标准化的数据结构和识别方法,并支持特定领域的数据报告标准。 如果您不确定可以把研究数据储存在哪里,我们推荐了一系列学科储存库和通用储存库。可能的话,数据应提交给特定学科、广受认可的存储库。如果没有合适的,可以将数据上传至通用数据存储库,包括由大学、资助者或机构为其附属研究人员提供的数据存储库。作者也可寻求特定期刊的指导,或咨询其是否有相关的建议,因为施普林格·自然旗下的一些期刊有自己的研究数据储存库。
地球、环境与太空科学数据存储库,其中也包括国家青藏高原科学数据中心
最近,施普林格·自然与Figshare存储库联合推出了一项免费的试验项目,以更好地支持作者公开分享数据。通过该项目,作者在向《自然》系列研究期刊和nature.com上的学术期刊投稿时,可轻松地通过Figshare选择参与数据共享,并融入一体化的投稿流程。在您的论文发表之前,您的数据将私密地存放在Figshare平台,随时可以查看和修改,并且您对数据拥有所有权,如果相关论文未被接受,您可以选择继续存放或删掉您在figshare上的数据。
加入到全球科研人员关于研究数据的对话中来!在研究数据社群(researchdata.springernature.com),作者、研究者、编辑、决策者以及我们的研究数据团队会积极分享他们在数据管理、共享和再利用等方面的经验、资源、资讯和行业动态,以期推动开放数据和更好的研究数据实践。
如果您对研究数据及其共享有任何疑问,我们提供免费的咨询服务(springernature.com/gp/authors/research-data/helpdesk)以及对常见问题的解答,如:期刊要求分享的数据包含什么?如何为您的论文撰写数据可用性声明,有哪些例子和模板可借鉴?可否在论文发表之前就发布数据?如何引用数据?……
依托《自然》丰富的学术出版经验,我们开发了一系列专业的科研培训在线课程,为处于事业不同阶段的科研人员提供全球优秀期刊编辑和专家的直接指导,其中就包括“研究数据管理”、“数据分析:筹备”、“数据分析:实施”等相关课程。机构可以为研究人员订阅自然大师课堂的在线课程,帮助他们更加轻松、高效地使用和再利用研究数据,进而提升机构产出和可见度。
通过数据出版,我们的目标是使科学数据更加可重复使用、可发现、可解释和可引用。 许多施普林格·自然期刊都提供特定形式的数据文章,我们还出版了两本覆盖更广范围的专门数据期刊:Scientific Data(《科学数据》)和BMC Research Notes。 Scientific Data是Nature Portfolio旗下一本开放获取在线期刊,致力于发表具有科学价值的数据集描述,以及能促进科学数据共享和再利用的研究文章,涵盖自然科学、医学、工程和社会科学各个领域。其宗旨是促进更广泛的科学数据共享和再利用,并对共享数据的作者给予版权和认可。
Scientific Data发表论文的主要类型为Data Descriptor,意为对数据的详细描述,其描述对象可以是实验数据、观察数据、计算数据、处理后数据等,除了对数据进行描述,它还将数据进行结构化管理以便于数据的解读、搜索以及对原始数据的再利用。 Data Descriptor是否被Scientific Data接收与数据集相关结果的影响力或新颖性无关。事实上,Data Descriptor的内容并不包括深入的分析或新的科学结论。我们更看重的是作者生成数据的实验或程序是否严格以及技术质量是否过关,必要时我们会要求作者提供质量控制实验的资料。
BMC Research Notes是一本开放性期刊,发表来自所有科学和临床学科的同行评审稿件,包括复杂的初步观察、对以前工作和既定方法的更新、有效的负面结果,以及科学数据集和描述,即文章类型涵盖Research note和Data note两种。我们致力于通过为有价值的数据和研究观察提供一个包容性的平台,使查找、引用和分享简单报告更加容易。
您可以发表任何数据的Data note,可以是论文中未发表的数据,也可以是没有用进论文中的数据,或者是您计划在未来的研究中使用的数据,包括电子表格、视频、图像、音频、地图、代码、文档等。 所有BMC Research Notes的出版内容,包括Data note,都被MEDLINE、PubMed、PubMed Central、SCImago、Scopus和许多其他平台收录。文章还可以通过BMC和SpringerLink网站获得,以使您的研究具有尽可能大的可发现性。