研究数据管理
我们提供援助的研究数据管理通过研究生命周期包括数据组织、存储和共享。这个页面上可以找到指导上述主题和如何回答的一般问题(DMP)的数据管理计划。
数据管理计划

数据管理计划(DMP)应该描述数据如何管理期间以及之后的活跃阶段研究项目。这个计划应该被更新为研究项目的发展。你的研究数据管理实践的目标应该是提供可重用的数据,它遵循公平原则,也就是说,你的数据应该是可发现的,访问,的互操作性和可重用。

DMP的一部分的研究计划。为了避免重叠DMP和研究计划,您可以参考从一个文档移到另一个。引入数据分析和其他方法在你的研究计划。

研究数据管理和规划良好的研究实践不可分离的部分年代。数据管理的目的是

  • 识别和控制风险,
  • 注意数据保护和信息安全,
  • 同意关于数据所有权、分享,和保存,以及
  • 确保必要的资源和设备是可用的。

在DMP数据理解为一个广义的概念,包括:

创建一个数据管理计划

  • 第一次阅读所有的问题!
  • 使用DMP来补充你的研究计划,避免重叠和参考之间的计划。
    • 研究计划描述了科学、分析和方法处理数据。
    • 数据管理计划描述数据的技术和行政管理。
  • DMP表明你可以识别、预测和处理相关数据管理流程的风险。
  • 按照组织或资助者的需求。
  • 至少回答的主要类别。如果一个特定的问题并不适用于你的情况下,证明为什么不。
  • 包括背景信息,如申请人和项目的名称,项目编号,资金计划和DMP的版本。

研究数据管理指导

下面是赫尔辛基大学研究数据管理的指导方针,补充国家研究数据管理指导。bob体育下注安卓版国家指导DMPTuuli和Zenodo可用。您可以使用DMPTuuli一个在线工具,创建你的数据管理计划。

研究数据

讨论以下你的答案:

  • 什么样的数据将使用和产生的项目吗?如果你使用敏感数据,请参阅部分:指导敏感数据
  • 文件格式将数据是什么?
  • 大约多少数据项目,如在g或样品的数量?
  • 你会使用或开发特殊的软件吗?

为最佳实践

列出你的数据在以下方式使用要点或一个表。这个计划是基于描述数据类型。如果你使用分类或缩写来描述数据,这将是更容易为你指的是特定的数据集的计划。

列表中数据类型格式的例子:

1。在这个项目中收集的数据

  • 问卷x . pdf文件格式,大小5 GB
  • DNA样本(澄清的起源,人类或其他生物),物理样品,大小n = 500
  • 图片/视频关于x, jpg文件格式,.avi、大小1 TB

2。数据生成过程的一个结果

  • 分析问卷x, pdf格式,.xlsx 2 GB
  • DNA序列/分析、FASTA . txt, .xlsx 2 TB
  • 文档的数据(调查形式,电报密码本,实验室笔记本,readme文件)

3所示。以前收集现有的数据在这个项目中重用

  • 从生物样品
  • 数据统计芬兰,数据库,10 GB
  • 调查数据来自芬兰社会科学数据库艾拉
  • 面试或语言语料库从芬兰银行的语言

至关重要的是识别敏感的数据类型,数据管理计划包括识别和管理这些数据的风险。如果你的数据包含个人数据,你需要确定控制器。可以找到更多的信息数据保护指南研究人员(Flamma)和额外的指令来管理敏感数据

敏感数据是可以造成伤害如果透露的信息。这些数据是:

  • 个人资料:
    • 个人资料包括所有一个人可识别的标识符直接间接
    • 直接标识符:姓名、电话号码、社会安全号码,图片,声音,指纹,牙科图表等
    • 间接的标识符:性别、年龄、教育、职业、国籍、工作历史,系统日志历史、婚姻状况、居住信息,汽车牌照号码,看来,心理或生理功能等。
  • 敏感的个人信息信息:
    • 特殊类别的个人资料:
      • 数据揭示种族或民族起源、政治观点、宗教或哲学信仰或工会会员
      • 基因数据
      • 生物数据处理为目的的唯一识别一个人
      • 有关健康的资料
      • 数据涉及一个人的性生活或性取向
    • 其他敏感的个人信息:
      • 数据描述的经济或社会地位
      • 位置数据
      • 通讯数据
      • 行为
      • 其他数据,尤其是个人如笔记和日记
  • 物种的敏感信息,如濒危动物、植物、自然保护区或生物安全(鳍)。
  • 其他机密信息,如专利、军事信息,组织信息或商业秘密。

讨论了风险参与控制数据完整性质量以及他们是如何管理的。注意,数据质量和质量的研究方法是两个截然不同的礼仪。

为最佳实践

描述以下做法,如果他们是或将在使用:

  • 你用的是什么工具,数据管理,如电子实验室笔记本或数字形式的调查?
  • 的研究团队是熟悉并实践如何?
  • 验证的方法,或者质量控制管道在使用吗?
  • 音标的音频或视频采访他人检查誊写员吗?
  • 正在校验和使用?
  • 数字化模拟或物理材料应该具有足够的精度。
  • 在所有的转换,保持原始信息内容应该保障。
  • 讨论如何最小化、pseudonymisation和匿名化影响数据质量。
道德和法律遵从性

你的数据包括个人信息吗?你的工作与动物需要一个道德允许吗?你工作比上面描述与其他机密或敏感数据(例如,濒危物种(鳍)、保护区、军事信息)?

描述你将如何保持高的道德标准和管理你的研究数据时遵守相关法规。的风险是什么,它们是如何管理的?

为最佳实践

注:最下面的链接需要登录的用户帐户。

  • 解释为何你有权收集、处理,并保存数据,涉及到道德问题,例如,你已经过了一个伦理审查。
  • 如果你处理个人信息(更多技巧背后的链接):

描述已经同意关于数据的使用权。考虑是否有权利属于第三方。预测什么许可证将被打开时使用的数据。

指导关于数据所有权和许可证

  • 数据所有权取决于研究经费。确保必要的协议已经开始的项目(数据所有权和作者)。
    • 许多资助机构(芬兰科学院,欧盟要求数据所有权转移到大学。
    • 说明达成协议(Flamma)
  • 使用许可开立您的数据重用(如研究数据、代码、软件)。
文件和元数据

文档意味着描述数据,即。,these documents explain what data the project has and where the data originates from.

文档包括数据字典(解释变量和代码)和readme文件。其它重要的问题包括文件命名约定、版本控制和目录结构。有标准方法用于文档称为元数据标准,如果适合,则应该使用数据。这些会增加数据的价值,使其更容易重用。

为最佳实践

  • 元数据标准:许多存储服务需要使用一个标准的数据保存。因此,如果你知道你会公开数据,检查他们的标准要求。
  • 数据管理软件,即。,数据bases and an electronic laboratory notebook
  • 数据字典,解释变量,或代码书,收集所有的代码和计算使用。
  • 文件命名约定
  • 目录结构:记住,如果元数据,即。,file, directory, or variable names, include sensitive data or personal information, they need to be handled accordingly.
  • 自述文件(s)提供数据文件的信息,以确保他们正确地解释。
  • 版本控制
将数据存储和访问控制

您的数据将存储和在哪里备份在项目吗?负责备份?制定一个计划和你的合作伙伴和确保安全的数据传输。

为最佳实践

  • 使用它提供的服务和维护的赫尔辛基大学:bob体育下注安卓版存储解决方案表
    • 更多信息:帮助台&CSC服务对数据存储
    • 例如使用个人/组的存储空间年代,维护和备份(每小时)嗯信息技术中心
    • 云存储选项:使用呃OneDrive业务或团队云,而不是商业服务(例如,Google drive / Dropbox)。
    • 不使用外部硬盘驱动器的主要存储选项。

你的项目有足够的存储空间吗?如果没有,请联系帮助台电话:+ 358(0)941 55555或2helpdesk@helsinki.fi

  • 如果你处理敏感数据:
    • 确保您的存储是足够安全的数据,如专用的呃或CSC安全存储空间(存储服务器,Umpio ePouta…)。
    • 不要使用云存储由于其数据保护不足!
    • 加密:如果需要,尤其是移动设备、便携式和外部存储设备应该加密的使用,例如,Cryptomator
    • 请联系datasupport@helsinki.fi如果你不确定数据保护。
  1. 负责控制对数据的访问是谁?
  2. 访问控制将如何进行?有一个IT解决方案(例如,密码保护,使用日志,或一些物理解决方案(文件柜)在使用?
  3. 他的研究小组能够访问哪些数据?
  4. 为什么每个存取权(编辑、观看、删除)被授予?
  5. 告诉如何信息安全和风险敏感数据被考虑。将敏感数据被存储在一个加密的形式?下面有更多的技巧。

为最佳实践

  • 如果您使用个人或共享网络开车,你可以很容易地控制访问权限。
  • 敏感数据的访问控制应考虑。数据处理和传输需要符合权限。
  • 访问控制:必须有一个用户列表和所有权利,和撤销程序的权利。
  • 监控:如何将数据使用期间监测研究:可以使用的技术设备日志时,和什么数据?让它自动使用日志提供什么样的服务。
  • 安全的前提:检查锁选项的工作区,安全的储物柜和衣柜,相机和访问监测
开放数据和研究项目后长期保存

的哪部分数据将打开/发表吗?数据将在哪里开的呢?存储库名称。这数据是可用的?将一些数据被摧毁的一部分吗?

如果您的数据不能打开,解释为什么,告诉项目元数据将被打开。

小贴士打开包含个人信息的数据

  • 开放和共享个人数据是决定例如:研究参与者被告知什么数据收集,研究参与者是否给他们明确的同意,或在什么样的形式和目的是打开或共享的信息。
    • 当打开时,你必须确保信息被妥善保护,在可能的情况下,pseudonymize或匿名化的信息。
    • 主体的同意是所需的材料,研究的参与者直接识别。
    • 在某些情况下,最初的材料可能是共享的目的。如果你打算分享的个人数据,请联系大学研究律师(researchlawyers@helsinki.fi)。
  • 尽管数据包括个人信息不能打开,它元数据不包含敏感信息,应该打开。

为最佳实践

  • 选择合适的存储库共享和开放你的数据已经在项目的开始。检查存储库数据满足要求。
  • “作为一个规则,研究数据的支持下产生赫尔辛基大学和发表相关研究结果是开放和共享使用。bob体育下注安卓版研究数据的可发现性和citability必须保证。”(bob体育下注安卓版赫尔辛基大学研究数据的政策)
  • 打开数据在哪里?
  • 如果你不能打开数据,打开你的关于你的项目数据的元数据,例如,Zenodo或在国家Etsin
  • 选择存储库使用持续的标识符(瓮DOI)。
  • 记得给你的数据一个许可证(见2.2)

长期保存意味着数据保存超过25年。如果您的数据有长期价值:

  1. 归档数据的一部分是什么?
  2. 会存档在哪里?
  3. 数据被保留多长时间?
  4. 有一些成本相关的存档吗?谁照顾他们?
  5. 将一些数据被摧毁的一部分吗?

归档计划组成部分的研究质量和透明度。

为最佳实践

  • 当数据被创建时,它是重要的考虑多长时间将被保留下来。
  • 检查publisher-related保存时间要求,如果你计划出版的杂志要求打开您的数据。
  • 检查专门规程和funder-related保存时间要求。
  • 个人数据也可以存档。当转移研究材料包含个人资料存档,个人识别应该尽可能被删除,除非有适当的理由存档,由于数据的性质。受试者必须通知的存档和归档所基于的基础。适当的保护个人数据,即谁有权访问的数据和原因,必须继续被考虑当归档材料。
  • 生物样品可以存储在生物银行。
  • Fairdata-PAS是一个保存的地方为全国数十或数百年来有价值的数据。
数据管理职责和资源

概括和描述这里的角色和职责。回答下列问题:

  • 数据管理职责分配给一个人,或者是整个研究小组参与其中?
  • 你怎么不同党派之间共享任务如果你工作在研究财团?
  • 谁负责数据ptotection ?
  • 如果数据包含个人数据信息、列表允许个人和组织处理个人信息和他们的不同的角色
  • 谁负责数据保护和访问数据?

为最佳实践

  • 当你管理数据遵循共同的实践(文档、元数据存储和共享)
    • 确保每个人都必要实践和训练的,每个人都遵循相同的做法。
    • 注意谁负责更新DMP文件当你做出决定或改变你的练习。
    • 人或组织的名单负责不同的数据管理任务。
    • 你需要小组成员的名字/同事/人允许处理个人数据信息和他们不同的角色(控制器,关节控制器,处理器)
    • 哪一个你或相关组织将负责项目后的数据吗?

描述需要什么资源(时间和成本)数据管理?彻底的计划在开始和末尾的项目意味着更少的工作准备数据时打开和保存。

为最佳实践

  • 估计是否需要专家帮助或助理为数据管理、数据保存、数据共享任务。
  • 给出一个估计的数据文档和清洁需要多少时间准备打开的数据(而不是结果):1 - 2 h每周、每月一天,出版前1 - 2周,或者其他时间估计。
    • 数据文档和清洗方法,例如,生产的元数据(3.1节),匿名敏感数据,整理数据,数据传输等。
    • 我们建议保持文档更新整个项目生命周期。
  • 分配时间和资金也如果你需要匿名化,保护或破坏敏感数据。

  • 指定您的数据管理成本预算根据资助者要求。