L'essentiel

Quelques éléments introductifs concernant la terminologie, les enjeux et les activités liés à la gestion et au partage des données de recherche.

Terminologie

Entendues au sens large, les données de recherche englobent toutes les données collectées, générées ou étudiées dans le cadre des activités de recherche et à des fins de recherche, i. e. pour produire, documenter et valider les résultats de recherche. Il peut s’agir de chiffres, de textes, d’images, de sons, de code informatique, etc.

Différentes typologies permettent de caractériser plus spécifiquement les données de recherche, selon que l’on les envisage du point de vue de leur mode de production ou du point de vue de leur degré d’achèvement par exemple.

  • Typologie selon le mode de production : données d’observation, expérimentales, de simulation, données dérivées ou compilées.
  • Typologie selon le degré d’achèvement : des données "brutes" aux données publiées.

Enjeux

Source : Higman, R. (2017). Talking carrots and sticks for RDM at the #datastewards networking day, sharing the graphic on reasons to share we use in @UoMRDMSer vice trainingpic.twitter.com/bMsj6h57RG [Tweet]. @RosieHLib. Repéré à https://twitter.com/RosieHLib/status/936587668607160320

 

Rendre accessibles et réutilisables le plus largement possible les données de recherche répond à différents enjeux.

  • Innovation et collaboration : il s’agit de favoriser la réutilisation des données pour de nouvelles applications potentielles et la création de nouvelles collaborations, entre créateurs et utilisateurs des données.
  • Préservation et réduction des coûts : il s’agit de préserver des données uniques et/ou coûteuses à produire, mais également d’éviter des coûts liés à la duplication de données existantes et plus largement à la perte de données. Chacun connaît des anecdotes telles que celles relatées par Peter Brewer, le rédacteur en chef de la revue JGR : Oceans, dans un éditorial intitulé “Do You Expect Me to Just Give Away My Data?”.

Brewer, P. (2017). “Do You Expect Me to Just Give Away My Data?” Eos, (98).

  • Transparence : il s’agit de faciliter la reproduction et la réplication, de permettre de vérifier et de préciser des résultats, de décourager la fraude, etc.
  • Valorisation : il s’agit de générer une reconnaissance directe pour les chercheurs qui ont produit les données, au travers de la publication de data papers par exemple et a minima par l’adaptation des pratiques de citation. Certaines revues promeuvent non seulement la citation des jeux de données en tant quels, mais encore les intègrent dans la bibliographie principale de l’article. La revue Scientific Data détaille cette nouvelle politique dans l’éditorial Data citation needed , illustrée par la référence 21 de l’article Field-recorded data on habitat, density, growth and movement of Nephrops norvegicus.

Data citation needed. (2019). Scientific Data, 6(1), 27.

Power, A. M. et al. (2019). Field-recorded data on habitat, density, growth and movement of Nephrops nor vegicus. Scientific Data, 6(1), 7.

Activités

Diffuser les données de recherche s’insère dans le cycle de vie et de gestion des données. Le tableau ci-dessous identifie les principales activités impliquées, ainsi que différents niveaux d’engagement et de pratique pour chacune d’elles.

Ad Hoc

One-Time

Active and Informative

Optimized for Re-Use

Planning your project

When it comes to my data, I have a "way of doing things" but no standard or documented plans.

I create some formal plans about how I will manage my data at the start of a project, but I generally don't refer back to them.

I develop detailed plans about how I will manage my data that I actively revisit and revise over the course of a project.

I have created plans for managing my data that are designed to streamline its future use by myself or others.

Organizing your data

I don’t follow a consistent approach for keeping my data organized, so it often takes time to find things.

I have an approach for organizing my data, but I only put it into action after my project is complete.

I have an approach for organizing my data that I implement prospectively, but it not necessarily standardized.

I organize my data so that others can navigate, understand, and use it without me being present.

Saving and backing up your data

I decide what data is important while I am working on it and typically save it in a single location.

I know what data needs to be saved and I back it up after I'm done working on it to reduce the risk of loss.

I have a system for regularly saving important data while I am working on it. I have multiple backups.

I save my data in a manner and location designed maximize opportunities for re-use by myself and others.

Getting your data ready for analysis

I don't have a standardized or well documented process for preparing my data for analysis.

I have thought about how I will need to prepare my data, but I handle each case in a different manner.

My process for preparing data is standardized and well documented.

I prepare my data in such a way as to facilitate use by both myself and others in the future.

Analyzing your data and handling the outputs

I often have to redo my analyses or examine their products to determine what procedures or parameters were applied.

After I finish my analysis, I document the specific parameters, procedures, and protocols applied.

I regularly document the specifics of both my analysis workflow and decision making process while I am analyzing my data.

I have ensured that the specifics of my analysis workflow and decision making process can be understood and put into action by others.

Sharing and publishing your data

I share the results of my research, but generally I do not share the underlying data.

I share my data only when I'm required to do so or in response to direct requests from other researchers.

I regularly share the data that underlies my results and conclusions in a form that enables use by others.

Because of my excellent data management practices, I am able to efficiently share my data whenever I need to with whomever I need to.

Source : Borghi, J. et al. (2018). Support Your Data: A Research Data Management Guide for Researchers. Research Ideas and Outcomes, 4, e26439.

Mise à jour le 19/11/2019