Ouvrir, documenter et préserver

Vous trouverez ici comment ouvrir, documenter et préserver les données de recherche grâce aux entrepôts de données, et comment la Direction de la documentation peut vous apporter son soutien.

Du matériel supplémentaire au jeu de données

Les données de recherche liées aux articles sont souvent partagées sous la forme de supplementary material ou de supporting information. Ce mode de partage minimal ne favorise toutefois pas l’accessibilité ni la réutilisation des
données. Parfois inaccessibles sans abonnement à la revue comme dans l’exemple ci-dessous, les données diffusées de cette façon ne sont pas identifiées ni décrites en tant que telles. Leur réutilisation peut de plus être rendue difficile par le format sous lequel elles sont mises à disposition (unique fichier Word ou PDF compilant des tableaux et des figures par exemple), ainsi que par l’absence de conditions de réutilisation explicites.

supplementary data

Organisées en jeux, en datasets, documentées, décrites et identifiées, diffusées et archivées par le biais d’un entrepôt de données, les données de recherche peuvent être plus facilement trouvées, réutilisées et citées. Et ce d’autant plus qu’elles sont mises à disposition dans des formats ouverts et sous une licence de réutilisation claire.

Encart juridique

Le sélecteur de licence intégré au ser vice B2SHARE de l’infrastructure européenne EUDAT peut vous aider à choisir la licence la plus adaptée. Pour des informations détaillées s’agissant des aspects juridiques en lien avec la diffusion des
données de recherche, nous vous recommandons les contenus très riches produits par le Pôle IST de l’Ecole des Ponts - ParisTech, accessibles à partir de la page Données de la recherche. Contexte juridique de l’Espace chercheurs ENPC.

Des données identifiées et indexées dans les outils de recherche

Les données de recherche intègrent ainsi les outils de recherche bibliographique traditionnels. L’encart Related Research Data de Scopus exploite les liens entre les DOI des articles et des jeux de données associés.

Source image : Espace chercheurs ENPC. Repéré à https://espacechercheurs.enpc.fr/fr/donnees-recherche-aspectstechniques

Dans PubMed, le filtre [data] permet d’afficher uniquement les articles auxquels des jeux de données sont associés (voir l’annonce dans le bulletin technique de la NLM d’avril 2018). Dans PubMed Labs,il s’agit d’un attribut accessible dès le haut d’une liste de résultats.

pubmed labs

Ces fonctionnalités permettent d’identifier les jeux de données liés à des articles. Il existe également des outils spécialisés, permettant de retrouver plus largement tous les jeux de données, y compris ceux qui ne sont pas liés à des publications. Mentionnons ainsi DataciteSearch (en accès libre), B2FIND (en accès libre) ou Web of Science - Data Citation Index (moyennant souscription - pas d’abonnement à l’UB). DataCite fait partie des sources interrogées par notre outil de recherche Babord+. Le filtre "Jeux de données" permet d’afficher uniquement les résultats de recherche provenant de cette source.

[image]

Référence du jeu de données utilisé dans cet exemple de recherche dans Babord+ :
Delmas, C. E. L. et al. (2017). Data from: Soft selective sweeps in fungicide resistance evolution: recurrent mutations without fitness costs in grapevine downy mildew [Dataset]. Dryad Digital Repository. https://doi.org/10.5061/dryad.vp8n9

Comment choisir un entrepôt de données ?

La démarche recommandée consiste à :

Plusieurs critères entrent en ligne de compte pour le choix d’un entrepôt de données approprié, tels que les formats pris en charge, les possibilités d’indexation ou encore les modes d’accès paramétrables (accès libre, restreint, avec embargo). Privilégier des entrepôts de données certifiés permet d’orienter le choix ; le filtre Certificates du portail re3data.org facilite le repérage de ces entrepôts.

Le site Repository Finder permet de visualiser rapidement une liste des entrepôts de données répondant aux principes FAIR.

Un atelier Déposer ses données dans un entrepôt de données, animé par Frédérique Bordignon (École des Ponts ParisTech) a été organisé en mai 2018 à Bordeaux dans le cadre de la journée Des outils pratiques pour gérer et
valoriser vos données de recherche. Le support est disponible en ligne : https://doi.org/10.5281/zenodo.1256734.

Comment pouvons-nous vous aider ?

La direction de la documentation peut notamment vous aider concernant les points suivants, dans l’objectif de rendre vos données les plus faciles à trouver, accessibles, interopérables et réutilisables, c’est-à-dire conformes aux principes
FAIR.

  • Entrepôts de données : repérer et utiliser des entrepôts de données pour trouver et/ou déposer des données.
  • Documentation des données : produire une documentation structurée et/ou une documentation informelle minimale en utilisant le plus possible des outils standardisés (formats de métadonnées, vocabulaires contrôlés, etc.).
  • Citation des données : citer des jeux de données, rédiger un data availability statement, etc.
  • Prise en compte de tous ces éléments dans la rédaction de documents tels que le plan de gestion de données (DMP – data management plan).

Pour en savoir plus concernant les principes FAIR, consultez la page "FAIR et DMP" de ce site web.
Pour une première approche des principes FAIR, le poster ci-dessous vous présente comment et pourquoi prendre en compte ces principes à chacune des étapes d’un projet.

Source : Danish e-Infrastructure Cooperation. (2018). The path to a successful research project - How to get on the right track with FAIR data management. Repéré à https://videnspor tal.deic.dk/en/FAIR#Why FAIR - and how? - CC-BYSA 4.0 Attribute: ‘DK Fair på tværs’

Mise à jour le 12/06/2019