Ouvrir, documenter et préserver
Comment ouvrir, documenter et préserver les données de recherche grâce aux entrepôts de données, et comment la Direction de la documentation peut vous apporter son soutien.
Du matériel supplémentaire au jeu de données
Les données de recherche liées aux articles sont souvent partagées sous la forme de supplementary material ou de supporting information. Ce mode de partage minimal ne favorise toutefois pas l’accessibilité ni la réutilisation des données. Parfois inaccessibles sans abonnement à la revue comme dans l’exemple ci-dessous, les données diffusées de cette façon ne sont pas identifiées ni décrites en tant que telles. Leur réutilisation peut de plus être rendue difficile par le format sous lequel elles sont mises à disposition (unique fichier Word ou PDF compilant des tableaux et des figures par exemple), ainsi que par l’absence de conditions de réutilisation explicites.
Organisées en jeux, en datasets, documentées, décrites et identifiées, diffusées et archivées par le biais d’un entrepôt de données, les données de recherche peuvent être plus facilement trouvées, réutilisées et citées. Et ce d’autant plus qu’elles sont mises à disposition dans des formats ouverts et sous une licence de réutilisation claire.
Encart juridique
Le sélecteur de licence intégré au ser vice B2SHARE de l’infrastructure européenne EUDAT peut vous aider à choisir la licence la plus adaptée. Pour des informations détaillées s’agissant des aspects juridiques en lien avec la diffusion des données de recherche, nous vous recommandons les contenus très riches produits par le Pôle IST de l’Ecole des Ponts - ParisTech, accessibles à partir de la page Données de la recherche. Contexte juridique de l’Espace chercheurs ENPC ainsi que l’arbre « Aide à la décision sur la diffusion des données de recherche » conçu et développé par le CiradCentre de coopération internationale en recherche agronomique pour le développement .
Des données identifiées et indexées dans les outils de recherche
Les données de recherche intègrent ainsi les outils de recherche bibliographique traditionnels. L’encart Related Research Data de Scopus exploite les liens entre les DOI des articles et des jeux de données associés.
Source image : _Espace chercheurs ENPC_.
Dans PubMed, le filtre Associated data permet d’afficher uniquement les ar ticles auxquels des jeux de données sont
associés. Il s’agit d’un attribut accessible dès le haut d’une liste de résultats.
Ces fonctionnalités permettent d’identifier les jeux de données liés à des articles. Il existe également des outils spécialisés, permettant de retrouver plus largement tous les jeux de données, y compris ceux qui ne sont pas liés à des publications. Mentionnons ainsi DataciteSearch (en accès libre), B2FIND (en accès libre) ou Web of Science - Data Citation Index (moyennant souscription - pas d’abonnement à l’UB). DataCite fait partie des sources interrogées par notre outil de recherche Babord+. Le filtre "Jeux de données" permet d’afficher uniquement les résultats de recherche provenant de cette source.
Référence du jeu de données utilisé dans cet exemple de recherche dans Babord+ :
Delmas, C. E. L. et al. (2017). Data from: Soft selective sweeps in fungicide resistance evolution: recurrent mutations without fitness costs in grapevine downy mildew [Dataset]. Dryad Digital Repository.
Comment choisir un entrepôt de données ?
La démarche recommandée consiste à :
- privilégier un entrepôt de données disciplinaire s’il en existe un - par exemple PANGAEA, 4TU.ResearchData, NAKALA ou Harvard Dataverse ;
- recourir à un entrepôt généraliste, tels que Zenodo ou B2SHARE.
Plusieurs critères entrent en ligne de compte pour le choix d’un entrepôt de données approprié, tels que les formats pris en charge, les possibilités d’indexation ou encore les modes d’accès paramétrables (accès libre, restreint, avec embargo). Privilégier des entrepôts de données certifiés permet d’orienter le choix ; le filtre Certificates du portail re3data.org facilite le repérage de ces entrepôts.
Outil d'aide au choix d'un entrepôt de données
Notre outil d'aide à la décision Trouver un entrepôt de données peut vous aider à identifier l'entrepôt de données généraliste qui réponde le mieux à vos besoins.
Pour des informations complètes concernant la méthode et les outils pour choisir un entrepôt de données, consultez le support de notre atelier des BU Zenodo, Figshare, etc.: rechercher et partager des données de recherche grâce aux entrepôts de données.
Comment pouvons-nous vous aider ?
La direction de la documentation peut notamment vous aider concernant les points suivants, dans l’objectif de rendre vos données les plus faciles à trouver, accessibles, interopérables et réutilisables, c’est-à-dire conformes aux principes
FAIR.
- Entrepôts de données : repérer et utiliser des entrepôts de données pour trouver et/ou déposer des données.
- Documentation des données : produire une documentation structurée et/ou une documentation informelle minimale en utilisant le plus possible des outils standardisés (formats de métadonnées, vocabulaires contrôlés, etc.).
- Citation des données : citer des jeux de données, rédiger un data availability statement, etc.
- Prise en compte de tous ces éléments dans la rédaction de documents tels que le plan de gestion de données (DMP – data management plan).
Pour en savoir plus concernant les principes FAIR, consultez la page "FAIR et DMP" de ce site web.
Pour une première approche des principes FAIR, le poster ci-dessous vous présente comment et pourquoi prendre en compte ces principes à chacune des étapes d’un projet.
Source :Danish e-Infrastructure Cooperation. (2018). _The path to a successful research project - How to get on the right track with FAIR data management_.- CC-BY-SA 4.0 Attribute: ‘DK Fair på tværs’