Rédiger un plan de gestion de données

Qu’est-ce qu’un PGD (ou DMP) ?

Un Plan de Gestion de Données (PGD ou DMP pour Data Management Plan en Anglais) est un document qui vise à expliquer les différentes étapes du cycle de vie des données en indiquant comment celles-ci seront gérées, de la production jusqu’à la publication. Le PGD aide les chercheurs à organiser et à anticiper les différentes étapes en se posant les bonnes questions sur la gestion de leurs données. Il se présente généralement sous la forme d’un formulaire organisé en une suite de questions. Les réponses à ces questions constituent le PGD et aident à expliquer ce qui est prévu pour chaque jeu de données à chaque étape du cycle de vie.
Le PGD aborde aussi bien les questions juridiques, éthiques, budgétaires, que les aspects relatifs à la responsabilité et à la sécurité des données.

Pourquoi rédiger un PGD (DMP) ?

  •  Le PGD est un document livrable demandé par les financeurs (ANR, Horizon Europe etc.) dans le cadre de l’évaluation des projets de recherche.
  •  C'est un gage de qualité de la recherche.
  •  Il accompagne la FAIRisation des données en facilitant la découverte des données, leur accessibilité, leur interopérabilité et leur réutilisation.

L’enjeu du PGD est de montrer que les données sont produites et gérées selon les « bonnes pratiques », de la collecte jusqu’à la publication, dans un « cadre éthique et juridique » selon le principe FAIR (Facile à trouver, Accessible, Interopérable et Réutilisable). Toutefois, il est important de noter que le principe «aussi ouvert que possible, aussi fermé que nécessaire» prévaut : toutes les données n’ont pas forcément vocation à être publiées.

image-icone-ampoule

Un guide DMP Horizon Europe élaboré par l'Atelier de la donnée DatASaclay et le Comité Europe de l'Université Paris-Saclay est disponible.
 
Ce guide sera utile aussi bien aux porteurs de projets Horizon Europe dans la phase de rédaction  du proposal sur la partie "Research data management and management of other research outputs", qu'aux lauréats pour la rédaction des PGD durant le projet.

Qui peut m’accompagner dans la rédaction d’un PGD ?


Pour toute question sur la rédaction d’un PGD, vous pouvez contacter : donnees-recherche@universite-paris-saclay.fr (envoyez-nous votre PGD pour bénéficier d’une relecture-conseil par nos expertes et experts).


Remplir son PGD : quelles sont les questions à se poser ?


Le PGD est un document évolutif, avec plusieurs versions au cours d’un projet. Il peut également se présenter sous différentes formes ou modèles. Certaines agences de financement proposent leur propre modèle de DMP (voir modèle dans DMP-OPIDoR). Quel que soit le modèle utilisé, le PGD doit aborder / préciser les aspects suivants :


1- La description des données :
Il est ici demandé de décrire les données utilisées dans le cadre du projet, quel que ce soit leur origine. Quelles données (type, nature, volume etc.) seront produites ou récoltées ? Comment les données préexistantes vont-elles être ré-utilisées ? Quelles données méritent d’être conservées sur le long terme ? Quels logiciels pour le traitement de données (open source de préférence) ?

2- Documentation et qualité des données et des métadonnées :
Les métadonnées sont des données décrivant d’autres données et sont un élément essentiel de leur architecture. Il s’agit ici de faire une description détaillée des données (contexte d’acquisition, type de données, unité de mesure, format des fichiers, langue, contributeurs etc.) Quelles procédures pour contrôler la qualité des données ? Quels standards de métadonnées : disciplinaires (Darwin Core, EML…), généralistes (Dublin Core, Datacite etc.) ? Il est recommandé, dans la limite des possibilités, d’employer des référentiels de vocabulaires contrôlés (thésaurus), de préférence standardisés et approprié au domaine de recherche.


3- Stockage et sauvegarde des données en cours de projet :
Le stockage va consister à déposer les données sur un support numérique pour les rendre accessibles. La sauvegarde vise à faire un duplicata des données sur un autre support autre que celui où elles sont stockées. Comment et où les données et les métadonnées seront-elles stockées et sauvegardées durant le projet de recherche ? Quelle sécurité pour les données et quelle protection pour les données personnelles, sensibles ou stratégiques ? Il est impératif de réfléchir dès le départ aux besoins de stockage (volume des données) et aux moyens de sauvegarde (infrastructures disponibles). Il faut anticiper la gestion des imprévus (panne de système
informatique, virus, vol, perte etc.) en prévoyant des modes sécurisés de récupération des données. La règle du 3-2-1 est vivement recommandée : 3 copies sur 2 supports différents dont 1 sur un lieu déporté.


4- Aspects éthiques et légaux :
Le contenu d’un PGD doit obligatoirement aborder les principales questions juridiques et éthiques que posent le traitement des données à caractère personnel et sensible (Voix, statut médical, orientation sexuelle etc.). Quel traitement pour les données à caractère personnel ? Comment est envisagé le traitement des aspects relatifs à la titularité ou la propriété intellectuelle- des données ? Quelle est la législation en la matière ? Existe-t-il une clause de confidentialité ? Comment les données seront-elles impactées par les questions éthiques et déontologiques ? Comment seront-elles traitées (anonymisation des données, approbation de commission
d’éthique, consentement officiel des personnes concernées etc.) ?


5- Partage et publication :
L’ouverture des données favorise la transparence et la reproductibilité des travaux de recherche. Cette étape vise à définir les modalités d’échange des données pendant le projet entre partenaires. Elle définit également les modalités d’accès, de publication et de partage des données pendant et après le projet. Pour ce faire, les questions à se poser sont entre autres : Quelles données seront publiées (voir aide à la décision ici) ? Est-ce qu’il y a des restrictions au partage des données ou des raisons de définir un embargo ? Comment et quand les données seront-elles partagées ? Définir le mécanisme de partage des données (sur demande ou tout autre
processus etc.). Quel entrepôt (disciplinaire ou généraliste) choisir ? Il est conseillé de partager les données dans un entrepôt FAIR et non-commercial.


6- Responsabilités et ressources :
Cette partie consiste à identifier toutes les personnes qui auront une responsabilité dans la gestion des données, de la production à la publication, et ce pendant et après le projet. Les questions à se poser sont entre autres : Quels sont les moyens humains, matériels et financiers mis en place pour la gestion adéquate des données ? Qui est /sont la /les personne(s) responsable(s) de chaque activité de gestion de données. Quels sont les besoins en termes d’expertise et de formation ?

L'université Paris Saclay vous accompagne

Pour toute question sur les PGD et les problématiques liées aux données de la recherche : donnees-recherche@universite-paris-saclay.fr