DatASaclay : l'Atelier de la donnée de l'Université Paris-Saclay

"Promouvoir la FAIRisation et l'ouverture des données de la recherche produites au sein de l'Université Paris-Saclay"
Objectif 2 du document unique de la Science Ouverte

Qui sommes-nous ?

DatASaclay est un réseau d’experts, chargé d’accompagner l’ensemble de la communauté scientifique de l’Université Paris-Saclay, dans la gestion et l’ouverture de leurs données de recherche. 

L'atelier offre un soutien dans la gestion du cycle de vie des données. Son objectif ? les rendre FAIR : Facile à trouver; Accessible; Intéropérable; Réutilisable. 

Membre de l’écosystème Recherche Data Gouv depuis 2021, DatASaclay a été labellisé : « Atelier de la donnée » par le ministère de l'Enseignement supérieur et de la Recherche en octobre 2023.

DatASaclay en vidéo :

Le réseau DatASaclay

  • L'Université Paris-Saclay et ses quatre grandes écoles : AgroParisTech, CentraleSupélec, ENS Paris-Saclay et IOGS;
  • Deux universités membres-associées : Université Évry Paris-Saclay et Université de Versailles Saint-Quentin-en-Yvelines;
  • Cinq Organismes Nationaux de Recherche : IHES, INRAE, CEA, INRIA, ONERA et CNRS;
  • Deux structures disciplinaires : MSH Paris-Saclay et DIM/PAMIR.

Nos services

Résumé à venir...

Résumé à venir...

Qu'est-ce qu'un PGD ?

Un plan de gestion des données (PGD) est un document qui explique les différentes étapes du cycle de vie des données, en indiquant comment les données seront gérées, de la production à la publication. Le PGD aide les chercheurs à organiser et à anticiper les différentes étapes en se posant les bonnes questions sur la gestion de leurs données. Il se présente généralement sous la forme d'un formulaire organisé en une série de questions. Le PGD aborde les questions juridiques, éthiques et budgétaires, ainsi que les aspects liés à la responsabilité et à la sécurité des données.

Pourquoi rédiger un PGD ?

Le PGD est un livrable demandé par les organismes de financement (ANR, Horizon Europe, etc.) dans le cadre de l'évaluation des projets de recherche. Il est un gage de qualité de la recherche. Il soutient la FAIRisation des données en facilitant la découverte, l'accessibilité, l'interopérabilité et la réutilisation des données. L'objectif du PGD est de montrer que les données sont produites et gérées selon de «bonnes pratiques », de la collecte à la publication, dans un « cadre éthique et légal » en accord avec le principe FAIR. Toutefois, il est important de noter que le principe « aussi ouvert que possible, aussi fermé que nécessaire » prévaut : toutes les données ne sont pas nécessairement destinées à la publication.

Qui peut m'aider à rédiger un PGD ?

L'ensemble de l'équipe DatASaclay vous aide à relire votre Plan de Gestion de Données, tout au long de votre projet de recherche. 

Résumé à venir...

DatASaclay vous accompagne tout au long du déroulement de votre projet européen et ANR :

  • Pendant le montage du dossier du projet : Aide à la rédaction du plan préliminaire de gestion de données et à la rédaction du plan de stratégie des pratiques de la Science Ouverte.
  • Pendant le déroulement du projet : Participation au kick-off meeting et présentation de l’exigence des pratiques de la Science Ouverte, aide à la FAIRisation des données, appui à la rédaction et à la relecture du plan de gestion de données, intervention individualisée sur les pratiques de la Science Ouverte aux laboratoires, stockage des données.
  • Après la réalisation du projet : Aide à la dissémination et à la publication des données, conseil sur le choix des entrepôts de données disciplinaires et généralistes.

Un data paper est un article scientifique qui présente une description détaillée et précise d'un jeu de données et du contexte dans lequel il a été produit. Il informe la communauté scientifique de la disponibilité du jeu de données déposé dans un entrepôt de données. Cette nouvelle forme de publication se développe dans un souci d'ouverture des données. Par exemple, Scientific Data, une revue en libre accès créée en 2014, ne publie que des data papers, appelés par la revue Data Descriptor. Ces articles décrivent des ensembles de données dans les domaines des sciences de la vie, de la biomédecine et de l'environnement, et renvoient les lecteurs à des liens vers des entrepôts où les données peuvent être consultées. Les articles sur les données peuvent être publiés dans des revues traditionnelles ou dans des revues de données.

DatASaclay vous aide à rédiger correctement votre data paper et vous propose des formations de sensibilisation. 

Déposer vos données dans un entrepôt de données les rend aussi visibles, accessibles et citables que les publications scientifiques. Il existe différents types d'entrepôts de données : thématiques, pluridisciplinaires, institutionnels, spécifiques à un éditeur ou à un projet de recherche. A titre d'exemple :

  • DataDryad, un entrepôt créé dans les sciences de la vie et désormais ouvert à toutes les disciplines, pour héberger les données associées aux articles de revues.

Le choix du dépôt dépend de la nature des données, du projet de recherche pour lequel elles ont été produites et des objectifs du déposant. Attention, certains dépôts imposent des conditions de réutilisation qui ne sont pas compatibles avec le libre accès...

Dans la gestion des données de programmes de recherche, les premières questions sont souvent juridiques : à qui appartiennent mes données ? Puis-je les ouvrir ? Sous quelles conditions ? Quelle licence utiliser ? Comment me prémunir d'un mésusage ?

Le guide Ouverture des données de recherche - Guide d'analyse du cadre juridique en France (V2 - décembre 2017), réalisé par un groupe de travail inter-organismes piloté par l'INRAE et soutenu par le Comité pour la science ouverte est une bonne approche pour aborder le cadre juridique. Ce guide propose un logigramme de communicabilité des données, qui fait l'objet d'un outil de visualisation disponible en ligne.  

Les données de la recherche financée par des fonds publics sont des données publiques et le principe d'ouverture s'y applique. Cependant, des restrictions légales et éthiques s'appliquent, notamment aux données personnelles, aux données sensibles et aux données protégées par le droit d'auteur. En revanche, la communication de données relevant du secret professionnel, du secret de la défense nationale, de la sûreté de l'État et de la sécurité publique est par principe interdite.

Il convient donc de rester vigilant sur les données diffusées dans certaines situations, notamment lorsqu'il s'agit d'un établissement produisant des données sensibles. En outre, « il convient d'être particulièrement vigilant lorsqu'il s'agit d'une publication scientifique et que l'éditeur exige que les données soient déposées dans un entrepôt spécifique (...) les décisions d'ouverture des données sont prises au niveau de l'institution et non au niveau de l'agent ». (Ouverture des données de la recherche - Guide d'analyse du cadre juridique en France).

Un juriste de l'équipe DatASaclay, vous aidera à anticiper et à préparer au mieux l'ouverture de vos jeux de données.

Nos événements

Nos actualités

Retour sur la journée d'accueil des doctorant·es en Ingénierie du 11 février 2025

« C’est pas donné », le podcast sur la gestion des données de recherche en SHS

Nous contacter

donnees-recherche@universite-paris-saclay.fr