Bonnes pratiques

Pour la gestion de vos données l’Université met à disposition des outils et recommandations.

Les métadonnées et les formats de fichier

Les métadonnées sont des données qui servent à décrire d’autres données afin de les rendre compréhensibles pour un utilisateur extérieur. Elles sont structurées et interprétables par les ordinateurs. Le standard le plus répandu de métadonnées est le Dublin Core qui comporte 15 éléments, tous facultatifs et qui portent sur :

  • le contenu : titre, sujet, description, source, langue, relation, couverture
  • la propriété intellectuelle : créateur, contributeur, éditeur, gestion des droits
  • l’instanciation : date, type, format, identifiant

En complément, un fichier Readme (ou Lisezmoi) devra accompagner le dépôt de vos jeux de données. Ce document donne des informations supplémentaires sur la façon dont les données sont organisées, les logiciels nécessaires pour y accéder, les conventions de nommage, etc. Vous trouverez un exemple de fichier Readme sur le site de RechercheDataGouv.

Pour connaître les formats de fichiers à privilégier pour assurer la pérennité de vos données vous pouvez utiliser l'outil Facile du CINES (il est recommandé d'utiliser des formats ouverts et pérennes pour garantir que les fichiers puissent être réutilisables).

Le stockage pendant le projet

L’Université met à disposition de son personnel UPVDrive, un cloud stocké sur un serveur sécurisé de la DSIN et accessible via l’ENT. Vous pouvez également accéder à deux espaces de stockage accessibles sur votre ordinateur comme des disques externes. Le lecteur Z est un espace personnel, le lecteur P est un espace partagé avec les membres de votre service ou de votre projet de recherche. Prochainement, les chercheurs auront accès à un Data Lake dédié aux données de la recherche sur un serveur Corpus Humanum. Sur ce serveur seront également installées des machines virtuelles donnant accès à des logiciels mutualisés.

Sharedoc Huma-Num

Il est fortement déconseillé de stocker ses données sur un outil personnel (ordinateur, disque dur externe, clef USB, etc.) qui peuvent être détériorés ou perdus. De même un service de cloud privé ne vous garantit pas la sécurité et l'intégrité de vos données.

Le stockage après le projet

Le stockage des données se fait dans un entrepôt de données. Il est recommandé de privilégier les entrepôts thématiques de votre discipline. Une liste des entrepôts de confiance (soumis au RGPD et répondant à des exigences de qualité des métadonnées) établie par le Comité pour la Science Ouverte est disponible sur cat.opidor. Si aucun entrepôt ne semble vous convenir l'entrepôt national recommandé pour les SHS est Nakala, développé par l'IR* Huma-Num. Pour des projets pluridisciplinaires ou en dernier recours vous pouvez déposer vos données sur RechercheDataGouv.

Valoriser ses données

Pour valoriser vos jeux de données vous pouvez les associer à la publication de vos résultats. Vous pouvez également produire un Data Paper. Ce dernier sert à décrire le jeu de données, sa production et son potentiel de réutilisation. Si le ReadMe sert à réutiliser votre jeu de données, le Data Paper informe la communauté scientifique de son existence. Il peut être publié dans une revue traditionnelle ou dans un journal spécialisé. RechercheDataGouv met à disposition un outil pour créer une ébauche de Data Paper.

Autres outils

Pour le calcul des coûts liés à l'archivage, DoraNum met à votre disposition un outil pour vous accompagner : https://doranum.fr/enjeux-benefices/le-cout-de-la-gestion-des-donnees_10_13143_hch2-h207/

Pour la gestion de vos fichiers

  •  Advanced Renamer est un outil pour renommer en masse vos fichier
  • WinMerge permet de visualiser les différences entre plusieurs versions d’un fichier et de les fusionner si besoin

Un cahier de laboratoire est un journal de bord scientifique dans lequel vous pouvez consigner tous les avancements de votre recherche. eLabFTW est une solution gratuite et open source, utilisée par de nombreuses infrastructures françaises (CNRS, INRAE, Université de Lorraine, etc.).

Pour aller plus loin

  • Le guide du Comité pour la science ouverte consacré aux Données de la recherche.
  • La plateforme DoRANum de l’INIST-CNRS, des ressources pour accompagner la communauté scientifique dans la gestion et le partage des données.
  • La plateforme CoopIST du CIRAD, des ressources pour gérer les données de la recherche.
  • Les classes virtuelles de RechercheDataGouv, pour apprendre à déposer un jeu de données.
Dernière mise à jour : 23/07/2025