DIAMOND-DM (DIAMOND Data Management)
Description
La plateforme DIAMOND-DM a pour vocation de fournir aux utilisateurs le moyen de gérer les données issues de leurs recherches dans une infrastructure dédiée hébergée au TGCC-Cloud. Les services comprennent le stockage et le partage des données, un écosystème logiciel permettant de structurer les données, de les saisir, de les filtrer et de les extraire, des outils graphiques de consultation et des connexions avec les outils de workflow d’IA du projet ciblé DIAMOND.
Localisation
Infrastructure TGCC-Cloud (CEA Bruyères-le-Châtel).
Contacts
Responsables de la plateforme : Imanol SETOAIN
Coordonnateur du projet ciblé associé : François WILLAIME
Caractéristiques techniques
La plateforme proposera aux utilisateurs de bénéficier d’outils permettant de définir pour chaque projet, la structuration des données avec des sémantiques pour différentes fiches[1] et les liens entre ces différentes fiches. Il sera ainsi possible, par exemple, de dissocier la saisie des données liées aux procédés de fabrication de celles liées aux caractérisations des échantillons résultants, tout en préservant le lien entre ces différentes fiches. Pour chaque projet, on dissociera également les méta-données qui permettent d’identifier et de donner les caractéristiques principales des données binaires brutes qui sont par nature plus volumineuses.
L’ambition est de mettre à disposition des projets les outils pour construire un système de gestion des données de manière très efficace, avec un système logiciel qui prend en charge la gestion des utilisateurs, des données, les interfaces de saisie et de consultation, les liens vers les pipelines de traitement et des templates pour faciliter la mise en place d’extractions automatiques. L’administrateur du projet n’aura alors qu’à adapter ces outils pour la sémantique liée à chaque projet avant de le mettre à disposition de sa communauté d’utilisateurs.
Les serveurs et les moyens de stockage seront hébergés au TGCC Cloud, une infrastructure du centre de calcul CEA de Bruyères-le-Châtel, en charge de la contribution CEA à la communauté scientifique du HPC (High Performance Computing), https://www-hpc.cea.fr/.
[1] Représentation d’un ensemble de données élémentaires nommées avec l’ontologie associée