MOFlearning : Accélérer le design de MOFs par une approche d’apprentissage assistée par combinatoire

Pilote : Christian SERRE

IMAP – Institut des MAtériaux poreux de Paris
(UMR 8004 ENS Paris/CNRS/Univ. Paris Sciences Lettres/ESPCI Paris)

Mots clés : MOFs, machine learning, haut-débit


Les solides hybrides poreux cristallins de type Metal Organic Frameworks (MOFs) sont d’intérêt pour une large gamme d’applications (séparation, catalyse, détection, biomédecine…). Cependant leur synthèse n’est le plus souvent pas contrôlée ce qui rend difficile leur élaboration ‘à façon’ selon la propriété visée.

L’état de l’art s’appuie sur des approches ‘big data’ avec peu de garanties que les matériaux sélectionnés puissant être synthétisés. Cela a conduit à certains succès dans la prédiction à grande échelle de corrélations structure-activité mais pour un nombre très limité de propriétés (par ex en adsorption). De plus, la modélisation haut débit d’autres propriétés physiques ou chimiques (au niveau Classique ou quantique) n’est pas encore une méthodologie établie et nécessiterait d’autres développements pour accompagner l’expansion des bases de données comme outils d’apprentissages pour des approches de type intelligence artificielle. Ce projet de démonstration a pour but d’établir pour la 1ère fois, dans le domaine des MOFs, une approche méthodologique guidée par des méthodes de synthèse et caractérisation haut-débits. 

Nous nous appuierons sur une série de MOFs existants avec une diversité structurale et chimique adéquate et l’évaluation systématique de leurs propriétés d’adsorption/séparation de molécules de gaz modèles (CO2, CH4, N2, gaz nobles…), essentiellement des polycarboxylates ou phosphonates de métaux à haut degré d’oxydation, fonctionnalisés par des groupements polaires ou apolaires, pouvant être réalisés facilement et activés à l’échelle de quelques grammes. Cet effort expérimental sera complémenté par la prédiction haut-débit de leurs propriétés chimiques et physiques pour créer des bases de données enrichies, avec des indicateurs comme moyens d’apprentissages pour des algorithmes statistiques pour identifier les descripteurs clés, couplés avec des algorithmes génératifs pour explorer l’espace des phases nouvelles et guider de futures découvertes. Dans un second temps, s’appuyant sur une nouvelle plateforme de synthèse et de caractérisation haut-débit et les nouveaux modèles prédictifs, pour 1 ou 2 applications d’intérêt, nous identifierons et synthétiserons de nouveaux MOFs performants.