Apprentissage automatique pour prédire quels MOFs peuvent réellement être fabriqués en laboratoire Les cadres organométalliques (MOFs) sont parmi les matériaux les plus modulables jamais créés : des cristaux poreux assemblés à partir de nœuds métalliques et de liaisons organiques, avec des applications allant du stockage de gaz à la catalyse. D'un point de vue computationnel, nous pouvons générer des trillions de structures possibles. Le problème est qu'aucune d'entre elles n'est presque jamais synthétisée. Parmi des milliers de dépistages de MOF publiés à ce jour, seulement une douzaine ont conduit à une synthèse en laboratoire réelle, et même dans ce cas, les chimistes ont tendance à choisir des conceptions "sûres" qui ressemblent à des structures connues plutôt qu'à celles qui sont computationnellement optimales. Andre Niyongabo Rubungo et ses co-auteurs s'attaquent à ce goulot d'étranglement avec trois ingrédients : (1) MOFMinE, un ensemble de données nouvellement élaboré de près d'un million de MOFs avec des énergies de contrainte simulées et des énergies libres pour un sous-ensemble de 65 000 structures ; (2) MOFSeq, une représentation de séquence qui encode à la fois des caractéristiques locales (SMILES des blocs de construction) et des caractéristiques globales (topologie et connectivité) ; et (3) LLM-Prop, un modèle de langage de 35 millions de paramètres pré-entraîné sur les données abondantes d'énergie de contrainte, puis affiné sur les calculs d'énergie libre plus coûteux. Les résultats sont frappants : une erreur absolue moyenne de 0,789 kJ/mol, 97 % de précision dans la prédiction de la synthétisabilité, et 78 % de précision dans la sélection du bon polymorphe parmi des structures concurrentes. Même lorsque deux polymorphes diffèrent de seulement 0,16 kJ/mol, le modèle choisit toujours le bon plus de 60 % du temps. L'implication est pratique : ce qui nécessitait autrefois des jours de simulation moléculaire prend maintenant un passage direct à travers un réseau de neurones. Cela ouvre une voie pour filtrer régulièrement les dépistages computationnels de MOF par la synthétisabilité prédite, permettant aux expérimentateurs d'explorer au-delà des conceptions "intuitives" dans des régions inexplorées de l'espace chimique, tout en améliorant les chances que ce qui semble bon sur l'ordinateur puisse réellement être fabriqué en laboratoire. Article :