機器學習用於預測哪些金屬有機框架(MOFs)實際上可以在實驗室中製造 金屬有機框架(MOFs)是迄今為止最可調材料之一——由金屬節點和有機連接器組成的多孔晶體,應用範圍從氣體儲存到催化。從計算上來看,我們可以生成數萬億種可能的結構。問題是幾乎沒有一種能夠被合成。迄今為止發表的數千個MOF篩選中,只有大約十幾個導致了實際的實驗室合成,即使如此,化學家們往往選擇與已知結構相似的「安全」設計,而不是計算上最佳的設計。 Andre Niyongabo Rubungo及其合著者用三個要素來解決這一瓶頸:(1)MOFMinE,一個新整理的數據集,包含近一百萬個MOFs,並為65,000個結構子集模擬了應變能和自由能;(2)MOFSeq,一種序列表示法,編碼了局部特徵(構建塊的SMILES)和全局特徵(拓撲和連接性);(3)LLM-Prop,一個擁有3500萬參數的語言模型,預訓練於豐富的應變能數據上,然後在更昂貴的自由能計算上進行微調。 結果令人驚訝:平均絕對誤差為0.789 kJ/mol,合成可行性的預測準確率為97%,在競爭結構中選擇正確多型體的準確率為78%。即使兩個多型體之間的差異僅為0.16 kJ/mol,該模型仍然能在60%以上的情況下選擇正確的那一個。 這一結果的實際意義在於:曾經需要數天的分子模擬現在只需通過神經網絡進行一次前向傳遞。這為常規篩選計算MOF的合成可行性鋪平了道路——讓實驗者能夠超越「直覺」設計,進入化學空間的未探索區域,同時提高在計算機上看起來不錯的設計實際上能在實驗室中製造的機會。 論文: