自1911年Onnes發(fā)現(xiàn)超導(dǎo)后,尋找具有高臨界溫度(Tc)的新型超導(dǎo)材料一直是材料科學(xué)和凝聚態(tài)物理學(xué)研究的熱點(diǎn)。在高成本的實(shí)驗(yàn)研究之前,已經(jīng)有系統(tǒng)的計算工作來確定具有高Tc的Bardeen-Cooper-Schrieffer(BCS)超導(dǎo)體。
然而,由于計算和實(shí)驗(yàn)的成本問題,尋找具有高臨界溫度(Tc)的新型超導(dǎo)體一直是一項(xiàng)具有挑戰(zhàn)性的任務(wù)。為此,美國國家標(biāo)準(zhǔn)與技術(shù)研究院材料測量實(shí)驗(yàn)室Daniel Wines等人提出了一種基于深度生成式模型的逆向設(shè)計方法來發(fā)現(xiàn)超導(dǎo)材料。這種方法超越了傳統(tǒng)的材料篩選方法,并將引領(lǐng)下一代材料的逆向設(shè)計。
圖文導(dǎo)讀
在這項(xiàng)工作中,作者使用晶體擴(kuò)散變分自編碼器(Crystal Diffusion Variational Autoencoder,CDVAE)、原子線形神經(jīng)網(wǎng)絡(luò)(Atomistic Line Graph Neural Network,ALIGNN)預(yù)訓(xùn)練模型和聯(lián)合自動化模擬數(shù)據(jù)庫(Joint Automated Repository for Various Integrated Simulations,JARVIS),來生成新的超導(dǎo)體。
圖1:(a)逆向設(shè)計超導(dǎo)材料的流程;(b)在ALIGNN預(yù)測的Tc>3的化合物中,含有CDVAE生成結(jié)構(gòu)的給定元素的概率
CDVAE主要用于周期性結(jié)構(gòu)的生成。CDVAE由變分自編碼器和擴(kuò)散模型組成,擴(kuò)散模型直接作用于結(jié)構(gòu)的原子坐標(biāo),并使用等變圖神經(jīng)網(wǎng)絡(luò)來確保不變性。CDVAE由三個同時訓(xùn)練的網(wǎng)絡(luò)組成:
(1)編碼器,它對潛在空間進(jìn)行編碼;(2)屬性預(yù)測器,它對潛在空間進(jìn)行采樣并預(yù)測結(jié)構(gòu)和組成;(3)解碼器,是一個擴(kuò)散模型,將隨機(jī)初始化的原子類型去噪為與訓(xùn)練集分布相似的材料。
在這項(xiàng)工作中,作者使用來自JARVIS數(shù)據(jù)庫的1058種DFT計算的超導(dǎo)材料數(shù)據(jù)集,訓(xùn)練了一個CDVAE模型(在潛在空間中優(yōu)化Tc),并生成了數(shù)千種新的候選超導(dǎo)體。作者通過使用預(yù)訓(xùn)練的深度學(xué)習(xí)模型來進(jìn)一步預(yù)測這些候選結(jié)構(gòu),以進(jìn)行快速篩選。在縮小潛在候選超導(dǎo)體的范圍后,作者進(jìn)行了DFT計算來驗(yàn)證模型的預(yù)測,并評估了預(yù)測材料的動力學(xué)和熱力學(xué)穩(wěn)定性。
作者利用ALIGNN對每種材料的超導(dǎo)特性進(jìn)行預(yù)測。ALIGNN是基于deep graph library和PyTorch開發(fā)的。在ALIGNN框架中,每個材料結(jié)構(gòu)被表示為一個圖,其中元素是節(jié)點(diǎn),鍵是邊。圖中的每個節(jié)點(diǎn)分配了9個輸入特征(第一電離能、電子親和性、電負(fù)性、電阻值、價電子、基團(tuán)數(shù)、共價半徑和原子體積)。邊的特征以原子距離表示,其中徑向基函數(shù)的截止值為8 ?。在原子圖的基礎(chǔ)上,利用原子距離作為節(jié)點(diǎn),化學(xué)鍵角作為邊,構(gòu)造線形圖。
作者設(shè)置batch size為16,數(shù)據(jù)以90:5:5進(jìn)行分割,并訓(xùn)練了300個epoch,在訓(xùn)練過程中不使用測試集,保持模型的超參數(shù)與原始ALIGNN相同。數(shù)據(jù)集來源于JARVIS。JARVIS是一個數(shù)據(jù)庫和工具的集合,可以使用經(jīng)典力場、密度泛函理論、機(jī)器學(xué)習(xí)、理論計算和實(shí)驗(yàn)來進(jìn)行自動化的材料設(shè)計。JARVIS-DFT是一個基于密度泛函理論的數(shù)據(jù)庫,包含超過75,000種材料,具有多種材料特性,如形成能、不同理論水平的帶隙、太陽能電池效率、彈性模量、介電常數(shù)、壓電模量、紅外和拉曼光譜、剝離能、二維磁體和二維超導(dǎo)體等ALIGNN和CDVAE模型在1058個DFT計算數(shù)據(jù)上進(jìn)行了訓(xùn)練。
完整的逆向設(shè)計工作流程如圖1a所示。其中第一步包含了在1058個DFT計算數(shù)據(jù)集上訓(xùn)練CDVAE模型。在CDVAE逆向設(shè)計模型中,新的候選超導(dǎo)體需要優(yōu)化的目標(biāo)性質(zhì)為Tc。在對JARVIS-SC數(shù)據(jù)進(jìn)行訓(xùn)練后,作者使用CDVAE模型生成了3000個候選材料。對于如此大量的晶體結(jié)構(gòu),對所有候選材料進(jìn)行DFT計算是不切實(shí)際的。因此,作者使用深度學(xué)習(xí)工具(ALIGNN)來篩選所有3000個候選材料。ALIGNN已經(jīng)成功地預(yù)測了形成能和帶隙以及最近的超導(dǎo)Tc等性質(zhì)。
為了進(jìn)一步研究這些候選物質(zhì),依據(jù)高Tc、潛在穩(wěn)定性和金屬特性(費(fèi)米能級上的高密度態(tài))的目的,作者建立了ALIGNN預(yù)測的篩選標(biāo)準(zhǔn):Tc > 5K, 形成能(Eform)< 0 eV/atom,帶隙(Egap)< 0.05 eV。雖然負(fù)的Eform是穩(wěn)定性的嚴(yán)格要求,但仍然需要計算動力學(xué)和熱力學(xué)穩(wěn)定性來確認(rèn)穩(wěn)定性。在使用ALIGNN進(jìn)行篩選后,作者發(fā)現(xiàn)61種材料符合這一標(biāo)準(zhǔn)。
然后,作者對這61種材料執(zhí)行完整的DFT計算,并使用McMillan-Allen-Dynes方程計算Tc,發(fā)現(xiàn)32個結(jié)構(gòu)的Tc在5K以上。通過對聲子態(tài)密度和化學(xué)成分的研究,作者發(fā)現(xiàn)這些結(jié)構(gòu)中有7個具有負(fù)聲子頻率,表明動力學(xué)不穩(wěn)定。其余25種候選超導(dǎo)體如表1所示。
表1:25個候選超導(dǎo)體
CDVAE模型具有生成新成分與結(jié)構(gòu)的能力。圖1b描述了在3000個CDVAE生成的結(jié)構(gòu)中含有給定元素的化合物的ALIGNN預(yù)測Tc高于3k的概率??梢杂^察到,含有C、N、B、O、V、Mn、Nb、Ru和Ta的化合物在ALIGNN預(yù)測的Tc較高的結(jié)構(gòu)中最為豐富,因?yàn)镈FT訓(xùn)練集中有幾個具有高Tc值的材料包含這樣的元素。
雖然CDVAE結(jié)構(gòu)中的元素豐度(ALIGNN預(yù)測Tc > 3 K)遵循與訓(xùn)練數(shù)據(jù)相似的趨勢,但CDVAE候選結(jié)構(gòu)并不局限于訓(xùn)練數(shù)據(jù)中已經(jīng)存在的化學(xué)計量和晶體結(jié)構(gòu)。圖2說明了這一點(diǎn),其中描述了3000個CDVAE生成的結(jié)構(gòu)用于從JARVIS-DFT數(shù)據(jù)庫中訓(xùn)練的1058個結(jié)構(gòu)的化學(xué)公式、密度分布和堆積分?jǐn)?shù)分布。圖2a和d的對比強(qiáng)調(diào)了CDVAE生成的結(jié)構(gòu)和來自JARVIS的訓(xùn)練數(shù)據(jù)在化學(xué)計量上的差異。
例如,在JARVIS訓(xùn)練集中,大部分?jǐn)?shù)據(jù)只包含三種不同的原子種類(A、B、C),元胞的化學(xué)式類型有5種。相比之下,基于JARVIS訓(xùn)練集(見圖2a)的CDVAE生成的數(shù)據(jù)具有許多包含四個原子種類(A、B、C、D)的結(jié)構(gòu)和具有更多的化學(xué)式類型。
此外,CDVAE生成的數(shù)據(jù)包含大量的單元素結(jié)構(gòu),而這在訓(xùn)練集中不是一個普遍的組成部分。比較圖2b-e和c-f,可以觀察到CDVAE生成的結(jié)構(gòu)和JARVIS訓(xùn)練數(shù)據(jù)之間密度和堆積分?jǐn)?shù)的分布非常不同。具體而言,CDVAE生成的結(jié)構(gòu)具有更大的低密度和堆積分布。這可能部分是由于CDVAE生成的結(jié)構(gòu)的低對稱性,這使得新生成的晶胞的晶體體積更大,因此密度和堆積分?jǐn)?shù)更小。
圖2:CDVAE與JARVIS的數(shù)據(jù)對比
在討論了CDVAE生成結(jié)構(gòu)的結(jié)構(gòu)和化學(xué)多樣性之后,作者討論使用ALIGNN和DFT預(yù)測Tc的工作流程的步驟。使用預(yù)訓(xùn)練的ALIGNN模型,作者可以過濾大量具有瞬時特性預(yù)測的CDVAE候選超導(dǎo)體。圖3a-b描述了1058個JARVIS-DFT結(jié)構(gòu)(用DFT計算的Tc)和3000個CDVAE結(jié)構(gòu)(用ALIGNN預(yù)測的Tc)的分布。如圖所示,Tc的分布有很大的不同。
最引人注目的是,CDVAE生成的數(shù)據(jù)中Tc接近于零(非超導(dǎo))的結(jié)構(gòu)數(shù)量非常少,而JARVIS訓(xùn)練集中的大量材料的Tc值接近于零。此外,CDVAE+ALIGNN的所預(yù)測的Tc分布更接近于高斯分布,大部分新生成結(jié)構(gòu)的Tc值集中在2.5-6 K附近。這可以作為CDVAE模型在潛在空間中生成具有優(yōu)化目標(biāo)屬性的新結(jié)構(gòu)的證明。
圖3:(a-b)CDVAE與JARVIS的數(shù)據(jù)對比;(c-d)CDVAE候選材料的EPC參數(shù)關(guān)系
在用ALIGNN篩選了3000個CDVAE生成的結(jié)構(gòu)之后,作者對符合ALIGNN篩選標(biāo)準(zhǔn)的61個候選結(jié)構(gòu)進(jìn)行了DFT驗(yàn)證,如圖1a所示。在這個階段,預(yù)訓(xùn)練的ALIGNN模型在預(yù)測這些新生成結(jié)構(gòu)的Tc值方面取得了成功。
在61個結(jié)構(gòu)中,54個結(jié)構(gòu)的DFT計算Tc > 0.5K,這表明ALIGNN從CDVAE生成的結(jié)構(gòu)中濾除超導(dǎo)材料的成功率為89%。在61個結(jié)構(gòu)中,32個結(jié)構(gòu)的DFT計算Tc > 5K,這表明ALIGNN從CDVAE生成的結(jié)構(gòu)中過濾出Tc大于5K的材料的成功率為52%。就材料屬性預(yù)測的深度學(xué)習(xí)模型而言,1058個結(jié)構(gòu)是相對較少的訓(xùn)練數(shù)據(jù)。
訓(xùn)練集規(guī)模較小的原因是因?yàn)閳?zhí)行這些DFT計算需要大量的計算成本。原則上,可以通過在訓(xùn)練中增加更多的DFT計算來系統(tǒng)地改進(jìn)ALIGNN對Tc的預(yù)測,這也是JARVIS正在進(jìn)行的工作。在圖3c和d中顯示了進(jìn)行DFT計算的61種材料的EPC參數(shù)(λ,ωlog,Tc)之間的關(guān)系。圖3c描述了λ和ωlog之間的反比關(guān)系,在圖3d中,可以觀察到λ和Tc之間存在某種正相關(guān)關(guān)系。這些都是BCS超導(dǎo)體的典型行為,并在BCS塊體和二維超導(dǎo)體的研究中被觀察到。
從圖3c-d的顏色圖中可以清楚地看出,高λ和ωlog的平衡是材料具有高Tc的必要條件。表1給出了候選超導(dǎo)材料的化學(xué)成分、Tc、每個原子的形成能和凸包以上的能量。從表中可以看出,25種結(jié)構(gòu)均有負(fù)的形成能。負(fù)的形成能雖然是熱力學(xué)穩(wěn)定的必要前提,但并不能保證熱力學(xué)穩(wěn)定。因此,作者計算了凸包上方的能量(如表1所示)。從JARVIS-DFT中不同相的形成能中計算了這些結(jié)構(gòu)的凸包??梢杂^察到15個結(jié)構(gòu)在0.45 eV或更低的能量范圍內(nèi),這些結(jié)構(gòu)是最有可能被實(shí)驗(yàn)合成的。
圖4給出了這15種材料的原子結(jié)構(gòu)(VN2、MnN、VN、BN2Zr、NP2Sr、TaP2、AlN2Zr、NbRh、AlN2V(I)、TiO2NbN、NBaP、ScO3Zr、Al2N、AlN2V(II)、TiN)。雖然這15種材料在凸包上的能量在0.0~0.43 eV/原子之間,表明熱力學(xué)穩(wěn)定性仍不能保證,但它們?nèi)杂锌赡鼙缓铣伞?/p>
圖4:候選超導(dǎo)材料的結(jié)構(gòu)圖
驗(yàn)證CDVAE逆向設(shè)計方法的成功,重要的是要評估生成材料的化學(xué)成分和晶體結(jié)構(gòu)的多樣性,不僅要考慮訓(xùn)練數(shù)據(jù),還要考慮更大的化學(xué)空間區(qū)域。在前25個候選超導(dǎo)體中,有20個化學(xué)成分并不包含在CDVAE的訓(xùn)練集中。MnN、VN、AlN2Zr、NbRh和TiN是訓(xùn)練集的一部分,并且在相關(guān)文獻(xiàn)中都被發(fā)現(xiàn)具有超導(dǎo)相。
盡管這五種候選化合物與訓(xùn)練集中的化合物具有相似的化學(xué)性質(zhì),但除了NbRh(與JVASP-20529具有相同的結(jié)構(gòu))之外,它們都具有完全不同的晶體結(jié)構(gòu)。由于JARVIS數(shù)據(jù)庫的材料較少(JARVIS的主要重點(diǎn)是擴(kuò)展材料的屬性和準(zhǔn)確性)。作者檢查了Materials Project(超過150,000個結(jié)構(gòu))和OQMD(超過1,000,000個結(jié)構(gòu))。此外,作者搜索了文獻(xiàn),看看這些材料是否被合成過。作者還檢索了Supercon數(shù)據(jù),其中包括超過16,000種實(shí)驗(yàn)實(shí)現(xiàn)的超導(dǎo)材料。
作者在前25個候選CDVAE和Supercon數(shù)據(jù)庫中沒有發(fā)現(xiàn)共同的材料。這進(jìn)一步證明了CDVAE方法可以生成具有特定所需性質(zhì)的獨(dú)特材料,覆蓋以前未發(fā)現(xiàn)的化學(xué)空間。總結(jié)與展望在這項(xiàng)工作中,作者使用了一個多步驟的工作流程,結(jié)合了生成模型、深度學(xué)習(xí)屬性預(yù)測和DFT來發(fā)現(xiàn)下一代超導(dǎo)材料。作者證明了使用ALIGNN模型的深度學(xué)習(xí)特性預(yù)測,可以在DFT驗(yàn)證和實(shí)驗(yàn)研究之前即時預(yù)測新生成材料的特性來加速尋找新的超導(dǎo)體。作者發(fā)現(xiàn)了25種新的候選超導(dǎo)體,其中15種結(jié)構(gòu)穩(wěn)定性好,Tc值高達(dá)20.2 K。該方法超越了傳統(tǒng)材料篩選的工作流程,并允許新材料的逆向設(shè)計,填充以前未發(fā)現(xiàn)的化學(xué)空間。
文獻(xiàn)信息文章來源:http://www.zghlxwxcb.cn/news/detail-830372.html
Daniel Wines, Tian Xie, Kamal Choudhary. Inverse Design of Next-Generation Superconductors Using Data-Driven Deep Generative Models. Journal of Physical Chemistry Letters 14, 6630-6638 (2023)
文章來源地址http://www.zghlxwxcb.cn/news/detail-830372.html
到了這里,關(guān)于【AI+材料】JPCL:深度生成式模型逆向設(shè)計超導(dǎo)材料的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!