材料信息學介紹

目錄

 

1 背景

1.1 材料研究的主要方法

1.2 材料研究發展的階段

1.3 目前材料發展的問題

1.4 材料信息學

2 材料信息學主要研究方法

3 應用示例

3.1 非晶態金屬

3.2 高熵合金

4 總結與展望


1 背景

人類歷史發展的進程中,“材料”一直佔有十分重要的地位。每一種重要材料的發現和廣泛的使用,都會使人類支配和改造自然的能力提高到一個新水平,給社會生產力和人類生活水平帶來巨大的變化,把人類的物質文明和精神文明向前推進一步。

1.1 材料研究的主要方法

材料的研究可以用“PSPP”圖來概括,材料科學和材料工程。材料科學的主要目的是研究工藝、成分、結構和性能之間的關係;而材料工程的主要目的是,爲了想得到目標性能,在限定的條件下,對工藝、成分、結構進行優化

1.2 材料研究發展的階段

幾千年來,在石器、青銅、黑鐵時代,科學研究純粹是依靠經驗和直覺的。直到幾個世紀前,發展到理論模型的範式,此階段以數學方程式的形式表示各種“定律”爲特徵。在材料科學中,熱力學定律就是一個很好的例子。但是隨着時間的流逝,對於許多科學問題,理論模型變得過於複雜,這種分析解決方案不再可行。幾十年前,隨着計算機的出現,計算科學作爲第三種範式變得非常受歡迎,這樣就可以根據理論模擬複雜的現實世界,例如密度泛函理論(DFT)和分子動力學模擬(MD)。但是計算材料學受限於目前的計算能力,只能模擬一些簡單的結構,對於複雜的系統,計算材料的應用相當有限。

1.3 目前材料發展的問題

  • 新材料的開發速度跟不上人們對材料性能的需要。舉個例子,人們對手機的要求越來越高,所以每年的新款iPhone手機都要增大電池容量、加強屏幕防刮性能,但是目前的材料開發速度已現疲態。
  • 傳統的實驗或者模擬的研究方法價格高,耗時長。人工智能與其他領域的結合可以促使該領域飛躍式的發展,近年來這種學科交叉的方式越來越受到關注,比如生物信息學,但是在材料領域,信息學技術應用非常少。
  • 材料領域中,結構和性能的關係往往是非線性的、複雜的。使用理論計算的方法和計算能難以得到“PSPP”關係。

1.4 材料信息學

由於材料發展受到的種種阻礙,必須要尋找新的材料研究方法,在這個背景下,材料信息學應運而生。“材料信息學”這個概念最早是在2006年12月由Materials Research Society提出,它將信息學原理應用於材料科學和工程,以更好地理解材料的使用、選擇、開發和研究。這是一個新興領域,其目標是實現各種材料數據的高速和穩健的採集、管理、分析和傳播,大大減少開發、生產和部署新材料所需的時間和風險。

2 材料信息學主要研究方法

上圖爲材料信息學研究方法示意圖。材料科學中的數據往往是異質的, 因此需要經過一些預處理,然後作爲機器學習模型的輸入,選擇具體的預測評估標準後,通過數據驅動的方法建立機器學習模型,進而對未知區域進行預測,並且能夠挖掘模型特徵與結果之間的關係,最終獲得對材料科學新的理解和知識。

3 應用示例

3.1 非晶態金屬

非晶態金屬指在原子尺度上結構無序的一種金屬材料。它通常是有幾種尺寸差別較大的原子組成,因此在熔融狀態下自由體積小、黏度大,阻礙了原子運動形成有序的結構。非晶態金屬相比玻璃和陶瓷,強度更大,脆性較低;但是相比於金屬,有更強的耐腐蝕性和疲勞抗性。理論上有幾百萬種非晶態金屬,但在過去50年內,只發現了不到一千種。非晶態理論一直在發展,但是目前還沒有可以準確預測形成非晶態金屬的方法,而且也無法從失敗的案例中快速改進模型。其主要原因就是非晶態金屬的研究進展緩慢是因爲它通常含有三種或以上的元素,並且能否形成非晶態與處理方式有關,因此種類十分多;此外,非晶態形成的機理非常複雜。

[Ren et al, 2018]針對以上問題,基於已知的發現,用隨機森林算法建立了一種機器學習模型,在Co-V-Z三元合金系中預測了形成非晶態金屬可能性高的區域,然後用高通量實驗方法進行了驗證;高通量實驗的結果被用來訓練第二代機器學習模型,精度提高了6倍,通過此機器學習模型,獲取了一些新發現,對原有的物理-化學理論有了更深刻的認識。通過這種方法,比傳統方法速度快了200倍

3.2 高熵合金

高熵合金(High-entropy alloys)簡稱HEA,是由五種或五種以上等量或大約等量金屬形成的合金。之所以叫 “高熵合金”,是因爲高熵合金的混合熵比一般的合金大。高熵合金由於其獨特的化學成分和優異的力學性能,近期廣受關注。與傳統以一種金屬元素爲主的合金相比,高熵合金的化學成分種類要多得多,因此研究起來難上加難。

爲了尋找高硬度高熵合金,[Rickman et al., 2019]介紹了一種監督學習的方法,該方法結合了CCA(典型相關分析)和遺傳算法(GA),可以預測和尋找高硬度高熵合金。通過這個方法,找到了7種具有高硬度高熵合金,其中有一些合金的硬度甚至比原始數據庫裏的合金硬度還要高。

4 總結與展望

 Web of science檢索情況:通過搜索關鍵詞materials informatics,結果如上圖,被引用頻次和發表物總數都在逐年增加。

材料信息學的優勢:

  • 減少材料的開發時間和成本;
  • 可在沒有很深厚的專業背景下進行,能夠挖掘傳統物理-化學方法未能找出的隱性關係,最終把理論更推進一步;
  • 可以使用來自不同來源、不同種類的數據。

目前存在的問題:

  • 準確度還需進一步提高,特別是在處理非正常數據的時候;
  • 目前數據庫共享程度還不夠;
  • 在其它領域有一些更先進的算法,比如,還沒有應用到材料信息學上。

參考文獻

[1]  鄭子樵. 材料科學基礎[J]. 2005.

[2]   AGRAWAL A, CHOUDHARY A. Perspective: Materials informatics and big data: Realization of the “fourth paradigm” of science in materials science [J]. APL Materials, 2016, 4(5):

[3]   REN F, WARD L, WILLIAMS T, et al. Accelerated discovery of metallic glasses through iteration of machine learning and high-throughput experiments [J]. Science advances, 2018, 4(4): eaaq1566.

[4]   RICKMAN J M, CHAN H M, HARMER M P, et al. Materials informatics for the screening of multi-principal elements and high-entropy alloys [J]. Nat Commun, 2019, 10(1): 2618.

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章