化學科學正在向前發展,而化學反應也越來越復雜。但在強大技術的加持下,現代化學研究正在突破我們對于化學的傳統印象。科研人員不用呆坐在實驗室里擺弄瓶瓶罐罐,非要把花花綠綠的試劑混合在一起才能知道它們會發生什么化學反應、生成了什么物質。借助強大的機器學習算法,科學家們不費一瓶一罐也能預測出化學產物,極大地提高了新物質探索開發的效率。
加州理工學院的研究人員們就利用機器學習開發出了這樣一套能夠稱為化學家左膀右臂的工具,在你還沒來得及把化學試劑放進試管里之前,就能夠預測化學反應。
研究人員利用Hartree-Fock作為輸入來預測電子結構的相關能量。整體的相關能量通過來自占據分子軌道獨立和成對的貢獻來進行表達,基于分子軌道特性,研究人員利用高斯過程回歸來預測不同軌道特征的貢獻。通過最大化化學系統間的遷移能力和特征集的緊湊性,研究人員成功規避了通常使用的原子或幾何特征信息。這種方法避免的傳統計算方法的缺點,在保證精度的情況下提升了效率。它甚至可以預測訓練集中沒有包含的元素或原子構成的分子。
盡管這個工具并不是這個領域的開創者,但是這個算法在已有的工具基礎上進行了很多改進,能夠通過輸入的化學物質來預測出反應的過程和生成物的屬性,這一點至關重要。
研究人員表示“這些預測能將潛在的微觀屬性與我們在宏觀世界中關心的事情聯系起來,能讓我們提前知道一種催化劑的性能是否會比另一種更好,并確定新的候選藥物。"
Caltech研究人員的工作實質上改變了預測軟件的關注焦點。以前的工具基于三種計算建模方法,即密度泛函理論(density functional theory,DFT )、耦合簇理論(coupledcluster theory ,CC )或默勒-普萊塞特擾動理論(M?ller–Plesset perturbation theory , MP2 )。這些理論代表了三種不同近似來解薛定諤方程的方法,而薛定諤方程描述了一種量子力學起著重要作用的復雜系統。
這些理論各有優劣。DFT是一種快餐式的方法,它能讓研究人員更快地得出答案,但準確度較低。CC和MP2更精確,但是計算耗費時間更長,且消耗更多的算力。
但這種方法好似穿針引線利用機器學習將幾種方法的優勢結合了起來,它能夠比DFT更準確的預測,但耗時卻比CC和MP2少。這種方法將機器學習算法集中在分子軌道,即分子周圍的電子云上來實現上述效果。相比之下,現有的工具則聚焦于分子中原子的類型或原子鍵合的角度。
目前為止,這種方法展示出了巨大的前景,雖然它現在還只被用來預測相對簡單的系統,但從目前的結果來看,它具有處理復雜化學問題的良好前景。如果這一方法在復雜化學問題上取得成功,它將稱為計算化學研究史上的里程碑事件,將極大地促進化學特別是計算化學、理論化學的發展。
這項工作發表在《化學理論與計算雜志》上,題為“機器學習的遷移應用——通過分子軌道預測電子結構”。
-
算法
+關注
關注
23文章
4630瀏覽量
93359 -
機器學習
+關注
關注
66文章
8441瀏覽量
133087
原文標題:什么,不做化學實驗也能知道產物是啥?AI幫助科研狗實現終極夢想
文章出處:【微信號:thejiangmen,微信公眾號:將門創投】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論