斯坦福張首晟團隊創(chuàng)造了一個人工智能程序Atom2Vec,只用幾個小時就重新得出了元素周期表。這項研究更宏大的目標是設(shè)計出替代作為機器智能標準的圖靈檢驗的新標準。張首晟教授在接受新智元采訪時認為,實驗是檢驗規(guī)律的唯一標準,人類可以通過實驗來認證人工智能做出的理論預(yù)言。
元素周期表可以說是化學歷史上最重要的科學成就,人類科學家們經(jīng)過將近一個世紀的摸索和嘗試來把元素周期表整理成當前的形式; 而一個來自斯坦福的物理學家們的人工智能程序只需要幾個小時。
這個程序叫Atom2Vec(從原子到矢量)。它能夠分析從網(wǎng)絡(luò)數(shù)據(jù)庫得到的不同元素組合而成的化合物名稱來學習區(qū)分不同的原子,整個過程是獨立無監(jiān)督的,并沒有人類智能的參與。這個程序的開發(fā)借用了自然語言處理中的簡單概念:一個詞語的特性是可以從它周圍出現(xiàn)的其他單詞來得出的;把化學元素根據(jù)它們所出的化學環(huán)境聚類。
項目的負責斯坦福人文與科學學院J.G. Jackson and C.J. Wood
教授張首晟說:“我們想知道是否一個人工智能可以智慧到獨立發(fā)現(xiàn)元素周期表,我們的團隊證明了這一點?!?/p>
借鑒NLP概念搭配化合物中的原子,Atom2Vec將來可用于發(fā)現(xiàn)和設(shè)計新材料
張教授和他的團隊對于Atom2Vec的開發(fā)基于谷歌工程師們分析自然語言使用的Word2Vec。這是一個可以把單詞濃縮成為電腦中有限的幾個數(shù)字(矢量)。通過分析這些矢量,這個人工智能程序可以估計在這個單詞周圍可能出現(xiàn)哪些其他單詞,他們的概率是多少,之間的組合關(guān)系如何。
例如,單詞“國王”經(jīng)常和“王后”出現(xiàn)在一起,而“男人”經(jīng)常和“女人”出現(xiàn)在一起。因此,Word2Vec分析出的代表“國王”的矢量可以跟代表“王后”,“男人”和“女人”的矢量有如下簡單的關(guān)系:“國王”=“王后”-“女人”+“男人”。
張教授指出,“我們可以把類似的想法用到原子上,就像輸入給谷歌的Word2Vec很多文本里不同單詞組成的句子,我們可以輸入給我們的Atom2Vec不同原子組成的化合物,就像NaCl(氯化鈉), KCl(氯化鉀), H2O(水) 等等?!?/p>
從這些數(shù)據(jù)的分析中,人工智能程序可以發(fā)現(xiàn)鉀和鈉有著類似的性質(zhì),因為它們都可以跟鹵素結(jié)合成化合物,張教授說,“就像國王和王后很類似一樣,鉀和鈉也是類似的?!?/p>
Atom2Vec工作流學習材料數(shù)據(jù)庫中的原子。對材料數(shù)據(jù)庫中的每一種化合物生成原子-環(huán)境對,在此基礎(chǔ)上構(gòu)造原子-環(huán)境矩陣。這里使用一個包含7個化合物的小數(shù)據(jù)集作為示例。原子-環(huán)境矩陣的條目表示原子-環(huán)境對的數(shù)量。插圖顯示化合物的單元中和對應(yīng)于目標原子Bi和環(huán)境(2)Se3的條目。只考慮成分信息,而忽略結(jié)構(gòu)信息。Atom2Vec學習算法從原子環(huán)境矩陣中提取原子的知識,并對原子向量中學習的屬性進行編碼。
張教授希望在未來,科學家們可以使用Atom2Vec的知識來發(fā)現(xiàn)和設(shè)計新材料,“在這個項目里,我們的程序是無監(jiān)督的,但是你可以給它一個特定的目標去優(yōu)化,例如,找到最有效率轉(zhuǎn)換太陽能的材料?!?/p>
張教授的團隊已經(jīng)開始團隊人工智能程序2.0版本的研究,集中攻克一個生物醫(yī)學上很困難的問題:設(shè)計出正確可以攻擊抗原的抗體,通常來講,抗體是由免疫機制生成的。這對于癌癥的研究極其重要,當前最有前景的治療癌癥方案之一——免疫治療,就試圖找到并且控制能夠攻擊癌細胞抗原的抗體。
然而人類身體可以創(chuàng)造超過1000萬種不同的抗體,每一種都是大約50個基因的一種不同組合,“如果我們可以把這些基因數(shù)據(jù)里的信息濃縮到一個數(shù)學矢量里去,像排列元素周期表一樣排列它們,那么,如果我們發(fā)現(xiàn)其中一種抗體對一個抗原有效然而有毒,我們可以從我們的表中接著尋找它同類的但毒性更小的抗體?!?/p>
更宏大的目標:設(shè)計出替代圖靈檢驗的新標準
張首晟表示,這項發(fā)表于6月25日美國國家科學院院刊的研究將是實現(xiàn)更宏大的目標之前的重要的第一步。更宏大的目標是設(shè)計出替代作為機器智能標準的圖靈檢驗的新標準。
圖靈檢驗里面,一個機器如果可以和人類一樣回復(fù)檢驗者的問題,讓檢驗者無法區(qū)分其是否是人類,就可以通過檢驗。但張教授認為,這種檢驗是有瑕疵的,主觀的,“人類是一個漫長進化的結(jié)果,人類的心智里充滿了種種不理性的因素,如果一個人工智能要通過圖靈檢驗,它需要能夠重復(fù)這些人類復(fù)雜的非理性的一面,這是非常困難而瑣碎的,因此并不能夠有效利用程序設(shè)計者的時間創(chuàng)造價值?!?/p>
張教授提出,對于一個機器智能可以有另一種標準,“我們想試試我們是否可以設(shè)計出在發(fā)現(xiàn)自然規(guī)律上可以擊敗人類的人工智能,但是在此之前,我們要先測試我們的人工智能是否可以重復(fù)人類已經(jīng)完成的一些偉大發(fā)現(xiàn)。而Atom2Vec獨立發(fā)現(xiàn)元素周期表就是后者的一個成果”。
新智元向張首晟教授提問:如果AI發(fā)現(xiàn)了自然規(guī)律,我們怎么知道那就是事實呢?張首晟教授認為,實驗是檢驗規(guī)律的唯一標準,人類可以通過實驗來認證人工智能做出的理論預(yù)言。
張首晟教授還認為,純理性的標準才是客觀的,人機競智的標準一定要客觀才行。
此外,這個項目中其他的參與者有,斯坦福的博士生周權(quán)和劉慎修,博士后湯沛哲等。
-
人工智能
+關(guān)注
關(guān)注
1796文章
47683瀏覽量
240326 -
圖靈
+關(guān)注
關(guān)注
1文章
41瀏覽量
9742 -
自然語言處理
+關(guān)注
關(guān)注
1文章
619瀏覽量
13647
原文標題:斯坦福AI幾小時發(fā)現(xiàn)元素周期表,張首晟團隊將設(shè)計替代圖靈測試的新標準
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
斯坦福團隊抄襲國產(chǎn)大模型,主要責任人失聯(lián)
人工智能是什么?
斯坦福開發(fā)過熱自動斷電電池
從入門到研究,人工智能領(lǐng)域最值得一讀的10本資料(附下載)
關(guān)于斯坦福的CNTFET的問題
回收新舊 斯坦福SRS DG645 延遲發(fā)生器
DG645 斯坦福 SRS DG645 延遲發(fā)生器 現(xiàn)金回收
斯坦福年度AI報告表示人工智能全面逼近人類能力
![<b class='flag-5'>斯坦福</b>年度AI報告表示<b class='flag-5'>人工智能</b>全面逼近人類能力](https://file1.elecfans.com//web2/M00/A7/08/wKgZomUMQfCARq4SAAALnYVuxVs412.png)
評論