蛋白質是維持生命所必需的結構復雜的生物大分子,人體內幾乎所有的功能如肌肉收縮、呼吸,或將食物轉化為能量等,都與蛋白質之間的相互作用密切相關。而獲得蛋白質三維結構,則有助于科學家了解它在人體內的作用,并設計相應的藥物。
近日,人工智能公司DeepMind宣布,其用AlphaFold預測了六種由新冠病毒基因編碼的蛋白質的三維結構,包括膜蛋白、非結構蛋白等,而且已經開放下載。
獲悉病毒蛋白質結構 有助于研發針對性藥物
病毒由核酸和蛋白質組成,而蛋白質是由病毒基因組編碼的。病毒蛋白質有兩種,一種是結構蛋白,它們可以構成一個形態成熟的有感染性的病毒顆粒,幫助病毒侵染細胞,例如殼體蛋白、膜糖蛋白和存在于病毒顆粒中的酶等;另一種是非結構蛋白,則幫助病毒在宿主細胞里復制、基因表達,擴大在人體內的“領地”。
早在1月10日,中國公布新冠病毒全基因組序列。但僅僅知道基因組序列,并不能充分了解蛋白質是如何工作的。
“蛋白質的成分包括20種氨基酸,每個蛋白質由幾十到上千個氨基酸組成。部分氨基酸的線性序列會形成螺旋或者折疊狀的二級結構,并進一步有序組合堆積成三維結構,這種三維結構決定了蛋白質在人體內如何發揮作用。”中國藥科大學藥學院教授肖易倍接受科技日報記者采訪時,打了個比方,如果說人體的病毒受體是鎖,病毒的刺突糖蛋白就是鑰匙,如果這些鑰匙能插進人體病毒受體蛋白,就會侵染細胞,科學家要做的,就是弄清楚鑰匙內的三維結構是什么、鑰匙和鎖的關系是什么,進而阻止鑰匙去開鎖,即阻止病毒侵染細胞。
“知道了蛋白質如何發揮功能,就知道如何有針對性地抑制病毒活性,如果發現某個蛋白是入侵宿主細胞的關鍵蛋白,就可以針對這個蛋白或者蛋白的某個區域做藥物設計。”南京大學生命科學學院教授、博導董咸池說。
預測結果即使準確 實驗過程仍不可回避
在DeepMind團隊看來,可根據氨基酸序列確定蛋白質的三維結構。他們基于深度神經網絡,通過預測蛋白質中每對氨基酸之間的距離,以及連接這些氨基酸的化學鍵之間的角度,使用兩種方法,來構建預測模型。
“第一步是在結構生物學常用的技術上,訓練神經網絡預測蛋白質中每對氨基酸之間的距離或角度,然后不斷組合這些概率,提高蛋白質結構預測的準確度;第二步是通過梯度下降來優化得分。他們預測的是整個蛋白質鏈,而不是蛋白質結構組裝之前的蛋白質‘碎片’,因此一定程度上降低了整個預測過程的復雜性。”湖南大學超算中心副主任、教授彭紹亮告訴科技日報記者,AlphaFold從頭開始對蛋白質的形態結構進行建模,而沒有使用已經解析的蛋白質作為模板,這意味著需要超大的計算量。
而據清華大學自動化系生物信息學副教授汪小我介紹,在目前國際的蛋白質數據庫(PDB)中,有大約3萬種已知的蛋白質結構,利用其中與目標序列具有相似性的蛋白質序列,可以為蛋白質結構預測提供支持。
在人工智能深度學習之外,科學家們想要獲取蛋白質結構,目前大多從核磁共振、冷凍電鏡與X射線衍射技術中尋求答案。
“三種方法都依賴大型設施、儀器,實驗手段獲得的蛋白質結構,通俗地說就是給蛋白質多角度拍照片,然后根據海量二維照片重構三維結構,結果客觀精確,但是實驗周期比較長,通常需要幾個月,實驗門檻和實驗成本高,實驗難度也不小。”彭紹亮說。
此次AlphaFold對新冠病毒蛋白質結構的預測,是脫離于實驗之外的結構重構。預測的準確性,尚需同行評審,以及實際臨床治療的驗證。不過,DeepMind指出,“模型會指出結構的哪些部分更有可能是正確的,雖然這些未被研究的蛋白質不是當前治療的重點,但它們可能會增加研究人員對新冠病毒的理解”。
而對于AlphaFold的預測結果,彭紹亮認為,如果預測結果準確,還要進行分子對接、分子動力學模擬等很多計算分析過程,以及動物實驗、人體臨床試驗的驗證。“計算可以不斷被加速,但實驗過程是不可回避的,而最終的一切都是以能做出臨床可用的藥物和疫苗為目標。”
-
AI
+關注
關注
87文章
31534瀏覽量
270343 -
DeepMind
+關注
關注
0文章
131瀏覽量
10942
發布評論請先 登錄
相關推薦
評論