BioHive 由 NVIDIA AI 驅動,用于加速醫療領域科學家的工作。在全球超級計算機 TOP500 榜單中,它的排名上升了 100 多位。
BioHive-2 在 Recursion 公司的鹽湖城總部首次亮相,它被稱為制藥行業最大的超算系統。在最新一期的全球超級計算機 TOP500 榜單中,BioHive-2 位列 35,排名比其上一代上升 100 多位。
這一進展代表了該公司最近利用 NVIDIA 技術來加速藥物發現所做的努力。
Recursion 首席技術官 Ben Mabey 表示:“我們看到,就像大語言模型一樣,使用更多數據和算力擴大訓練規模可以大幅提升生物學領域 AI 模型的性能,這最終會對患者的生活帶來積極的影響。” Ben Mabey 十多年來一直在探索將機器學習用于醫療領域。
BioHive-2 搭載了 504 個NVIDIA GPU,并通過 NVIDIA Quantum-2 InfiniBand 網絡互聯,可提供 2 exaflops 的 AI 性能。NVIDIA DGX SuperPOD 因此比 Recursion 的初代系統 BioHive-1 快近 5 倍。
高性能解決復雜性挑戰
性能對快速進步很關鍵,因為“生物學極其復雜”,Mabey 說。
找到一種新的候選藥物可能需要科學家花費數年時間,在濕實驗室進行數百萬次實驗。
這項工作至關重要。Recursion 的科學家每周運行超過 200 萬次這樣的實驗。但今后,他們將使用 BioHive-2 上的 AI 模型,將他們的平臺引導到最有前景的生物學領域來運行實驗。
他說:“有了 AI,我們現在只需 40% 的濕實驗室工作就能獲得 80% 的價值,而且這一比例未來將進一步提高。”
生物學數據推動醫療 AI 不斷進步
Recursion 正在與拜耳(Bayer AG)、羅氏(Roche)和基因泰克等生物制藥公司合作。Recursion 積累了超過 50 PB(petabyte)的生物、化學和患者數據庫,并由此開發了諸多可加速藥物發現的強大 AI 模型。
Mabey 在七年多前加入 Recursion,部分原因是該公司致力于打造這樣的數據集。他表示:“這是世界上最大的生物數據集之一,在構建之初就考慮到 AI 訓練,并且涵蓋了生物和化學數據。”
創造 AI 氛圍
通過在 BioHive-1 上處理這些數據,Recursion 開發了一系列基礎模型,稱為 Phenom。這些模型將一系列顯微鏡觀測到的細胞圖像轉化為有意義的表示,用于理解其中深層的生物學。
其中一個模型 Phenom-Beta 現已通過云 API 的形式提供,也是 NVIDIA BioNeMo(一個面向藥物發現的生成式 AI 平臺)上的首個第三方模型。
經過幾個月的研究和迭代,BioHive-1 使用超過 35 億張細胞圖像來訓練 Phenom-1。Recursion 擴展后的系統能夠在更短的時間內用更大的數據集訓練出更強大的模型。
該公司還利用由 Oracle 云基礎設施托管的 NVIDIA DGX Cloud,為其工作提供額外的超算資源。
圖注:就像訓練大語言模型來生成句子中缺失的單詞一樣,Phenom 模型在訓練時被要求生成細胞圖像中被屏蔽的像素。
Phenom-1 模型以多種方式為 Recursion 及其合作伙伴服務,包括尋找和優化治療各種疾病和癌癥的分子。早期模型已經幫助 Recursion 預測了治療新冠肺炎的候選藥物,10 次中有 9 次成功。
Recursion 去年 7 月宣布與 NVIDIA 合作。不到 30 天后,BioHive-1 和 DGX Cloud 的結合成功篩選并分析了一個龐大的化學庫,預測大約 360 億種化合物的蛋白質靶點。
今年 1 月,Recursion 展示了 LOWE,這是一個擁有自然語言界面的 AI 工作流引擎,它可以幫助科學家更輕松地使用該公司的工具。今年 4 月,該公司還描繪了一個自主開發的十億參數 AI 模型,該模型旨在為預測醫療領域關鍵分子的性質提供一種全新方法。
Recursion 采用 NVIDIA 軟件來優化系統。
他說:“我們喜歡 CUDA 和 NVIDIA AI Enterprise,并且正在研究 NVIDIA NIM 是否能夠幫助我們更輕松地在內部以及向合作伙伴發布我們的模型。”
共同的醫療愿景
在與 Recursion 董事長的爐邊談話中,NVIDIA 創始人兼首席執行官黃仁勛描述了“模擬生物學”愿景,而這些成果讓實現該愿景更進了一步。
黃仁勛表示:“你現在可以識別和學習幾乎任何有結構的物體的語言,也可以將其轉化成任何有結構的物體……這就是生成式 AI 革命。”
Mabey 說:“我們的看法相似。”
他補充道:“我們正處于一個非常有趣的時代的早期階段,就像計算機加速了芯片設計一樣,AI 也可以加快藥物設計。生物學要復雜得多,因此需要數年時間才能看到成果。但回過頭來看時,人們會發現這是醫療領域的一個真正轉折點。”
-
NVIDIA
+關注
關注
14文章
5076瀏覽量
103714 -
超級計算機
+關注
關注
2文章
464瀏覽量
42027 -
大模型
+關注
關注
2文章
2545瀏覽量
3163
原文標題:ISC24 | NVIDIA 和 Recursion 利用 AI 超級計算機加快新藥研發
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論