生物信息學(xué)家一直在尋找新的工具來簡(jiǎn)化和增強(qiáng)基因組分析管道。 NVIDIA Clara Parabricks 擁有 60 多種工具,能夠在研究和臨床環(huán)境中為種系和體細(xì)胞工作流程提供準(zhǔn)確、快速的基因組分析。
NVIDIA Clara Parabricks 3.8 ,特點(diǎn):
快速變體注釋工具。
腫瘤只需要臨床癌癥工作流程。
安培的額外支持 GPU 。
序列數(shù)據(jù)的快速增長(zhǎng)要求更快的變體調(diào)用格式( VCF )讀寫速度。 Clara Parabricks 3.8 擴(kuò)展了快速變量注釋、變量后調(diào)用、使用 snpswift 支持自定義數(shù)據(jù)庫(kù)注釋以及使用 bcftools 調(diào)用變量結(jié)果。在 Clara Parabricks 上, snpswift 提供了快速準(zhǔn)確的 VCF 數(shù)據(jù)庫(kù)注釋,并利用了廣泛的數(shù)據(jù)庫(kù)。
測(cè)序技術(shù)的進(jìn)步擴(kuò)大了基因組學(xué)在臨床腫瘤學(xué)中的作用。 NVIDIA Clara Parabricks 現(xiàn)在為臨床癌癥工作流程提供了僅限腫瘤的體細(xì)胞呼叫者 LoFreq 和 Mutect2 呼叫。腫瘤正常呼叫可通過 LoFreq 、 Mutect2 、 Strelka2 、 SomaticSniper 、 Muse 在 Parabricks 上進(jìn)行。
基因組科學(xué)家可以通過使用更廣泛的 GPU 體系結(jié)構(gòu)運(yùn)行 Clara Parabricks ,進(jìn)一步加快基因組分析工作流程,包括 A6000 、 A100 、 A10 、 A30 、 A40 、 V100 和 T4 。這也支持客戶使用由特定 NVIDIA GPU 驅(qū)動(dòng)的下一代測(cè)序儀器進(jìn)行基址調(diào)用,這些客戶希望使用相同的 GPU 對(duì) Clara Pararicks 進(jìn)行二次分析。
擴(kuò)展的快速變體注釋
在 1 月份發(fā)布的 Clara Parabricks 3.7 ,添加了一個(gè)新的變體注釋工具,有助于為下游基因組分析提供變體的功能信息。這一點(diǎn)很重要,因?yàn)檎_的變體注釋有助于基因組研究和臨床診斷的最終結(jié)論。
Pararicks 的變體注釋工具 snpswift 提供了快速而準(zhǔn)確的 VCF 數(shù)據(jù)庫(kù)注釋,與其他社區(qū)變體注釋解決方案(如 vcfanno )相比,它可以在更短的運(yùn)行時(shí)內(nèi)提供結(jié)果。 Snpswift 帶來了更多的功能和加速,同時(shí)保留了 VCF 文件的精確等位基因數(shù)據(jù)庫(kù)注釋的基本功能。新的 snpswift 工具還支持用 ENSEMBL 中的基因名稱數(shù)據(jù)注釋 VCF 文件,有助于理解編碼變體。
支持的數(shù)據(jù)庫(kù)包括 dbSNP 、 gnomAD 、 COSMIC 、 ClinVar 和 1000 個(gè)基因組。 Snpswift 可以對(duì)這些變量進(jìn)行聯(lián)合注釋,為篩選 VCF 變量和解釋其重要性提供重要信息。此外, snpswift 能夠使用來自 ENSEMBL GTF 的信息注釋 VCF ,以添加詳細(xì)信息并利用該領(lǐng)域中其他廣泛使用的數(shù)據(jù)庫(kù)。
圖 1 Clara Pararicks 的變體注釋工具 snpswift 比其他社區(qū)變體注釋工具(如 vcfanno )提供更快、更準(zhǔn)確的 VCF 數(shù)據(jù)庫(kù)注釋
除了這些廣泛使用的數(shù)據(jù)庫(kù)外,許多研究機(jī)構(gòu)和公司都有自己豐富的內(nèi)部數(shù)據(jù)集,這些數(shù)據(jù)集可以為每個(gè)變體提供有價(jià)值的特定領(lǐng)域信息。
Clara Parabricks 3.8 中的 Snpswift 現(xiàn)在使用多個(gè)自定義 TSV 數(shù)據(jù)庫(kù)對(duì) VCF 進(jìn)行注釋。 Snpswift 還能夠在 30 秒內(nèi)用包含 500K 變體的自定義 TSV 注釋 600 萬變體 HG002 VCF 。用戶可以使用 VCF 、 GTF 和 TSV 數(shù)據(jù)庫(kù)聯(lián)合注釋 VCF ,所有這些都只需一個(gè)命令,只需一次運(yùn)行。
最后, Clara Parabricks 3.8 包含了后果預(yù)測(cè)。預(yù)測(cè)變異的功能結(jié)果是對(duì)遺傳變異進(jìn)行分類和排序注釋的關(guān)鍵步驟。 Parabricks 3.8 提供了一個(gè) bcftoolscsq 命令,該命令封裝了眾所周知且速度極快的 bcftools csq 工具 ,提供了單體型感知的結(jié)果預(yù)測(cè)。這導(dǎo)致 VCF 文件中的變體分階段,以避免變體影響相同密碼子時(shí)出現(xiàn)常見錯(cuò)誤。
圖 2 這張圖片拍攝于 調(diào)用 GitHub 鏈接的結(jié)果。 BCFtools / csq 與三個(gè)常用結(jié)果調(diào)用程序的性能比較,使用一個(gè)帶有 450 萬個(gè)站點(diǎn)的 VCF 示例
與基于CPU的環(huán)境相比,最先進(jìn)的生物信息學(xué)工具的速度提高了60倍。全基因組工作流程的端到端分析只需22分鐘,外顯子組工作流程只需4分鐘。大規(guī)模測(cè)序項(xiàng)目和其他全基因組研究能夠在一臺(tái)DGX服務(wù)器上每天分析60多個(gè)基因組,同時(shí)降低相關(guān)成本,產(chǎn)生比以往任何時(shí)候都有用的見解。
關(guān)于作者
Vanessa Braunstein 在 NVIDIA 的醫(yī)療團(tuán)隊(duì)從事產(chǎn)品營(yíng)銷工作。此前,她在基因組學(xué)、醫(yī)學(xué)成像、制藥、化學(xué)和診斷公司從事產(chǎn)品開發(fā)和營(yíng)銷。她學(xué)習(xí)分子和細(xì)胞生物學(xué)、公共衛(wèi)生和商業(yè)。
Camir Ricketts是 NVIDIA ( NVIDIA )的一位生物信息學(xué)科學(xué)家,他正在開發(fā)新方法,以加速基因組分析并利用人工智能進(jìn)行醫(yī)療保健。他在康奈爾大學(xué)威爾·康奈爾醫(yī)學(xué)院完成博士學(xué)位,專注于結(jié)構(gòu)變異表征和腫瘤系統(tǒng)發(fā)育推斷的方法開發(fā)。
審核編輯:郭婷
-
cpu
+關(guān)注
關(guān)注
68文章
10904瀏覽量
213023 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5076瀏覽量
103723 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
9304瀏覽量
86066
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論