那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

什么是預訓練 AI 模型?

NVIDIA英偉達 ? 來源:未知 ? 2023-04-04 01:45 ? 次閱讀

預訓練 AI 模型是為了完成特定任務而在大型數據集上訓練的深度學習模型。這些模型既可以直接使用,也可以根據不同行業的應用需求進行自定義。

如果要教一個剛學會走路的孩子什么是獨角獸,那么我們首先應該向孩子展示這種生物的圖像并描述其獨有特征。

那么,如果要教一臺人工智能(AI)機器什么是獨角獸,該從什么地方做起呢?

預訓練 AI 模型提供了解決方案。

預訓練 AI 模型是一種為了完成某項特定任務而在大型數據集上進行訓練的深度學習模型,它是一種類腦神經算法的表現形式,可以根據數據找到模式或進行預測。預訓練 AI 模型既可以直接使用,也可以根據某個應用的具體需求進行進一步微調。

為什么使用預訓練 AI 模型?

開發者可以使用預訓練模型并根據需求對其進行自定義,無需從頭開始構建 AI 模型。

無論是識別一匹虛構的馬,檢測自動駕駛汽車的安全隱患,還是根據醫學影像診斷癌癥,要構建一個 AI 應用,開發者首先需要一個能夠完成特定任務的 AI 模型。而這個模型需要大量具有代表性的數據進行學習。

模型的學習過程需要經歷好幾層傳入數據,并在每一層強調與目標相關的特征。

例如,在創建一個能夠識別獨角獸的模型時,首先會為其提供獨角獸、馬、貓、老虎和其他動物的圖像作為傳入數據。

然后再構建具有代表性的數據特征層。從線條、顏色等簡單特征開始,深入到復雜的結構特征。依據計算出的概率,這些特征將被賦予不同程度的相關性。

舉個例子,當一個生物看起來越像馬,它是獨角獸而不是貓或老虎的概率就越大。這些概率值被存儲在 AI 模型的每個神經網絡層。隨著層數的增加,模型對表征的理解程度也在提高。

若要從頭開始創建一個這樣的模型,開發者通常需要調用包含數十億行數據的巨大數據集,并且這些數據可能十分昂貴且難以獲得。但如果因此在數據上讓步,就會導致模型性能不佳。

預先計算的概率表征(也稱權重)能夠節省開發者或企業的時間、金錢和精力。已建立完成的預訓練模型可通過這些權重進行訓練。

高質量的預訓練模型搭配大量準確且具有代表性的權重可以提高 AI 部署的成功率。

權重可以被修改,而且可以通過添加更多數據為模型進行進一步的自定義或微調。

在預訓練模型基礎上進行構建的開發者可以更快創建出 AI 應用,因為他們無需處理堆積如山的傳入數據或去計算密集的數據層的概率。

換言之,使用預訓練 AI 模型就像是用一件成衣根據自己的需求進行剪裁,而不用從布料和針線做起。

預訓練 AI 模型通常被用于遷移學習,可以基于多種模型架構類型而構建。其中一種流行的架構類型是 Transformer 模型,一種通過追蹤連續數據中的關系來學習上下文和意義的神經網絡。

AI 公司 Clarifai 是NVIDIA 初創加速計劃的高級合作伙伴。Clarifai 的平臺高級副總裁 Alfredo Ramos 表示,預訓練模型可以將 AI 應用的開發時間縮短一年并節約數十萬美元的成本。

預訓練模型如何推動 AI 的發展?

預訓練模型簡化并加快了 AI 的開發,許多開發者和公司通過它們來加速各種 AI 用例。

預訓練模型主要推動了以下幾個領域的 AI 發展:

  • 自然語言處理:預訓練模型被用于翻譯、聊天機器人等自然語言處理應用。大型語言模型一般基于 Transformer 模型架構構建,是預訓練模型的延伸。世界上最大的 AI 模型之一NVIDIA NeMo Megatron就是一個預訓練大型語言模型。

  • 語音 AI:預訓練模型能幫助語音 AI 應用在不同的語言下也能直接使用。用例包括呼叫中心自動化、AI 助手和語音識別技術。

  • 計算機視覺:如上文所述的獨角獸模型,預訓練模型可以幫助 AI 快速識別生物或者物體、地點和人。預訓練模型通過這種方式加速計算機視覺,為體育運動、智慧城市等領域的應用提供近似于人類的視覺能力。

  • 醫療:在醫療應用方面,MegaMolBART(NVIDIA BioNeMo服務和框架的一部分)等預訓練 AI 模型能夠理解化學語言并學習現實世界分子中原子之間的關系,為科學界提供了一種加快藥物研發的強大工具。

  • 網絡安全:預訓練模型為實施 AI 網絡安全解決方案打下了基礎,并幫助人類安全分析師更快的發現威脅。包括人類和機器的數字指紋及異常、敏感信息和網絡釣魚檢測等多種情況。

  • 藝術和創作流程:為推動最新的 AI 藝術浪潮,預訓練模型可以在GauGANNVIDIA Canvas等工具的幫助下加快創作流程。

預訓練 AI 模型的自定義和微調為其帶來了無限的應用可能性,因此也可以用于更多其他行業。

何處獲取預訓練 AI 模型

谷歌、Meta、微軟、NVIDIA 等公司正在發明用于構建 AI 模型的尖端模型架構和框架。

這些模型有時會在模型中心或作為開放源碼發布,使開發者能夠對預訓練 AI 模型進行微調、提高其準確性并擴展模型庫。

NVIDIA NGC匯集了通過 GPU 優化的 AI 軟件、模型和 Jupyter Notebook 示例,包括各種預訓練模型以及為 NVIDIA AI 平臺優化的 AI 基準和訓練方式。

NVIDIA AI Enterprise是一套全面且安全的云原生 AI 與數據分析軟件套件,包含未加密的預訓練模型。這讓希望將 NVIDIA 預訓練模型整合到其自定義 AI 應用中的開發者和企業能夠查看模型權重和偏差、提高可解釋性并輕松進行調試。

在 GitHub、Hugging Face 等平臺也有數千個可供使用的開源模型。

十分重要的是,在訓練預訓練模型時,模型數據必須透明、可解釋、符合隱私要求,并且是獲得同意許可且無偏見的道德數據。

NVIDIA 預訓練 AI 模型

為幫助更多開發者將 AI 原型投入到生產中,NVIDIA 提供了幾種開箱即用的預訓練模型:

  • NVIDIA SegFormer是一個在 GitHub 上提供的 Transformer 模型,可實現簡單、高效、強大的語義分割。

  • NVIDIA 的專用計算機視覺模型經數百萬張圖像訓練而成,可用于智慧城市、停車管理等應用。

  • NVIDIA NeMo Megatron是一個大型可定制語言模型,包含在 NVIDIA NeMo 中。NeMo 是一個用于構建靈活、高性能對話式 AI、語音 AI 和生物學應用的開源框架。

  • NVIDIA StyleGAN是一個基于風格的生成器架構,用于生成式對抗網絡(或稱 GAN)。它可以使用遷移學習來無限生成各種不同風格的繪畫。

除此之外,NVIDIA 還能夠提供:

  • NVIDIA Riva:一款用于構建和部署語音 AI 應用的 GPU 加速軟件開發工具包,包含了十種語言的預訓練模型。

  • MONAI:由 NVIDIA 和倫敦國王學院聯合開發的開源醫療研究 AI 框架,包含了用于醫學影像的預訓練模型

點擊閱讀原文,進一步了解NVIDIA 預訓練 AI 模型

掃描海報二維碼即可觀看 NVIDIA 創始人兼首席執行官黃仁勛 GTC23 主題演講重播!


原文標題:什么是預訓練 AI 模型?

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    22

    文章

    3847

    瀏覽量

    91970

原文標題:什么是預訓練 AI 模型?

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    GPU是如何訓練AI模型

    AI模型訓練過程中,大量的計算工作集中在矩陣乘法、向量加法和激活函數等運算上。這些運算正是GPU所擅長的。接下來,AI部落小編帶您了解GPU是如何
    的頭像 發表于 12-19 17:54 ?239次閱讀

    KiCon演講回顧(四):AI助力電子元件庫自動化提取

    “ ?李寧老師將帶您探索《基于AI的元件參數自動提取方法研究》中的前沿技術! ? ” 自動化電子元件庫的需求 華為挑戰:基于訓練AI模型
    的頭像 發表于 11-25 11:56 ?381次閱讀
    KiCon演講回顧(四):<b class='flag-5'>AI</b>助力電子元件庫自動化提取

    什么是大模型、大模型是怎么訓練出來的及大模型作用

    ,基礎模型。 ? 大模型是一個簡稱,完整的叫法,應該是“人工智能訓練模型”。
    的頭像 發表于 11-25 09:29 ?3233次閱讀
    什么是大<b class='flag-5'>模型</b>、大<b class='flag-5'>模型</b>是怎么<b class='flag-5'>訓練</b>出來的及大<b class='flag-5'>模型</b>作用

    為什么ai模型訓練要用gpu

    GPU憑借其強大的并行處理能力和高效的內存系統,已成為AI模型訓練不可或缺的重要工具。
    的頭像 發表于 10-24 09:39 ?425次閱讀

    AI模型訓練數據來源分析

    AI模型訓練數據來源廣泛且多元化,這些數據源對于構建和優化AI模型至關重要。以下是對AI
    的頭像 發表于 10-23 15:32 ?1123次閱讀

    如何訓練自己的AI模型

    訓練自己的AI模型是一個復雜且耗時的過程,涉及多個關鍵步驟。以下是一個詳細的訓練流程: 一、明確需求和目標 首先,需要明確自己的需求和目標。不同的任務和應用領域需要不同類型的
    的頭像 發表于 10-23 15:07 ?2883次閱讀

    直播預約 |數據智能系列講座第4期:訓練的基礎模型下的持續學習

    鷺島論壇數據智能系列講座第4期「訓練的基礎模型下的持續學習」10月30日(周三)20:00精彩開播期待與您云相聚,共襄學術盛宴!|直播信息報告題目
    的頭像 發表于 10-18 08:09 ?274次閱讀
    直播預約 |數據智能系列講座第4期:<b class='flag-5'>預</b><b class='flag-5'>訓練</b>的基礎<b class='flag-5'>模型</b>下的持續學習

    ai模型訓練需要什么配置

    AI模型訓練是一個復雜且資源密集的過程,它依賴于高性能的硬件配置來確保訓練的效率和效果。 一、處理器(CPU) CPU是計算機的核心部件,負責處理各種計算任務。在
    的頭像 發表于 10-17 18:10 ?1916次閱讀

    蘋果揭示AI新動向:Apple Intelligence模型在谷歌云端芯片上訓練

    蘋果公司在最新的技術論文中披露了一項重要信息,其全新的人工智能系統Apple Intelligence所依賴的模型并非傳統上大型科技公司首選的NVIDIA GPU,而是選擇了在谷歌設計的云端芯片上進行訓練。這一決定不僅打破了行
    的頭像 發表于 07-30 15:00 ?586次閱讀

    訓練和遷移學習的區別和聯系

    訓練和遷移學習是深度學習和機器學習領域中的兩個重要概念,它們在提高模型性能、減少訓練時間和降低對數據量的需求方面發揮著關鍵作用。本文將從定義、原理、應用、區別和聯系等方面詳細探討
    的頭像 發表于 07-11 10:12 ?1214次閱讀

    大語言模型訓練

    能力,逐漸成為NLP領域的研究熱點。大語言模型訓練是這一技術發展的關鍵步驟,它通過在海量無標簽數據上進行訓練,使模型學習到語言的通用知識
    的頭像 發表于 07-11 10:11 ?537次閱讀

    訓練模型的基本原理和應用

    訓練模型(Pre-trained Model)是深度學習和機器學習領域中的一個重要概念,尤其是在自然語言處理(NLP)和計算機視覺(CV)等領域中得到了廣泛應用。
    的頭像 發表于 07-03 18:20 ?3141次閱讀

    【大語言模型:原理與工程實踐】大語言模型訓練

    大語言模型的核心特點在于其龐大的參數量,這賦予了模型強大的學習容量,使其無需依賴微調即可適應各種下游任務,而更傾向于培養通用的處理能力。然而,隨著學習容量的增加,對訓練數據的需求也相
    發表于 05-07 17:10

    【大語言模型:原理與工程實踐】大語言模型的基礎技術

    ,這也是如今生成式 AI 中大語言模型最流行訓練架構。(3) Encoder-Decoder訓練語言
    發表于 05-05 12:17

    谷歌模型訓練軟件有哪些功能和作用

    谷歌模型訓練軟件主要是指ELECTRA,這是一種新的訓練方法,源自谷歌AI。ELECTRA不僅擁有BERT的優勢,而且在效率上更勝一籌。
    的頭像 發表于 02-29 17:37 ?853次閱讀
    百家乐能作弊吗| 大发888娱乐城注册送筹码| 足球即时比分| 百家乐官网赢钱面面观| 百家乐对付抽水| 维西| 百家乐官网网页qq| 大发888亚洲游戏在线| 真人百家乐官网网站接口| 百家乐园小区户型图| 澳门金莎娱乐城| 关于阳宅风水24山知识| 华人棋牌游戏| 七匹狼百家乐官网的玩法技巧和规则| 大发888备用网址大发娱乐城| 百家乐官网职业赌徒的解密| 天博百家乐的玩法技巧和规则| 百家乐官网二代皇冠博彩| 沙龙百家乐娱乐城| 百家乐官网赢钱绝技| 足球百家乐系统| 百家乐官网娱乐人物| 百家乐赌博机怎么玩| 永靖县| 澳门百家乐玩| 百家乐官网类游戏网站| 百家乐平台在线| 网上百家乐官网可靠| 百家乐投注之对冲投注| 百家乐官网赢钱战略| 百家乐怎么看大小| 百家乐官网八卦投注法| 百家乐什么方法容易赢| 百家乐官网破解仪| 棋牌游戏平台哪个好| 百家乐天上人间| 威盈| 百家乐时时彩网站| 至尊百家乐官网年代| 大发888官网授权网| 怎样看百家乐牌|