那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

細數二十一世紀以來深度學習框架的發展歷程

Dbwd_Imgtec ? 來源:機器之心 ? 作者:機器之心 ? 2021-01-08 14:29 ? 次閱讀

當前,各式各樣深度學習框架的發展充分賦能機器學習,尤其是深度學習領域,為開發者提供了極致便利。在本文中,Waymo 軟件工程師 Lin Yuan 細數了二十一世紀以來深度學習框架的發展歷程,并劃分為了石器、青銅、鐵器、羅馬和工業化時代。

過去十年,機器學習(尤其是深度學習)領域涌現了大量算法和應用。在這些深度學習算法和應用涌現的背后,是各種各樣的深度學習工具和框架。它們是機器學習革命的腳手架:TensorFlow 和 PyTorch 等深度學習框架的廣泛使用,使得許多 ML 從業者能夠使用適合的領域特定的編程語言和豐富的構建模塊更容易地組裝模型。

回顧深度學習框架的演變,我們可以清楚地看到深度學習框架和深度學習算法之間的緊密耦合關系。這種相互依賴的良性循環推動了深度學習框架和工具的快速發展。

By Nationalmuseet, CC BY-SA 3.0,

https://commons.wikimedia.org/w/index.php?curid=90400464

石器時代(21 世紀初)

神經網絡的概念已經出現一段時間了。在 21 世紀初之前,有一些工具可以用來描述和開發神經網絡。這些工具包括 MATLAB、OpenNN、Torch 等,它們要么不是專門為神經網絡模型開發定制的,要么擁有復雜的用戶 api,缺乏 GPU 支持。在此期間,ML 實踐者在使用這些原始的深度學習框架時不得不做很多繁重的工作。

By Nationalmuseet, CC BY-SA 3.0,

https://commons.wikimedia.org/w/index.php?curid=90400464

青銅時代(~2012 年)

2012 年,多倫多大學的 Alex Krizhevsky 等人提出了一種深度神經網絡架構,后來被稱為 AlexNet[1],該架構在 ImageNet 數據集上達到了 SOTA 精度,并大大超過了第二名的選手。這一出色的結果引發了深度神經網絡的熱潮,此后各種深度神經網絡模型在 ImageNet 數據集的準確性上不斷創下新高。

大約在這個時候,一些早期的深度學習框架,如 Caffe、Chainer 和Theano 應運而生。使用這些框架,用戶可以方便地建立復雜的深度神經網絡模型,如 CNN、RNN、LSTM 等。此外,這些框架還支持多 GPU 訓練,這大大減少了對這些模型的訓練時間,并且能夠對以前無法裝入單一 GPU 內存的大型模型進行訓練。在這些框架中,Caffe 和 Theano 使用聲明式編程風格,而 Chainer 采用命令式編程風格。這兩種不同的編程風格也為即將到來的深度學習框架設定了兩條不同的開發路徑。

Nordisk familjebok — Nordisk familjebok (1910), vol.13, Till art. J?rn?ldern. https://commons.wikimedia.org/w/index.php?curid=109777

鐵器時代(2015 ~ 2016)

AlexNet 的成功引起了計算機視覺領域的高度關注,并重新點燃了神經網絡的希望,大型科技公司加入了開發深度學習框架的行列。其中,谷歌開源了著名的 TensorFlow 框架,它至今仍是 ML 領域最流行的深度學習框架。Caffe 的發明者加入了 Facebook 并發布了 Caffe2;與此同時,Facebook AI 研究(FAIR)團隊也發布了另一個流行的框架 PyTorch,它基于 Torch 框架,但使用了更流行的 Python api。微軟研究院開發了 CNTK 框架。亞馬遜采用了 MXNet,這是華盛頓大學、CMU 和其他機構的聯合學術項目。TensorFlow 和 CNTK 借鑒了 Theano 的聲明式編程風格,而 PyTorch 則繼承了 Torch 的直觀和用戶友好的命令式編程風格。命令式編程風格更加靈活(比如定義一個 While 循環等)并且容易跟蹤,而聲明式編程風格通常為內存和基于計算圖的運行時優化提供了更多的空間。另一方面,被稱為「mix」-net 的 MXNet 同時支持一組符號(聲明性)api 和一組命令式 api,并通過一種稱為雜交(hybridization)的方法優化了使用命令式 api 描述的模型的性能,從而享受了這兩個領域的好處。 2015 年,何凱明等人提出了 ResNet[2],再次突破了圖像分類的邊界,在 ImageNet 的準確率上再創新高。業界和學界已經達成共識,深度學習將成為下一個重大技術趨勢,解決各種領域的挑戰,這些挑戰在過去被認為是不可能的。在此期間,所有深度學習框架都對多 GPU 訓練和分布式訓練進行了優化,提供了更加用戶直觀的 api,并衍生出了專門針對計算機視覺、自然語言處理等特定任務的 model zoo 和工具包。還值得注意的是,Francois Chollet 幾乎是獨自開發了 Keras 框架,該框架在現有框架(如 TensorFlow 和 MXNet)之上提供了神經網絡和構建塊的更直觀的高級抽象。從今天開始,這種抽象成為 TensorFlow 中模型層面事實上的 api。

By User Lamré on sv.wikipedia

https://commons.wikimedia.org/w/index.php?curid=801434

羅馬時代(2019 ~ 2020)

正如人類歷史的發展一樣,深度學習框架經過一輪激烈的競爭,最終形成了兩大「帝國」:TensorFlow 和 PyTorch 的雙頭壟斷,這兩大「帝國」代表了深度學習框架研發和生產中 95% 以上的用例。2019 年,Chainer 團隊_將他們的開發工作轉移到 PyTorch;類似地,微軟_停止了 CNTK 框架的積極開發,部分團隊成員轉而支持 Windows 和 ONNX 運行時上的 PyTorch。Keras 被 TensorFlow 收編,并在 TensorFlow 2.0 版本中成為其高級 api 之一。在深度學習框架領域,MXNet 仍然位居第三。

在此期間,深度學習框架空間有兩種趨勢。首先是大型模型訓練。隨著 BERT[3] 的誕生,以及它的近親 GPT-3[4] 的誕生,訓練大型模型的能力成為了深度學習框架的理想特性。這就要求深度學習框架能夠在數百臺(如果不是數千臺的話)設備的規模下有效地進行訓練。第二個趨勢是可用性。這一時期的深度學習框架都采用命令式編程風格,語義靈活,調試方便。同時,這些框架還提供了用戶級的裝飾器或 api,以通過一些 JIT(即時)編譯器技術實現高性能。

By Tharunbr77 — Own work, CC BY-SA 4.0,

https://commons.wikimedia.org/w/index.php?curid=86866550

工業時代(2021+)

深度學習在自動駕駛、個性化推薦、自然語言理解到醫療保健等廣泛領域取得了巨大成功,帶來了前所未有的用戶、開發者和投資者浪潮。這也是未來十年開發深度學習工具和框架的黃金時期。盡管深度學習框架從一開始就有了長足的發展,但它們之于深度學習的地位還遠遠不如編程語言 JAVA/ c++ 之于互聯網應用那樣的成熟。還有很多令人興奮的機會和工作有待探索和完成。 展望未來,有幾個技術趨勢有望成為下一代深度學習框架的主流:

基于編譯器的算子(operator)優化。

如今,許多操作符內核都是通過手動或第三方庫實現的,比如 BLAS、CuDNN、OneDNN 等,這些庫針對特定的硬件平臺。當模型被訓練或部署在不同的硬件平臺上時,這會造成很大的開銷。此外,新的深度學習算法的增長速度往往比這些庫的迭代速度快得多,這使得這些庫常常不支持新的算子。深度學習編譯器,如 Apache TVM、MLIR、Facebook Glow 等,已經提出了在任何硬件后端上有效優化和運行計算的建議。它們可以作為深度學習框架的整個后端。

統一的 API 標準。

許多深度學習框架共享類似但略有不同的用戶 api。這給用戶從一個框架切換到另一個框架帶來了困難和不必要的學習曲線。雖然大多數機器學習從業者和數據科學家都熟悉 NumPy庫,但在新的深度學習框架中,NumPy API 自然會成為 tenor 操作 API 的標準。我們已經看到快速發展的框架 JAX 受到了用戶的熱烈歡迎,它的 api 完全與 NumPy 兼容。

數據搬運作為一等公民。

多節點或多設備訓練正在成為深度神經網絡訓練的規范。最近開發的深度學習框架,如 OneFlow,從設計的第一天起就將這一觀點納入設計考慮,并將數據通信視為模型訓練的整體計算圖的一部分。這為性能優化打開了更多的機會,而且由于它不需要像以前的深度學習框架那樣維護多種訓練策略(單設備 vs 分布式訓練),因此除了提供更好的性能之外,它還可以提供更簡單的用戶界面。

總結

我們正處于一場人工智能革命的黎明。人工智能領域的新研究和新應用正在以前所未有的速度涌現。八年前,AlexNet 網絡包含 6000 萬個參數最新的 GPT-3 網絡包含 1750 億參數,網絡規模在 8 年內增加了 3000 倍!另一方面,人類的大腦包含大約 100 萬億個參數(即突觸)。這表明,如果有可能的話,神經網絡要達到人類的智能水平還有很大的差距。

這種難以接受的網絡規模對模型訓練和推理的硬件和軟件計算效率都提出了很大的挑戰。未來的深度學習框架很可能是算法、高性能計算、硬件加速器和分布式系統的跨學科成果。

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8438

    瀏覽量

    133078
  • 深度學習
    +關注

    關注

    73

    文章

    5513

    瀏覽量

    121544
  • pytorch
    +關注

    關注

    2

    文章

    808

    瀏覽量

    13359

原文標題:深度學習框架簡史:TF和PyTorch雙頭壟斷,未來十年迎來黃金時期

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    上海貝嶺數字隔離器產品介紹

    數字隔離器作為二十一世紀新推出的隔離技術,以其更高的可靠性、簡化的外圍器件,高集成特性,已被廣泛用于工業控制、汽車、儀表、醫療等應用。
    的頭像 發表于 12-19 17:24 ?264次閱讀
    上海貝嶺數字隔離器產品介紹

    上海貝嶺推出集成互鎖功能的六通道數字隔離器

    數字隔離器作為二十一世紀新推出的隔離技術,以其更高的可靠性、簡化的外圍器件,高集成特性,已被廣泛用于工業控制、汽車、儀表、醫療等應用。
    的頭像 發表于 12-12 16:43 ?328次閱讀
    上海貝嶺推出集成互鎖功能的六通道數字隔離器

    西井科技受邀出席第二十一屆上海知識產權國際論壇

    近日,以“知識產權賦能新質生產力發展”為主題的第二十一屆上海知識產權國際論壇在滬開幕。本屆論壇由國家知識產權局、世界知識產權組織和上海市人民政府共同主辦。市委副書記、市長龔正,國家知識產權局局長申長
    的頭像 發表于 12-06 15:30 ?302次閱讀

    基于MCX系列MCU的EBike儀表解決方案

    二十一世紀是電氣化的時代。相比于化石燃料驅動的車輛,電能驅動車輛具有顯著減少污染物排放、效率高、靜謐平順、行駛穩定、加速快的優點,并隨著充電設施的不斷完善,電能驅動車輛的應用已經越來越普及。電動自行車(EBike)也已成為現代城市出行的重要工具。
    的頭像 發表于 10-25 10:22 ?415次閱讀
    基于MCX系列MCU的EBike儀表解決方案

    云知聲亮相第二十一屆中國-東盟博覽會

    以“親誠惠容同發展 鑲鉆成冠創未來——促進中國—東盟自由貿易區3.0版建設和區域高質量增長”為主題的第二十一屆中國—東盟博覽會(以下簡稱“東博會”)在廣西南寧舉辦。
    的頭像 發表于 10-12 14:18 ?460次閱讀
    云知聲亮相第<b class='flag-5'>二十一</b>屆中國-東盟博覽會

    直徑測量工具的發展歷程

    關鍵字:直徑測量,工業直徑測量設備,線性尺量器,光電測徑儀, 直徑測量工具的發展歷程是一個悠久且不斷創新的過程,它隨著科學技術的進步而不斷演變。以下是直徑測量工具發展歷程的詳細概述:
    發表于 10-10 16:55

    二十一屆亞太智能建筑論壇精彩回顧

    二十一屆亞太智能建筑論壇暨第六屆青年智能建筑專家年會在靜安區洲際酒店順利落幕。為期兩天的展會吸引了眾多來賓的熱情關注。在此,安科瑞衷心感謝每一位蒞臨我們展位的朋友,你們的信任與支持是我們不斷前行
    的頭像 發表于 09-01 08:01 ?341次閱讀
    第<b class='flag-5'>二十一</b>屆亞太智能建筑論壇精彩回顧

    回溯英特爾在跨越半個世紀發展歷程

    我們以英特爾三位風云人物的三句名言為線索,回溯英特爾在跨越半個世紀發展歷程中,如何利用芯片技術的力量,影響信息時代,開啟未來之門。
    的頭像 發表于 08-16 14:58 ?777次閱讀

    直線電機生產廠家談衛星互聯網高軌衛星成功發射

    高軌衛星02星發射升空,隨后衛星順利進入預定軌道…… 據 直線電機生產廠家 小編所知,二十一世紀六十年代以來,人類已經將數以百計的通信廣播衛星送入高軌道,在實現全球遠距離通信和電視傳輸方面,這些衛星一直擔當主角。高軌道衛星(GEO)移動
    的頭像 發表于 08-16 08:13 ?292次閱讀
    直線電機生產廠家談衛星互聯網高軌衛星成功發射

    NAND閃存的發展歷程

    NAND閃存的發展歷程是一段充滿創新與突破的歷程,它自誕生以來就不斷推動著存儲技術的進步。以下是對NAND閃存發展
    的頭像 發表于 08-10 16:32 ?1481次閱讀

    NVIDIA推出全新深度學習框架fVDB

    在 SIGGRAPH 上推出的全新深度學習框架可用于打造自動駕駛汽車、氣候科學和智慧城市的 AI 就緒型虛擬表示。
    的頭像 發表于 08-01 14:31 ?686次閱讀

    關于直線電機尺寸問題的解析

    二十一世紀以來,隨著我國科技地飛速發展,各行各業都搭上了這趟“快班車”,直線電機也不例外。近十幾年以來,直線電機地發展可以用“天翻地覆”來形
    的頭像 發表于 07-29 08:35 ?374次閱讀
    關于直線電機尺寸問題的解析

    TensorFlow與PyTorch深度學習框架的比較與選擇

    深度學習作為人工智能領域的一個重要分支,在過去十年中取得了顯著的進展。在構建和訓練深度學習模型的過程中,深度
    的頭像 發表于 07-02 14:04 ?1071次閱讀

    2024第二十一屆(上海)國際物聯網展覽會4月24日-26日開幕

    交流產業信息,把脈發展方向,IOTE 國際物聯網展是每年物聯網行業、企業、用戶交流合作的大型平臺。2024年4月24-26日IOTE?2024第二十一屆國際物聯網展?上海站,在上海世博展覽館開展。
    的頭像 發表于 04-26 17:59 ?653次閱讀
    2024第<b class='flag-5'>二十一</b>屆(上海)國際物聯網展覽會4月24日-26日開幕

    閃耀灣區,諾安智能獲評第二十一屆“深圳知名品牌(灣區知名品牌)”稱號

    2024年3月5日,深圳知名品牌評價委員會召開第二十一屆“深圳知名品牌”評審會議,審核評選出113個市場占有率高、誠信度高、品牌知名度高的企業品牌為第二十一屆深圳知名品牌。諾安智能在全市50多個細分
    的頭像 發表于 03-20 09:13 ?636次閱讀
    閃耀灣區,諾安智能獲評第<b class='flag-5'>二十一</b>屆“深圳知名品牌(灣區知名品牌)”稱號
    卡卡湾网上娱乐| 百家乐心术| 凯旋门百家乐娱乐城| 百家乐赢赌场百家乐| 百家乐l路单| 玩百家乐有何技巧| 百家乐庄闲出现几| 大发888捕鱼游戏| 棋牌英雄传| 网上真钱娱乐城| 靖西县| 新葡京百家乐官网现金网| 辽阳县| 百家乐官网对冲套红利| 闲和庄百家乐官网的玩法技巧和规则| 鼎尚百家乐官网的玩法技巧和规则| 百家乐赌场国际| 打百家乐庄闲的技巧| 大发888真人游戏| 大玩家娱乐城| 百家乐官网娱乐城备用网址| 索罗门百家乐官网的玩法技巧和规则 | 百家乐发牌盒子| 二八杠分析仪| 六合彩现金网| 百家乐官网作弊知识| 百家乐娱乐城代理| 真人百家乐最高赌注| 海王星国际娱乐| 好用百家乐官网软件| 百家乐官网那里最好| 百家乐任你博娱乐网| 大发888游戏注册| 盛大69棋牌游戏| 百家乐官网棋牌交| 百家乐如何投注技巧| 百家乐软件| 狮威娱乐城| 如何打百家乐官网的玩法技巧和规则| 百家乐分享| 赌博网站|