那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

國產(chǎn)框架超越 PyTorch 和 TensorFlow?

人工智能與大數(shù)據(jù)技術(shù) ? 來源:中國網(wǎng)科學(xué) ? 作者:HyperAI超神經(jīng) ? 2021-04-09 15:11 ? 次閱讀

深度學(xué)習(xí)領(lǐng)域,PyTorch、TensorFlow 等主流框架,毫無疑問占據(jù)絕大部分市場(chǎng)份額,就連百度這樣級(jí)別的公司,也是花費(fèi)了大量人力物力,堪堪將 PaddlePaddle 推入主流。

在這樣資源主導(dǎo)、肉食者謀的競(jìng)爭(zhēng)環(huán)境下,一家國產(chǎn)深度學(xué)習(xí)框架的創(chuàng)業(yè)公司 OneFlow 出現(xiàn)了。

它以處理大規(guī)模模型見長(zhǎng),甚至今年將全部源碼和實(shí)驗(yàn)對(duì)比數(shù)據(jù),在 GitHub 進(jìn)行了開源。

質(zhì)疑不可避免的出現(xiàn)了:OneFlow 這種擅長(zhǎng)解決大模型訓(xùn)練的新架構(gòu)有必要嗎?深度學(xué)習(xí)框架的效率有那么重要嗎?創(chuàng)業(yè)公司有可能在競(jìng)爭(zhēng)中脫穎而出么?

我們借著 CosCon 20' 開源年會(huì)的機(jī)會(huì),采訪了一流科技 CEO 袁進(jìn)輝,了解到了他和一流科技的工程師們,1300 多個(gè)日日夜夜、數(shù)十萬行代碼背后的故事。

光環(huán)再多,創(chuàng)業(yè)也得一步一個(gè)腳印

2016 年 11 月,袁進(jìn)輝在清華附近的一棟寫字樓里,寫下了 OneFlow 的第一版設(shè)計(jì)理念。此時(shí)的袁進(jìn)輝剛剛從工作了近 4 年的微軟亞洲研究院(MSRA)離職。

「MSRA 前員工」并不是袁進(jìn)輝身上唯一的 tag,2003 年從西安電子科技大學(xué)本科畢業(yè)后,他被保送到清華大學(xué)計(jì)算機(jī)系繼續(xù)直博學(xué)習(xí),師從中國科學(xué)院院士、中國 AI 學(xué)科奠基人之一張鈸教授。

2008 年袁進(jìn)輝從清華大學(xué)畢業(yè)后,先后加入網(wǎng)易、360 搜索。他開發(fā)的鷹眼系統(tǒng),被中國國家隊(duì)作為日常訓(xùn)練輔助系統(tǒng)。除此之外,他在 MSRA 工作期間,專注于大規(guī)模機(jī)器學(xué)習(xí)平臺(tái),還研發(fā)出了當(dāng)時(shí)世界上最快的主題模型訓(xùn)練算法和系統(tǒng) LightLDA,被應(yīng)用于微軟在線廣告系統(tǒng)。

LightLDA 于 2014 年面世,僅僅兩年之后,獨(dú)具慧眼的袁進(jìn)輝就又萌生了一個(gè)大膽地猜想:隨著業(yè)務(wù)需求和場(chǎng)景的豐富,能高效處理大模型訓(xùn)練的分布式深度學(xué)習(xí)框架,必然成為繼 Hadoop、Spark 之后,數(shù)據(jù)智能時(shí)代基礎(chǔ)設(shè)施的核心。

但是當(dāng)時(shí)主流的深度學(xué)習(xí)框架都是由 Google、Amazon、Facebook 等大廠牽頭開發(fā)的,即使是國內(nèi)情況也類似。這由于開發(fā)深度學(xué)習(xí)框架不光需要雄厚的研發(fā)成本,更重要的是能耐得住寂寞,做好打持久戰(zhàn)的準(zhǔn)備,因此尚沒有初創(chuàng)企業(yè)敢在該領(lǐng)域試水。

已有的深度學(xué)習(xí)框架都已經(jīng)打的如火如荼了,一家初創(chuàng)企業(yè),又搞出來一個(gè)新框架,會(huì)有用戶買單嗎?行動(dòng)派袁進(jìn)輝不但敢想,他還敢干。

敲下 OneFlow 第一行代碼的時(shí)候,他還沒想清楚詳細(xì)地實(shí)現(xiàn)策略,更談不上完善的業(yè)務(wù)邏輯。他的想法很簡(jiǎn)單,又很復(fù)雜,要做一款「開發(fā)者愛用」的產(chǎn)品

一群天才+21 個(gè)月,OneFlow 初版上線

2017 年 1 月,袁進(jìn)輝成立一流科技,召集了 30 多位工程師,開啟了 OneFlow 的正式「團(tuán)戰(zhàn)」。盡管大家對(duì)困難已經(jīng)做了充分預(yù)估,但是隨著開發(fā)的逐漸深入,涌現(xiàn)的重重困難還是出乎的團(tuán)隊(duì)的意料。

深度學(xué)習(xí)框架的技術(shù)非常復(fù)雜,況且 OneFlow 采用了一個(gè)全新的技術(shù)架構(gòu),沒有先例可以參考,光是把技術(shù)設(shè)想跑通,就花了快兩年時(shí)間。

2018 年秋天,一流科技的發(fā)展進(jìn)入了最艱難的階段。產(chǎn)品研發(fā)遲遲不能定型,一些員工的耐心跟信心消耗殆盡,加上公司下輪融資一波三折,團(tuán)隊(duì)的士氣和信心面臨極大挑戰(zhàn)。

在創(chuàng)業(yè)圈有個(gè)「18 個(gè)月魔咒」的說法,意思是一年半沒看到希望,沒有正反饋,創(chuàng)業(yè)團(tuán)隊(duì)的心態(tài)就會(huì)發(fā)生變化,失去耐心。袁進(jìn)輝意識(shí)到,不能再等了,必須要盡早在真實(shí)場(chǎng)景去使用 OneFlow,讓大家看到 OneFlow 的創(chuàng)新的確是有價(jià)值的, 從而形成正反饋。

2018 年 9 月,在經(jīng)歷了長(zhǎng)達(dá) 1 年 9 個(gè)月的研發(fā)后,袁進(jìn)輝和團(tuán)隊(duì)推出了 OneFlow 閉源版。當(dāng)時(shí) OneFlow 還沒有開源,也存在大大小小的問題,但產(chǎn)品正式發(fā)布了,總算是給團(tuán)隊(duì)成員吃了個(gè)定心丸。

專注大規(guī)模訓(xùn)練,效率秒殺同類框架

2018 年 11 月,幸運(yùn)之神降臨到一流科技。Google 推出了最強(qiáng)自然語言模型 BERT,開啟了 NLP 新時(shí)代。這驗(yàn)證了袁進(jìn)輝的預(yù)測(cè),擅長(zhǎng)處理大規(guī)模訓(xùn)練的新架構(gòu),是必須且必要的。

很快,一流科技的工程師就基于 OneFlow 支持了 BERT-Large 的分布式訓(xùn)練,這也是當(dāng)時(shí)唯一一個(gè)支持分布式 BERT-Large 訓(xùn)練的框架,性能和處理速度遠(yuǎn)超已有的開源框架。

ce11a668-989f-11eb-8b86-12bb97331649.png

OneFlow 異構(gòu)分布式流式系統(tǒng)架構(gòu)圖

OneFlow 「一戰(zhàn)成名」,這也為一流科技積累第一批頭部互聯(lián)網(wǎng)企業(yè)用戶提供了契機(jī)。令人倍感意外的是,當(dāng)時(shí)的袁進(jìn)輝因?yàn)椤溉詫?duì)產(chǎn)品不滿意」,所以選擇了一條格外低調(diào)的路。

從 2018 年 9 月閉源版本發(fā)布,到 2020 年 7 月正式開源,袁進(jìn)輝又用了 22 個(gè)月來打磨 OneFlow。他和團(tuán)隊(duì)一邊持續(xù)優(yōu)化經(jīng)典模型,一邊解決原來沒預(yù)計(jì)到的問題,在袁進(jìn)輝看來,哪怕是產(chǎn)品文檔沒做好,他都不會(huì)輕易把 OneFlow 推到臺(tái)面上。

2020 年 7 月 31 日,OneFlow 正式在 GitHub 開源。這個(gè)以訓(xùn)練大規(guī)模模型著稱的開源框架,第二次站到聚光燈下,完美詮釋了四個(gè)字--效率為王。

ce2f9e70-989f-11eb-8b86-12bb97331649.png

深度學(xué)習(xí)框架版圖幾乎由美國企業(yè)主導(dǎo)

ce69eb84-989f-11eb-8b86-12bb97331649.png

國內(nèi)開源的深度學(xué)習(xí)框架版圖中

只有 OneFlow 是由初創(chuàng)企業(yè)研發(fā)并開源

訓(xùn)練速度更快、GPU 利用率更高、多機(jī)加速比更高、運(yùn)維成本更低、用戶上手難度更低,五個(gè)強(qiáng)大優(yōu)勢(shì)讓 OneFlow 能快速適應(yīng)各個(gè)場(chǎng)景,并進(jìn)行快速延展。袁進(jìn)輝和團(tuán)隊(duì)對(duì) OneFlow 的性能追求和優(yōu)化,達(dá)到了極致。

近期,OneFlow 發(fā)布了 v0.2.0 版本,更新的性能優(yōu)化多達(dá) 17 個(gè),使得 CNN 和 BERT 的自動(dòng)混合精度訓(xùn)練速度大幅提升。

開發(fā)團(tuán)隊(duì)還建立了一個(gè)名為 DLPerf 的開源項(xiàng)目,將實(shí)驗(yàn)環(huán)境、實(shí)驗(yàn)數(shù)據(jù)、可復(fù)現(xiàn)算法完全開源,測(cè)評(píng)了在相同的物理環(huán)境上(4臺(tái) V100 16G x8的機(jī)器),OneFlow 和其他幾個(gè)主流框架在 ResNet50-v1.5 和 BERT-base 模型上的吞吐率及加速比。

cf9ae314-989f-11eb-8b86-12bb97331649.png

7 個(gè)框架在 ResNet50-v1.5 模型上的吞吐率對(duì)比

結(jié)果證明 OneFlow 在單機(jī)單卡、多機(jī)多卡下的吞吐率都明顯領(lǐng)先其他框架,成為在主流旗艦顯卡(V100 16G)上訓(xùn)練 ResNet50-v1.5 和 BERT-base 模型最快的框架,OneFlow ResNet50-v1.5 AMP 單卡比 NVIDIA 深度優(yōu)化過的 PyTorch 快 80%, 比 TensorFlow 2.3 快 35%。

直面質(zhì)疑,做賽道的「少數(shù)派」

事實(shí)上,OneFlow 從誕生至今,受到的質(zhì)疑并不在少數(shù),「上車晚且生存空間狹小」是最主流的聲音,對(duì)此袁進(jìn)輝表現(xiàn)出了超乎尋常的坦然。

在他看來,深度學(xué)習(xí)框架本就是一個(gè)新生事物,技術(shù)和產(chǎn)業(yè)都在中早期,不存在上車早晚的問題。在技術(shù)收斂之前,性能高、易用性強(qiáng)、符合用戶使用價(jià)值的產(chǎn)品,就會(huì)受到用戶的青睞。

至于生存空間小一說,更是子虛烏有。開源讓小公司和大公司的產(chǎn)品有機(jī)會(huì)公平競(jìng)技,優(yōu)秀的新生框架挑戰(zhàn)權(quán)威的框架,正是開源精神的內(nèi)核之一。

質(zhì)疑聲并沒有阻礙 OneFlow 的發(fā)展,相反,袁進(jìn)輝和團(tuán)隊(duì)加快了 OneFlow 的升級(jí)和完善進(jìn)程,更新優(yōu)化性能、梳理開發(fā)者文檔、收集社區(qū)反饋……這些努力和堅(jiān)持,為 OneFlow 吸引了更多用戶,其中不乏最初的「懷疑論者」。

在 COSCon'20中國開源年會(huì)上,袁進(jìn)輝做了題為《深度學(xué)習(xí)訓(xùn)練系統(tǒng)演進(jìn)》的分享,向所有開發(fā)者介紹了 OneFlow 下一步的開發(fā)規(guī)劃,除了堅(jiān)持效率為王、繼續(xù)性能優(yōu)化外,開發(fā)團(tuán)隊(duì)還在努力降低用戶的學(xué)習(xí)成本和遷移成本。目前 PyTorch 用戶遷移到 OneFlow 的成本已經(jīng)相當(dāng)?shù)土耍驗(yàn)槎叩挠脩?a target="_blank">接口幾乎一樣,已訓(xùn)練好的模型轉(zhuǎn)換成 OneFlow 的成本也足夠低。

客觀講,OneFlow 在完備性和易用性上,與 TensorFlow 和 PyTorch 相比還有差距。但是,OneFlow 的特色是效率高、擴(kuò)展性好以及分布式特別容易使用,非常適合大規(guī)模人臉識(shí)別、大規(guī)模廣告推薦系統(tǒng)、以及類似 GPT-3 這種模型參數(shù)巨大的模型訓(xùn)練場(chǎng)景。

采訪的最后袁進(jìn)輝老師也毫不掩飾對(duì)人才的渴望,他表示 OneFlow 正在招聘機(jī)器學(xué)習(xí)工程師以及深度學(xué)習(xí)工程師,非常歡迎有識(shí)之士加入這個(gè)朝氣勃勃、渴望勝利的團(tuán)隊(duì)。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 框架
    +關(guān)注

    關(guān)注

    0

    文章

    403

    瀏覽量

    17542
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3402

    瀏覽量

    42711
  • pytorch
    +關(guān)注

    關(guān)注

    2

    文章

    808

    瀏覽量

    13360
  • OneFlow
    +關(guān)注

    關(guān)注

    0

    文章

    9

    瀏覽量

    8814

原文標(biāo)題:超越 PyTorch 和 TensorFlow,這個(gè)國產(chǎn)框架有點(diǎn)東西

文章出處:【微信號(hào):TheBigData1024,微信公眾號(hào):人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    PyTorch 2.5.1: Bugs修復(fù)版發(fā)布

    ? 一,前言 在深度學(xué)習(xí)框架的不斷迭代中,PyTorch 社區(qū)始終致力于提供更穩(wěn)定、更高效的工具。最近,PyTorch 2.5.1 版本正式發(fā)布,這個(gè)版本主要針對(duì) 2.5.0 中發(fā)現(xiàn)的問題進(jìn)行了修復(fù)
    的頭像 發(fā)表于 12-03 16:11 ?710次閱讀
    <b class='flag-5'>PyTorch</b> 2.5.1: Bugs修復(fù)版發(fā)布

    RK3568國產(chǎn)處理器 + TensorFlow框架的張量創(chuàng)建實(shí)驗(yàn)案例分享

    一、實(shí)驗(yàn)?zāi)康?本節(jié)視頻的目的是了解張量定義、了解張量的表示形式、并學(xué)習(xí)基于TensorFlow框架的張量創(chuàng)建方法。 二、實(shí)驗(yàn)原理. 張量定義 1、張量是多維數(shù)組,這個(gè)定義常見于各種人工智能軟件。 2
    發(fā)表于 12-03 14:43

    pytorch和python的關(guān)系是什么

    PyTorch已經(jīng)成為了一個(gè)非常受歡迎的框架。本文將介紹PyTorch和Python之間的關(guān)系,以及它們?cè)谏疃葘W(xué)習(xí)領(lǐng)域的應(yīng)用。 Python簡(jiǎn)介 Python是一種高級(jí)、解釋型、通用的編程語言,由Guido van Rossu
    的頭像 發(fā)表于 08-01 15:27 ?2339次閱讀

    PyTorch深度學(xué)習(xí)開發(fā)環(huán)境搭建指南

    PyTorch作為一種流行的深度學(xué)習(xí)框架,其開發(fā)環(huán)境的搭建對(duì)于深度學(xué)習(xí)研究者和開發(fā)者來說至關(guān)重要。在Windows操作系統(tǒng)上搭建PyTorch環(huán)境,需要綜合考慮多個(gè)方面,包括軟件安裝、環(huán)境配置以及版本兼容性等。以下是一個(gè)詳細(xì)的
    的頭像 發(fā)表于 07-16 18:29 ?1278次閱讀

    TensorFlow是什么?TensorFlow怎么用?

    TensorFlow是由Google開發(fā)的一個(gè)開源深度學(xué)習(xí)框架,它允許開發(fā)者方便地構(gòu)建、訓(xùn)練和部署各種復(fù)雜的機(jī)器學(xué)習(xí)模型。TensorFlow憑借其高效的計(jì)算性能、靈活的架構(gòu)以及豐富的工具和庫,在學(xué)
    的頭像 發(fā)表于 07-12 16:38 ?810次閱讀

    基于PyTorch的卷積核實(shí)例應(yīng)用

    在深度學(xué)習(xí)和計(jì)算機(jī)視覺領(lǐng)域,卷積操作是一種至關(guān)重要的技術(shù),尤其在圖像處理和特征提取方面發(fā)揮著核心作用。PyTorch作為當(dāng)前最流行的深度學(xué)習(xí)框架之一,提供了強(qiáng)大的張量操作功能和靈活的API,使得實(shí)現(xiàn)
    的頭像 發(fā)表于 07-11 15:19 ?542次閱讀

    pytorch如何訓(xùn)練自己的數(shù)據(jù)

    本文將詳細(xì)介紹如何使用PyTorch框架來訓(xùn)練自己的數(shù)據(jù)。我們將從數(shù)據(jù)準(zhǔn)備、模型構(gòu)建、訓(xùn)練過程、評(píng)估和測(cè)試等方面進(jìn)行講解。 環(huán)境搭建 首先,我們需要安裝PyTorch。可以通過訪問PyTorc
    的頭像 發(fā)表于 07-11 10:04 ?620次閱讀

    pytorch中有神經(jīng)網(wǎng)絡(luò)模型嗎

    當(dāng)然,PyTorch是一個(gè)廣泛使用的深度學(xué)習(xí)框架,它提供了許多預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型。 PyTorch中的神經(jīng)網(wǎng)絡(luò)模型 1. 引言 深度學(xué)習(xí)是一種基于人工神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)技術(shù),它在圖像識(shí)別、自然語言
    的頭像 發(fā)表于 07-11 09:59 ?813次閱讀

    tensorflowpytorch哪個(gè)更簡(jiǎn)單?

    PyTorch更簡(jiǎn)單。選擇TensorFlow還是PyTorch取決于您的具體需求和偏好。如果您需要一個(gè)易于使用、靈活且具有強(qiáng)大社區(qū)支持的框架Py
    的頭像 發(fā)表于 07-05 09:45 ?975次閱讀

    tensorflowpytorch哪個(gè)好

    tensorflowpytorch都是非常不錯(cuò)的強(qiáng)大的框架TensorFlow還是PyTorch哪個(gè)更好取決于您的具體需求,以下是關(guān)于這
    的頭像 發(fā)表于 07-05 09:42 ?772次閱讀

    keras模型轉(zhuǎn)tensorflow session

    和訓(xùn)練深度學(xué)習(xí)模型。Keras是基于TensorFlow、Theano或CNTK等底層計(jì)算框架構(gòu)建的。TensorFlow是一個(gè)開源的機(jī)器學(xué)習(xí)框架,由Google Brain團(tuán)隊(duì)開發(fā)。
    的頭像 發(fā)表于 07-05 09:36 ?594次閱讀

    PyTorch的特性和使用方法

    使用Python重新寫了很多內(nèi)容,使其更加靈活易用。它不僅是一個(gè)擁有自動(dòng)求導(dǎo)功能的深度神經(jīng)網(wǎng)絡(luò)框架,還可以看作是一個(gè)加入了GPU支持的NumPy。PyTorch支持動(dòng)態(tài)圖,允許在運(yùn)行時(shí)構(gòu)建計(jì)算圖,這使得模型開發(fā)和調(diào)試過程更加直觀和方便。
    的頭像 發(fā)表于 07-02 14:27 ?646次閱讀

    TensorFlowPyTorch深度學(xué)習(xí)框架的比較與選擇

    深度學(xué)習(xí)作為人工智能領(lǐng)域的一個(gè)重要分支,在過去十年中取得了顯著的進(jìn)展。在構(gòu)建和訓(xùn)練深度學(xué)習(xí)模型的過程中,深度學(xué)習(xí)框架扮演著至關(guān)重要的角色。TensorFlowPyTorch是目前最受歡迎的兩大深度
    的頭像 發(fā)表于 07-02 14:04 ?1074次閱讀

    使用PyTorch構(gòu)建神經(jīng)網(wǎng)絡(luò)

    PyTorch是一個(gè)流行的深度學(xué)習(xí)框架,它以其簡(jiǎn)潔的API和強(qiáng)大的靈活性在學(xué)術(shù)界和工業(yè)界得到了廣泛應(yīng)用。在本文中,我們將深入探討如何使用PyTorch構(gòu)建神經(jīng)網(wǎng)絡(luò),包括從基礎(chǔ)概念到高級(jí)特性的全面解析。本文旨在為讀者提供一個(gè)完整的
    的頭像 發(fā)表于 07-02 11:31 ?767次閱讀

    谷歌模型框架是什么軟件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌開發(fā)的用于機(jī)器學(xué)習(xí)和人工智能的軟件框架,其中最著名的是TensorFlowTensorFlow是一個(gè)開源的機(jī)器學(xué)習(xí)框架
    的頭像 發(fā)表于 03-01 16:25 ?965次閱讀
    百家乐赌场娱乐网规则| 菲律宾卡卡湾| 菲律宾百家乐官网娱乐网| 百家乐是如何骗人的| 足球心水论坛| 女性做生意的风水| 德州扑克在线游戏| 百家乐官网9点直赢| 运城百家乐的玩法技巧和规则| 利好国际| 百家乐试玩网站| 大发888官网网址| 蓝盾百家乐官网具体玩法| 威尼斯人娱乐场官网是多少| 百家乐官网前四手下注之观点| 百家乐知识技巧玩法| 平阳县| 百家乐游戏台| bet365体育投注| 乐天堂百家乐官网赌场娱乐网规则 | 网络百家乐官网可靠吗| 赙彩百家乐游戏规则| 棋牌网| 模拟百家乐官网的玩法技巧和规则 | 澳门百家乐官网牌例| 威尼斯人娱乐场积分| 澳门赌百家乐官网的玩法技巧和规则 | 金花百家乐官网的玩法技巧和规则| 新加坡百家乐的玩法技巧和规则| 澳门百家乐官网心得玩博| 百家乐筹码托盘| 七胜百家乐官网娱乐城总统网上娱乐城大都会娱乐城赌场 | 真钱百家乐官网送钱| 塑料百家乐筹码| 普定县| 澳门百家乐技巧经| 二八杠下载| 立博百家乐游戏| 爱博彩| 网上百家乐记牌软件| 什么是百家乐官网平注法|