前有全球千百萬開發(fā)者的熱烈追捧,后有谷歌爸爸的鼎力支持,TensorFlow從一出生開始就注定不平凡。
而谷歌剛剛宣布將推出TensorBoard.dev預覽版,用于共享TensorBoard機器學習可視化效果,同時發(fā)布的還有TensorFlow Enterprise,通過TensorFlow與云團隊之間的協(xié)作來生成云服務。
根據(jù)谷歌副總裁Megan Kacholia所言,“現(xiàn)在可以托管和跟蹤ML實驗,并實現(xiàn)公開共享,無需設置,只需上傳日志及共享URL,其他人即可查看實驗及使用TensorBoard所做的一切”。TensorFlow Enterprise旨在為大型企業(yè)提供TensorFlow的優(yōu)化版本,可提供多達3倍的數(shù)據(jù)讀取改進。
作為全球最熱的開源軟件平臺,TensorFlow的大名相信已經(jīng)不需要過多介紹。早在2011年,谷歌大腦團隊作為內(nèi)部機器學習工具而打造的DistBelief就凝聚了一大批谷歌杰出程序員的心血,其中不乏Jeff Dean這樣的天才人物。
2015年11月,以DistBelief為基礎,TensorFlow初版正式發(fā)布,立即引發(fā)強烈反響,當時就有報道將TensorFlow和2008年安卓手機操作系統(tǒng)的誕生相提并論,更有人稱TensorFlow的發(fā)布標志著“谷歌已經(jīng)從一家搜索公司,變成了一家機器學習公司。在未來幾年內(nèi)將在技術行業(yè)引發(fā)強烈震動。”
后來的事實證明,這個說法實際上并不準確,TensorFlow給技術行業(yè)帶來的不僅僅是震動,而是一場全方位的革命。正如MapReduce和Hadoop讓“大數(shù)據(jù)”變得家喻戶曉一樣,過去幾年來,伴隨著機器學習領域的飛躍式發(fā)展,在“機器學習”幾乎成為計算機科學的代名詞的過程中,TensorFlow更是居功至偉。
正值TensorFlow 2.0正式版發(fā)布不久之際,全球開發(fā)者和開源用戶又迎來了另一次歷史性的盛事:首屆TensorFlow World大會正于美國加州圣克拉拉舉辦。
短暫開場式后,Jeff Dean亮相做開場主題演講。
Jeff Dean:TensorFlow下載量已超4600萬
Jeff Dean表示,盡管芯片的摩爾定律可能面臨終結,但“AI論文數(shù)量”的摩爾定律可能才剛剛起步。現(xiàn)在,每天都有100篇機器學習領域的新論文誕生。
機器學習使得過去不可能的事情變得可能。語音識別、圖像識別翻譯和預測上的性能日新月異。2011年,機器學習圖像識別的錯誤率最低大概是26%,到了2016年,這個數(shù)字就迅速降至4%,錯誤率已經(jīng)低于經(jīng)過專業(yè)訓練的人類水平(5%)。
在語音識別和機器翻譯等其他基于機器學習的領域,也出現(xiàn)了同樣明顯的技術進步。
Jeff Dean在演講中列出了美國國家工程院于2008年發(fā)布的“21世紀14大工程學挑戰(zhàn)”。十年后的現(xiàn)在回過頭來看,有些問題已經(jīng)解決,有些看到了解決的希望,有些仍未解決。值得注意的是,在已經(jīng)解決的問題中,機器學習和AI發(fā)揮了不可或缺的作用。
重建和提升城市基礎設施
交通是城市生活的重要組成部分,在機器學習和計算機視覺技術的加持下,自動駕駛車輛的性能迅速提升,雷達、多角度攝像頭和傳感器讓車輛具備實時處理來自環(huán)境的原始數(shù)據(jù)的能力。換句話說,車輛能夠在行駛中實時快速理解周圍正在發(fā)生的事。
這些都不再是遙不可及的夢,谷歌旗下的自動駕駛車企業(yè)Waymo早已開始路測,從去年開始,Waymo的路測車輛中坐的是普通的乘客,而且拿掉了安全員。
重塑醫(yī)療信息學
Jeff Dean認為,在醫(yī)療領域,AI技術的最重要意義在于,將世界級的專業(yè)醫(yī)學服務,以極低的成本帶給了世界上更多的人。
以糖尿病視網(wǎng)膜病變?yōu)槔@是世界上導致可預防性致盲的疾病中增長最快的一種,全世界因該病而可能致盲的人群多達4億。通過每年定期檢查,可以有效防控這種疾病,降低致盲風險。但是做這種檢查需要專業(yè)的眼科醫(yī)生,一般醫(yī)生無法勝任,這導致印度有45%的患者因為眼科醫(yī)生數(shù)量短缺,沒能及時確診而致盲。
怎么辦?Jeff Dean表示,該病的診斷實際上可以通過計算機視覺來輔助進行,訓練深度神經(jīng)網(wǎng)絡學習“看圖診斷”。診斷結果很有意思,AI醫(yī)生和人類眼科醫(yī)生平均有60%的幾率給出一致的診斷意見,看上去并不高是吧?如果讓人類醫(yī)生隔幾個小時看同一張片子,兩次給出相同診斷意見的概率也只有65%。
這個問題其實不難解決。只要增加人類醫(yī)生的數(shù)量,繼續(xù)用標記圖像數(shù)據(jù)訓練AI模型,最終模型的診斷水平甚至能夠相當于甚至超過美國眼科醫(yī)生的平均水平。
NLP終于迎來新范式
前面許多進步都依賴于能夠理解文本,而在理解語言方面,最近取得了很大的進步。
2017年谷歌研究員提出Transformer模型,這篇論文非常成功,在英語-德語和英語-法語的機器翻譯中達到了最高的準確率,同時計算成本降低了10~100倍。
到了2018年,谷歌研究員提出BERT模型,這是一個強大的預訓練模型,如今已經(jīng)成為一種新的NLP范式。比如在“完形填空”這個任務中,它的原理是:
步驟1:使用大量的自我監(jiān)督文本,為“完形填空”任務預訓練一個模型
步驟2:使用少量數(shù)據(jù)對單個語言任務的模型進行微調(diào)。
在GLUE基準測試中,BERT模型在一系列語言任務中都取得了最好的結果。
Jeff Dean接著介紹Google在開發(fā)用于科學發(fā)現(xiàn)的工具方面的進展,無論是無人駕駛還是太空探索,都需要有最好的工具,TensorFlow就是其一。
TensorFlow現(xiàn)在已經(jīng)被下載46000000次,被用到各種各樣的任務當中,有些甚至超乎想象。
自動化機器學習AutoML
Jeff Dean 接下來介紹了 AutoML。
自動化機器學習的目標是為計算機開發(fā)能夠自動解決新的機器學習問題的技術,而不用每次遇到新問題都需要人類機器學習專家干預。如果我們想要真正的智能系統(tǒng),這是所需要的最基本的能力。AutoML 是使用強化學習和進化算法設計神經(jīng)網(wǎng)絡結構的新方法。
再如神經(jīng)架構搜索(NAS),這也是當前研究的一個熱點,它的想法是通過強化學習訓練模型生成器,然后:
(1)生成10個模型
(2)訓練幾個小時
(3)用生成的模型的損失作為強化學習信號
從而提升模型的準確性,應用到自己的任務中。
通過不斷迭代來找到最優(yōu)的模型,這樣的模型非常有效。
上面是一個圖像識別的模型。過去幾年深度學習在圖像識別方面取得了非常快速的進展,如下面的折線圖所示,縱軸表示圖像識別的準確性,橫軸表示浮點數(shù)量,藍色線條是AutoML的表現(xiàn),可以看到,模型的準確性在不斷提高。
Jeff Dean預測,由于計算能力的提升,自動化機器學習的能力會不斷增長。
圖像識別之外,在物體檢測、機器翻譯等領域也有同樣的趨勢。
最后,Jeff Dean總結了TensorFlow的目標:
- 大模型,但稀疏激活
- 單個模型解決多個任務
- 通過大模型動態(tài)地學習和成長路徑
- 模型架構根據(jù)需要進行調(diào)整
- 利用現(xiàn)有的技能和表示添加新任務
為什么要選擇TensorFlow 2.0?
谷歌副總裁Megan Kacholia為我們介紹了最新的TensorFlow 2.0。
圖:谷歌副總裁Megan Kacholia
TensorFlow 是一個端到端開源機器學習平臺。它擁有一個包含各種工具、庫和社區(qū)資源的全面靈活生態(tài)系統(tǒng),可以讓研究人員推動機器學習領域的先進技術的發(fā)展,并讓開發(fā)者輕松地構建和部署由機器學習提供支持的應用。
Megan把TensorFlow形容為“一個完整的生態(tài)系統(tǒng)”,可以幫助開發(fā)者使用機器學習解決棘手的現(xiàn)實問題。它具備3大特點:
1、輕松地構建模型
TensorFlow 提供多個抽象級別,因此開發(fā)者可以根據(jù)自己的需求選擇合適的級別。可以使用高階 Keras API 構建和訓練模型。如果對更高的靈活性又要求,則可以借助 Eager Execution 進行快速迭代和直觀的調(diào)試。對于大型機器學習訓練任務,可以使用 Distribution Strategy API 在不同的硬件配置上進行分布式訓練,而無需更改模型定義。
2、隨時隨地進行可靠的機器學習生產(chǎn)
TensorFlow 始終提供直接的生產(chǎn)途徑。不管是在服務器、邊緣設備還是網(wǎng)絡上,無論使用何種語言或平臺,TensorFlow 都可以讓開發(fā)者輕松地訓練和部署模型。如果需要完整的生產(chǎn)型機器學習流水線,可以使用 TensorFlow Extended (TFX);如果要在移動設備和邊緣設備上進行推斷,可以使用 TensorFlow Lite。如果想在 JavaScript 環(huán)境中訓練和部署模型,可以使用 TensorFlow.js 。
本文來自新智元,本文作為轉(zhuǎn)載分享。
-
谷歌
+關注
關注
27文章
6194瀏覽量
106016 -
機器學習
+關注
關注
66文章
8438瀏覽量
133085 -
自動駕駛
+關注
關注
785文章
13930瀏覽量
167007 -
tensorflow
+關注
關注
13文章
329瀏覽量
60631
發(fā)布評論請先 登錄
相關推薦
評論