那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

用什么加快計算速度?異構處理器來助力

5RJg_mcuworld ? 來源:互聯網 ? 作者:佚名 ? 2018-04-28 09:25 ? 次閱讀

算機發展到今天,已經大大改變了我們的生活,我們已經進入了智能化的時代。但要是想實現影視作品中那樣充分互動的人工智能與人機互動系統,就不得不提到深度學習

深度學習

深度學習的概念源于人工神經網絡的研究。含多隱層的多層感知器就是一種深度學習結構。深度學習通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發現數據的分布式特征表示。

深度學習的概念由Hinton等人于2006年提出。基于深信度網(DBN)提出非監督貪心逐層訓練算法,為解決深層結構相關的優化難題帶來希望,隨后提出多層自動編碼器深層結構。此外Lecun等人提出的卷積神經網絡是第一個真正多層結構學習算法,它利用空間相對關系減少參數數目以提高訓練性能。

深度學習是機器學習研究中的一個新的領域,其動機在于建立、模擬人腦進行分析學習的神經網絡,它模仿人腦的機制來解釋數據,例如圖像,聲音和文本。

同機器學習方法一樣,深度機器學習方法也有監督學習與無監督學習之分。不同的學習框架下建立的學習模型很是不同.

例如,卷積神經網絡(Convolutional neural networks,簡稱CNNs)就是一種深度的監督學習下的機器學習模型,而深度置信網(Deep Belief Nets,簡稱DBNs)就是一種無監督學習下的機器學習模型。

Artificial Intelligence,也就是人工智能,就像長生不老和星際漫游一樣,是人類最美好的夢想之一。雖然計算機技術已經取得了長足的進步,但是到目前為止,還沒有一臺電腦能產生“自我”的意識。是的,在人類和大量現成數據的幫助下,電腦可以表現的十分強大,但是離開了這兩者,它甚至都不能分辨一個喵星人和一個汪星人。

圖靈(圖靈,大家都知道吧。計算機和人工智能的鼻祖,分別對應于其著名的“圖靈機”和“圖靈測試”)在 1950 年的論文里,提出圖靈試驗的設想,即,隔墻對話,你將不知道與你談話的,是人還是電腦。這無疑給計算機,尤其是人工智能,預設了一個很高的期望值。但是半個世紀過去了,人工智能的進展,遠遠沒有達到圖靈試驗的標準。這不僅讓多年翹首以待的人們,心灰意冷,認為人工智能是忽悠,相關領域是“偽科學”。

但是自 2006 年以來,機器學習領域,取得了突破性的進展。圖靈試驗,至少不是那么可望而不可及了。至于技術手段,不僅僅依賴于云計算對大數據的并行處理能力,而且依賴于算法。這個算法就是,Deep Learning。借助于 Deep Learning 算法,人類終于找到了如何處理“抽象概念”這個亙古難題的方法。

2012年6月,《紐約時報》披露了Google Brain項目,吸引了公眾的廣泛關注。這個項目是由著名的斯坦福大學的機器學習教授Andrew Ng和在大規模計算機系統方面的世界頂尖專家JeffDean共同主導,用16000個CPU Core的并行計算平臺訓練一種稱為“深度神經網絡”(DNN,Deep Neural Networks)的機器學習模型(內部共有10億個節點。這一網絡自然是不能跟人類的神經網絡相提并論的。要知道,人腦中可是有150多億個神經元,互相連接的節點也就是突觸數更是如銀河沙數。曾經有人估算過,如果將一個人的大腦中所有神經細胞的軸突和樹突依次連接起來,并拉成一根直線,可從地球連到月亮,再從月亮返回地球),在語音識別和圖像識別等領域獲得了巨大的成功。

項目負責人之一Andrew稱:“我們沒有像通常做的那樣自己框定邊界,而是直接把海量數據投放到算法中,讓數據自己說話,系統會自動從數據中學習。”另外一名負責人Jeff則說:“我們在訓練的時候從來不會告訴機器說:‘這是一只貓。’系統其實是自己發明或者領悟了“貓”的概念。”

2012年11月,微軟在中國天津的一次活動上公開演示了一個全自動的同聲傳譯系統,講演者用英文演講,后臺的計算機一氣呵成自動完成語音識別、英中機器翻譯和中文語音合成,效果非常流暢。據報道,后面支撐的關鍵技術也是DNN,或者深度學習(DL,DeepLearning)。

用什么加快計算速度?異構處理器

在摩爾定律的作用下,單核標量處理器的性能持續提升,軟件開發人員只需要寫好軟件,而性能就等待下次硬件的更新,在2003年之前的幾十年里,這種“免費午餐”的模式一直在持續。2003年后,主要由于功耗的原因,這種“免費的午餐”已經不復存在。為了生存,各硬件生產商不得不采用各種方式以提高硬件的計算能力,以下是目前最流行的幾種方式是。

(1)讓處理器一個周期處理多條指令 ,這多條指令可相同可不同。如Intel Haswell處理器一個周期可執行4條整數加法指令、2條浮點乘加指令,同時訪存和運算指令也可同時執行。

(2)使用向量指令 ,主要是SIMD和VLIW技術。SIMD技術將處理器一次能夠處理的數據位數從字長擴大到128或256位,也就提升了計算能力。

(3)在同一個芯片中集成多個處理單元 ,根據集成方式的不同,分為多核處理器或多路處理器。多核處理器是如此的重要,以至于現在即使是手機上的嵌入式ARM處理器都已經是四核或八核。

(4)使用異構處理器,不同的架構設計的處理器具有不同的特點,如X86 處理器為延遲優化,以減少指令的執行延遲為主要設計考量(當然今天的X86 處理器設計中也有許多為吞吐量設計的影子);如NVIDIA GPUAMD GPU則為吞吐量設計,以提高整個硬件的吞吐量為主要設計目標。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1796

    文章

    47666

    瀏覽量

    240262
  • 異構處理器
    +關注

    關注

    0

    文章

    9

    瀏覽量

    6461
  • 深度學習
    +關注

    關注

    73

    文章

    5513

    瀏覽量

    121544

原文標題:如何加速深度學習?GPU、FPGA還是專用芯片

文章出處:【微信號:mcuworld,微信公眾號:嵌入式資訊精選】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    量子計算速度超快,對信息安全構成威脅

    量子計算計算速度遠超傳統計算機,傳統的加密手段在量子計算面前毫無招架之力。
    發表于 05-13 09:16 ?1567次閱讀

    中國首個異構計算處理器IP核實現 可用于機器學習

    日前,中國華夏芯公司宣布,其異構計算處理器IP核已經在硅片上成功實現,并已通過HSA(異構系統架構)一致性測試。公司還宣布了新的機器學習和深層神經網絡的開源項目,旨在進一步推動HSA異構計算
    發表于 09-01 11:42 ?1316次閱讀

    AMD第七代APU處理器計算速度提升20%

    amd的第七代處理器在APU性能上也進行了優化,計算速度與Carrizo相比提升了20%,同時GPU和節能性上分別提升了37%和12%。
    發表于 09-07 19:12 ?920次閱讀

    異構眾核系統高性能計算架構

    隨著計算機技術的發展,單核處理器已經難以滿足高性能計算的需求,眾核處理器成為了一種有效的解決方案。眾核處理器是指在一個芯片上集成多個
    的頭像 發表于 11-30 08:27 ?814次閱讀
    <b class='flag-5'>異構</b>眾核系統高性能<b class='flag-5'>計算</b>架構

    淺談國產異構雙核RISC-V+FPGA處理器AG32VF407的優勢和應用場景

    關于國產異構雙核RISC-V+FPGA處理器AG32VF407的具體優勢和應用場景淺談如下: 優勢 異構計算能力 : 異構雙核設計結合了RISC-V的高效指令集和FPGA的靈活可編程性
    發表于 08-31 08:32

    求助:ucos下和linux下 計算速度的問題

    linux下低,其計算速度應該比較快,為什么會出現linux下比ucos下計算mac快這么多的情況? 是linux下對硬件進行的二次優化嗎?
    發表于 12-16 09:58

    在AM3359 ICE上跑裸機程序,VFP打開后為什么會影響整數的計算速度呢?

    您好,我寫了一個裸機程序在AM3359 ICE上跑,現在遇到一個很奇怪的問題。①代碼中只執行整數運算,VFP無效,計算速度非常快。但若打開VFP,計算速度會下降數十倍。②但另外一種情況,如果代碼只
    發表于 05-15 01:10

    DSP 6748計算速度

    做了一個DSP C6748+FPGA的電機控制+調制程序,發現6748計算速度慢,會出現程序執行不完的情況(之前28335做的都沒問題)。請教了周圍的人,有人說是沒有添加“快速運行庫” ,具體也不知道,懇請各位前輩指點迷津,
    發表于 05-14 17:01

    異構計算在人工智能什么作用?

    計算或外設管理等,從而達到性能和成本的最優化。異構計算大廚房里的CPU我們熟知的CPU (中央處理器,Central Processing Unit)作為通用處理器,是更偏重支持控制流
    發表于 08-07 08:39

    異構計算的前世今生

    算系統加速/協處理器的應用趨勢 / TOP5002020年以后,各國的超級計算機計劃都定位在了Exascale的百億億級別,要想實現目標,要么靠堆核心規模堆性能,要么就是選擇
    發表于 12-26 08:00

    基于異構并行計算的兩個子概念異構和并行的簡單分析

    異構并行計算包含兩個子概念:異構和并行。 1異構是指異構并行計算需要同時
    的頭像 發表于 01-25 16:37 ?6658次閱讀
    基于<b class='flag-5'>異構</b>并行<b class='flag-5'>計算</b>的兩個子概念<b class='flag-5'>異構</b>和并行的簡單分析

    異構計算的兩大派別 為什么需要異構計算

    20世紀80年代,異構計算技術就已經誕生了。所謂的異構,就是CPU、DSP、GPU、ASIC、協處理器、FPGA等各種計算單元、使用不同的類型指令集、不同的體系架構的
    發表于 04-28 11:41 ?2.3w次閱讀

    電機選型基礎知識第3部分:如何計算速度、加速扭矩和RMS扭矩

    電機選型基礎知識第 3 部分:如何計算速度、加速扭矩和 RMS 扭矩
    的頭像 發表于 03-09 15:16 ?2.4w次閱讀
    電機選型基礎知識第3部分:如何<b class='flag-5'>計算速度</b>、加速扭矩和RMS扭矩

    新型全光開關可提高計算處理器速度

    由于電子開關的局限性,傳統的計算處理器幾乎已經達到了它們的“時鐘速度”(衡量它們可以打開和關閉的速度的指標)。希望改進計算
    的頭像 發表于 12-25 14:55 ?738次閱讀
    新型全光開關可提高<b class='flag-5'>計算</b>機<b class='flag-5'>處理器</b><b class='flag-5'>速度</b>

    AM625SIP處理器如何透過整合LPDDR4,加快開發速度

    電子發燒友網站提供《AM625SIP處理器如何透過整合LPDDR4,加快開發速度.pdf》資料免費下載
    發表于 08-28 10:47 ?0次下載
    AM625SIP<b class='flag-5'>處理器</b>如何透過整合LPDDR4,<b class='flag-5'>加快</b>開發<b class='flag-5'>速度</b>
    永利高官网| 百家乐5式直缆打法| 新澳博百家乐官网的玩法技巧和规则 | 正品百家乐官网的玩法技巧和规则 | 百家乐官网全部规则| 百家乐官网唯一能长期赢钱的方法 | 大发888棋牌游戏下载| 久盛国际| 清苑县| 百家乐官网玩揽法的论坛| 百家乐官网小路单图解| 盈得利百家乐官网娱乐城| 百家乐怎么计算概率| 旧金山百家乐的玩法技巧和规则 | 81数理 做生意| 皇冠百家乐在线游戏| 百家乐出千桌| 巴登娱乐城信誉怎么样| 百家乐官网如何打公式| 百家乐官网这样赢保单分析| 家百家乐破解软件| 百家乐专业赌| 365赌球| 百家乐官网太阳城怎么样| 真人百家乐官网赌场娱乐网规则| 百家乐庄闲收益率| 大发888真人游戏| 巴里| 百家乐官网赌博赌博网站| 百家乐游戏规测| 威尼斯人娱乐城真人游戏| 类乌齐县| 电脑百家乐官网的玩法技巧和规则| 百家乐路单规则| 大发888真人娱乐场游戏| 百家乐官网赢钱海立方| 线上百家乐官网平玩法| 百家乐真人斗地主| 博彩通排名| 至尊百家乐官网吕文婉| 百家乐博弈之赢者理论坛|