那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

IBM開發(fā)“混合精度內(nèi)存計算”,能耗降低了80倍

DPVg_AI_era ? 來源:未知 ? 作者:胡薇 ? 2018-04-27 17:42 ? 次閱讀

IBM Research 稱,已經(jīng)開發(fā)出了一種內(nèi)存計算新方法,可以為微軟和谷歌尋求的高性能和機器學習應用的硬件加速器提供答案。

在近日 Nature Electronics 期刊上發(fā)表的一篇論文中,IBM 研究人員描述了這種新的 “混合精度內(nèi)存計算” 方法。

IBM 關注傳統(tǒng)計算體系結構的不同看法,在這種體系結構中,軟件需要在單獨的 CPURAM 單元之間進行數(shù)據(jù)傳輸。

據(jù) IBM 稱,這種被稱為 “馮·諾依曼” 的體系結構設計,為數(shù)據(jù)分析和機器學習應用制造了一個瓶頸,這些應用需要在處理單元和內(nèi)存單元之間進行更大的數(shù)據(jù)傳輸。傳輸數(shù)據(jù)也是一個耗能的過程。

應對這一挑戰(zhàn),IBM 給出的一種方法是模擬相變內(nèi)存(PCM)芯片,該芯片目前還處于原型階段,500 萬個納米級 PCM 器件組成 500×2000 交叉陣列。

PCM 的一個關鍵優(yōu)勢是可以處理大多數(shù)密集型數(shù)據(jù)處理,而無需將數(shù)據(jù)傳輸?shù)?CPU 或 GPU,這樣以更低的能量開銷實現(xiàn)更快速的處理。

IBM 的 PCM 單元將作為 CPU 加速器,就像微軟用于加速 Bing 和加強機器學習的 FPGA 芯片一樣。

據(jù) IBM 稱,研究表明在某些情況下,其 PCM 芯片能夠以模擬的方式進行操作,執(zhí)行計算任務,并提供與 4 位 FPGA 存儲器芯片相當?shù)臏蚀_度,但能耗降低了 80 倍。

模擬 PCM 硬件并不適合高精度計算。所幸的是,數(shù)字型 CPU 和 GPU 是適合的,IBM 認為混合架構可以實現(xiàn)更高性能、更高效率和更高精度的平衡。

這種設計將大部分處理留給內(nèi)存,然后將較輕的負載交給 CPU 進行一系列的精度修正。

根據(jù) IBM 蘇黎世實驗室的電氣工程師、也是該論文的主要作者 Manuel Le Gallo 稱,這種設計有助于云中的認知計算,有助于釋放對高性能計算機的訪問。

Le Gallo 表示:“憑借我們現(xiàn)在的精確度,我們可以將能耗降低到是使用高精度 GPU 和 CPU 的 1/6。”

“所以我們的想法是,為了應對模擬計算中的不精確性,我們將其與標準處理器結合起來。我們要做的是將大量計算任務轉移到 PCM 中,但同時得到最終的結果是精確的。”

這種技術更適合于如數(shù)字圖像識別等應用,其中誤解少數(shù)像素并不會妨礙整體識別,此外還有一些醫(yī)療應用。

“你可以用低精度完成大量計算——以模擬的方式,PCM 會非常節(jié)能——然后使用傳統(tǒng)處理器來提高精度。”

對于只有 1 兆字節(jié)大小的 IBM 原型內(nèi)存芯片,現(xiàn)在還處于初期階段。為了適用于現(xiàn)代數(shù)據(jù)中心的規(guī)模化應用,它需要達到千兆字節(jié)的內(nèi)存量級,分布在數(shù)萬億個 PCM 中。

盡管如此,IBM 認為可以通過構建更大規(guī)模的 PCM 設備或使其中 PCM 并行運行來實現(xiàn)這一目標。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • IBM
    IBM
    +關注

    關注

    3

    文章

    1766

    瀏覽量

    74863
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10905

    瀏覽量

    213030
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4777

    瀏覽量

    129360

原文標題:IBM 取得內(nèi)存計算新突破,AI 訓練能耗降低 80 倍

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    ADS1248一旦配置Burnout Current,檢測到的值精度降低了很多,為什么?

    跪求指點,據(jù)芯片手冊里介紹,Burnout Current是用來檢測前端傳感器失效的,但是現(xiàn)在設計RTD檢測模塊時,不配置Burnout Current檢測精度很高,但是一旦配置Burnout Current,檢測到的值精度降低了
    發(fā)表于 01-10 13:52

    為什么隔離ADC的采樣頻率可以如此顯著的提高?但是帶寬反而降低了

    。(AMC1304x-Q1) 為什么隔離ADC的采樣頻率可以如此顯著的提高?但是帶寬反而降低了? 為什么隔離ADC都是基于 Δ-Σ 調(diào)制器的,其他結構的(比如SAR)沒有?
    發(fā)表于 12-06 06:42

    虛擬內(nèi)存和云計算的關系

    在現(xiàn)代計算機科學中,虛擬內(nèi)存和云計算是兩個關鍵的技術概念。虛擬內(nèi)存是一種內(nèi)存管理技術,它允許計算
    的頭像 發(fā)表于 12-04 09:50 ?177次閱讀

    虛擬內(nèi)存計算機性能的影響

    在現(xiàn)代計算機系統(tǒng)中,內(nèi)存管理是確保系統(tǒng)高效運行的關鍵因素之一。虛擬內(nèi)存技術作為內(nèi)存管理的核心組成部分,對于提升計算機性能和用戶體驗起著至關重
    的頭像 發(fā)表于 12-04 09:17 ?1252次閱讀

    AMD Alveo V80計算加速器網(wǎng)絡研討會

    歡迎參加本次網(wǎng)絡研討會,我們將深入探討 AMD Alveo V80 計算加速器如何幫助您處理高性能計算、數(shù)據(jù)分析、金融科技、網(wǎng)絡安全、存儲加速、AI 計算等領域的
    的頭像 發(fā)表于 11-08 09:35 ?277次閱讀

    是什么原因降低了INA116的輸入阻抗?

    我的讀數(shù)是100mV左右,那么用 商業(yè)的pH meter讀到的數(shù)據(jù)是200左右。理論上出現(xiàn)這種情況是因為輸入阻抗大概與玻璃電極相等,但是INA116的阻抗大概為10E15歐姆,而玻璃電極最大才10E9歐姆, 所以肯定是什么原因降低了我的INA116的輸入阻抗。版主能否給我分析一下? 謝謝
    發(fā)表于 09-24 07:46

    淺析如何降低數(shù)據(jù)中心電力能耗

    ,如何減少數(shù)據(jù)中心的電力消耗成為了焦點問題。 ? 1 IT設備能耗降低 數(shù)據(jù)中心的能耗主要源自IT設備。這些設備的直接能耗不僅增加了電費成本,而且還需要配備相應的電源和冷卻系統(tǒng),這些
    的頭像 發(fā)表于 09-02 12:31 ?323次閱讀
    淺析如何<b class='flag-5'>降低</b>數(shù)據(jù)中心電力<b class='flag-5'>能耗</b>

    IBM與日本AIST攜手,共創(chuàng)量子計算新紀元

    在科技飛速發(fā)展的今天,量子計算已經(jīng)成為全球科研領域的一大熱點。據(jù)日經(jīng)亞洲的最新報道,IBM即將與日本產(chǎn)業(yè)技術綜合研究所(AIST)簽署一份合作協(xié)議,共同研發(fā)規(guī)模高達10000量子比特的下一代量子計算機。這不僅標志著
    的頭像 發(fā)表于 06-17 15:55 ?438次閱讀

    淺析物聯(lián)網(wǎng)環(huán)境下小麥加工過程能耗監(jiān)測系統(tǒng)設計

    運行狀態(tài)數(shù)據(jù)的自動采集與傳輸,并通過對數(shù)據(jù)的匯總與分析,為節(jié)能降耗提供基礎數(shù)據(jù)。設計的系統(tǒng)在河南某面粉有限公司進行了示范應用,提高了企業(yè)能耗管理水平,降低了生產(chǎn)成本。 關鍵詞: 小麥加工;能耗監(jiān)測;物聯(lián)網(wǎng);生產(chǎn)執(zhí)行
    的頭像 發(fā)表于 06-05 10:08 ?940次閱讀
    淺析物聯(lián)網(wǎng)環(huán)境下小麥加工過程<b class='flag-5'>能耗</b>監(jiān)測系統(tǒng)設計

    高性能計算集群的能耗優(yōu)化

    、人工智能、大數(shù)據(jù)分析等。隨著高性能計算集群的規(guī)模和性能的不斷提升,其能耗問題也日益突出。高性能計算集群的能耗不僅增加了運行成本,還對環(huán)境造成了不利影響,例如溫室氣體排放
    的頭像 發(fā)表于 05-25 08:27 ?514次閱讀
    高性能<b class='flag-5'>計算</b>集群的<b class='flag-5'>能耗</b>優(yōu)化

    借助全新 AMD Alveo? V80 計算加速卡釋放計算能力

    對于大規(guī)模數(shù)據(jù)處理,最佳性能不僅取決于原始計算能力,還取決于高存儲器帶寬。 因此,全新 AMD Alveo? V80 計算加速卡專為具有大型數(shù)據(jù)集的內(nèi)存受限型應用而設計,這些應用需要
    發(fā)表于 05-16 14:09 ?266次閱讀
    借助全新 AMD Alveo? V<b class='flag-5'>80</b> <b class='flag-5'>計算</b>加速卡釋放<b class='flag-5'>計算</b>能力

    美光推出Crucial英睿達LPCAMM2內(nèi)存模組,采用LPDDR5X技術,首家聯(lián)發(fā)

    此款LPCAMM2內(nèi)存采用了LPDDR5X技術,最高速度達到7500MT/s,遠超DDR5 SO-DIMM的1.3,同時還能將待機功耗降低80%。與焊接式
    的頭像 發(fā)表于 05-08 11:41 ?657次閱讀

    IBM已同意收購HashiCorp 估值64億美元

    的HashiCorp公司估值達64億美元。 高達64億美元交易金額是是IBM公司自2019年花費318億美元收購軟件公司RedHat以來最大的一筆收購。 IBM計劃收購HashiCorp后創(chuàng)建一個專為人工智能時代設計的綜合混合
    的頭像 發(fā)表于 04-25 16:36 ?586次閱讀

    用萬用表測試發(fā)現(xiàn)電機UVW的電壓只有12V左右,跟母線電壓比降低了4,是否有辦法提高?

    環(huán)境:FOC5.2.0 母線電壓:48VDC 問題:用萬用表測試發(fā)現(xiàn)電機UVW的電壓只有12V左右,跟母線電壓比降低了4,是否有辦法提高?
    發(fā)表于 04-24 08:25

    出口韓國!IBM與韓國量子計算公司KQC展開新合作

    出口韓國!IBM與韓國量子計算公司KQC展開新合作
    的頭像 發(fā)表于 02-19 12:50 ?452次閱讀
    出口韓國!<b class='flag-5'>IBM</b>與韓國量子<b class='flag-5'>計算</b>公司KQC展開新合作
    大发888下载安全的| 威尼斯人娱乐城真人百家乐| 百家乐路纸下| 汇丰百家乐娱乐城| 大发888出纳柜| 千亿国际娱乐城| 百家乐牌| 大发888真钱游戏下载| 华克山庄| 百家乐官网博彩桌出租| 香港六合彩报码| 新手百家乐官网指点迷津| 加多宝百家乐官网的玩法技巧和规则 | 建始县| 澳门玩百家乐官网赢1000万| 百家乐官网电子| 将军百家乐的玩法技巧和规则| 冠通棋牌大厅下载| 百家乐官网稳赢投注方法| 新花园百家乐官网的玩法技巧和规则| 真钱百家乐开户试玩| 大发888博狗博彩| 百家乐官网游戏官网| 澳门百家乐官网论坛及玩法| 路虎百家乐的玩法技巧和规则| bet365存款| 百家乐官网出闲几率| 百家乐台布兄弟| 大发888真人新浪微群| 百家乐官网最好的投注法| 百家乐打水策略| 澳门百家乐注册| 武川县| 24山的丑方位| 大发888的比赛怎么报名| 百家乐官网开户就送现金| 网上赌百家乐官网被抓应该怎么处理| 丹棱县| 二爷百家乐官网的玩法技巧和规则 | 百家乐注册18元体验金| 12bet|