那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

SOK將HugeCTR中的高級特性進行包裝使用

星星科技指導員 ? 來源:NVIDIA ? 作者:HugeCTR ? 2022-04-07 16:02 ? 次閱讀

1. Introduction

HugeCTR 能夠高效地利用 GPU 來進行推薦系統的訓練,為了使它還能直接被其他 DL 用戶,比如 TensorFlow 所直接使用,我們開發了 SparseOperationKit (SOK),來將 HugeCTR 中的高級特性封裝為 TensorFlow 可直接調用的形式,從而幫助用戶在 TensorFlow 中直接使用 HugeCTR 中的高級特性來加速他們的推薦系統。

pYYBAGJOmyGAEKlZAACdxZaXMq8920.png

圖 1. SOK embedding 工作流程

SOK 以數據并行的方式接收輸入數據,然后在 SOK 內部做黑盒式地模型轉換,最后將計算結果以數據并行的方式傳遞給初始 GPU。這種方式可以盡可能少地修改用戶已有的代碼,以更方便、快捷地在多個 GPU 上進行擴展。

SOK 不僅僅是加速了 TensorFlow 中的算子,而是根據業界中的實際需求提供了對應的新解決方案,比如說 GPU HashTable。SOK 可以與 TensorFlow 1.15 和 TensorFlow 2.x 兼容使用;既可以使用 TensorFlow 自帶的通信工具,也可以使用 Horovod 等第三方插件來作為 embedding parameters 以為參數的通信工具。

2. TF2 Comparison/Performance

使用 MLPerf 的標準模型 DLRM 來對 SOK 的性能進行測試。

poYBAGJOmyiAeiA8AADnMNf4awU433.png

圖 2. SOK性能測試數據

相比于 NVIDIA 的 DeepLearning Examples,使用 SOK 可以獲得更快的訓練速度以及更高的吞吐量。

3. API

SOK 提供了簡潔的、類 TensorFlow 的 API;使用 SOK 的方式非常簡單、直接;讓用戶通過修改幾行代碼就可以使用 SOK。

定義模型結構

poYBAGJOmy2ARBajAADRQdPyK68016.png

左側是使用 TensorFlow 的 API 來搭建模型,右側是使用 SOK 的 API 來搭建相同的模型。使用 SOK 來搭建模型的時候,只需要將 TensorFlow 中的 Embedding Layer 替換為 SOK 對應的 API 即可。

使用 Horovod 來定義 training loop

pYYBAGJOmziAPRIaAAEf6YbWwDc794.png

同樣的,左側是使用 TensorFlow 來定義 training loop,右側是使用 SOK 時,training loop 的定義方式。可以看到,使用 SOK 時,只需要對 Embedding Variables 和 Dense Variables 進行分別處理即可。其中,Embedding Variables 部分由 SOK 管理,Dense Variables 由 TensorFlow 管理。

使用 tf.distribute.MirroredStrategy 來定義 training loop

poYBAGJOm0WAXaRPAAFOJm89KHA665.png

類似的,還可以使用 TensorFlow 自帶的通信工具來定義 training loop。

開始訓練

pYYBAGJOm02AGDvJAACSvcfi_CM767.png

在開始訓練過程時,使用 SOK 與使用 TensorFlow 時所用代碼完全一致。

4. 結語

SOK 將 HugeCTR 中的高級特性包裝為 TensorFlow 可以直接使用的模塊,通過修改少數幾行代碼即可在已有模型代碼中利用上 HugeCTR 的的先進設計。

關于作者

NVIDIA GPU 計算專家研發團隊成立于2020年7月,主要面向全球用戶開發基于英偉達通用計算產品的軟件解決方案。 目前團隊致力于推薦系統訓練框架 Merlin HugeCTR的開發。作為Merlin 系統三大核心軟件之一,Merlin HugeCTR 是一套針對于推薦系統設計的模型訓練框架。項目啟動于2018年,目前產品應用于多家國際互聯網公司,自2020年以來,HugeCTR持續參與并推動國際性競賽MLPerf DLRM訓練項目,從而實現了業界領先的優化性能。 NVIDIA GPU 計算專家研發團隊是一個小型國際化工程團隊,核心成員來自于多個國家(中國,韓國,荷蘭,德國),客戶分布于世界各地。日常工作使用英語溝通。 團隊主要工作圍繞軟件產品開發展開,涉及產品維護、文檔、測試、發布、部署,日常工作中與各國硬件、產品、工程、客戶支持團隊有著緊密的合作。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5076

    瀏覽量

    103720
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4774

    瀏覽量

    129353
收藏 人收藏

    評論

    相關推薦

    磁珠和電感在電路的阻抗特性如何呢?

    磁珠和電感在電路的阻抗特性各有其獨特之處,下面分別進行詳細闡述。 磁珠的阻抗特性 磁珠在電路
    的頭像 發表于 01-15 15:40 ?107次閱讀
    磁珠和電感在電路<b class='flag-5'>中</b>的阻抗<b class='flag-5'>特性</b>如何呢?

    接地電阻柜采用免熏蒸包裝的優勢

    在接地電阻柜的包裝領域,免熏蒸包裝正逐漸成為主流選擇,具有諸多顯著優勢。 免熏蒸包裝材料通常由環保型復合材料制成,無需進行熏蒸處理,減少了化學藥劑的使用,更加環保安全,符合現代綠色發展
    的頭像 發表于 12-11 16:09 ?121次閱讀

    包裝行業設備如何通過Profinet轉EthernetIP網關進行交流?

    在我們的日常生活,無論是食品、醫藥,還是化妝品行業,包裝都是一個重要的環節。包裝不僅需要美觀大方,更需要快速高效。然而,許多包裝機械設備在生產過程
    的頭像 發表于 12-04 09:19 ?228次閱讀
    <b class='flag-5'>包裝</b>行業<b class='flag-5'>中</b>設備如何通過Profinet轉EthernetIP網關<b class='flag-5'>進行</b>交流?

    Wilink8高級特性

    電子發燒友網站提供《Wilink8高級特性.pdf》資料免費下載
    發表于 11-08 15:58 ?0次下載
    Wilink8<b class='flag-5'>高級</b><b class='flag-5'>特性</b>

    淺析RFID技術在循環包裝管理的應用

    隨著物流行業的快速發展和環保意識的增強,循環包裝逐漸成為企業減少成本、提升效率和踐行綠色發展的重要手段。循環包裝是指可多次重復使用的包裝容器,如鐵質包裝箱、塑料托盤等。相較于一次性
    的頭像 發表于 10-31 14:26 ?275次閱讀
    淺析RFID技術在循環<b class='flag-5'>包裝</b>管理<b class='flag-5'>中</b>的應用

    明達IO——搭建包裝產線新方案

    包裝行業在商品銷售扮演著至關重要的角色,其可以按照多種方式進行分類,如按包裝容器、包裝材料、包裝
    的頭像 發表于 10-15 11:04 ?287次閱讀
    明達IO——搭建<b class='flag-5'>包裝</b>產線新方案

    利用新型ePWM特性進行多相控制

    電子發燒友網站提供《利用新型ePWM特性進行多相控制.pdf》資料免費下載
    發表于 09-24 11:25 ?0次下載
    利用新型ePWM<b class='flag-5'>特性</b><b class='flag-5'>進行</b>多相控制

    MT6835 磁編碼 IC 技術在全自動紙包裝的應用

    一、引言 在現代包裝行業,效率和精度是衡量生產設備性能的關鍵指標。全自動紙包裝機作為包裝生產線的重要設備,其性能的優劣直接影響到產品的
    的頭像 發表于 08-15 16:34 ?373次閱讀
    MT6835 磁編碼 IC 技術在全自動紙<b class='flag-5'>包裝</b>機<b class='flag-5'>中</b>的應用

    宏工科技發力包裝領域,解決超細粉料包裝難點

    宏工科技不斷在物料處理鏈條上加大研發力度,攻克了一系列“卡脖子”技術難題,以技術創新鑄就宏工的“品牌力”。以包裝領域為例,針對不同的包裝需求,宏工科技目前在工業包裝領域已推出了噸袋包裝
    的頭像 發表于 08-15 14:54 ?356次閱讀
    宏工科技發力<b class='flag-5'>包裝</b>領域,解決超細粉料<b class='flag-5'>包裝</b>難點

    熱收縮膜包裝機的主要作用

    熱收縮膜包裝機又稱熱收縮包裝機(也稱為收縮包裝機、熱收縮機、收縮機、膜包機等),主要作用是產品用熱收縮薄膜裹包后再進行加熱,使薄膜收縮后
    的頭像 發表于 08-15 11:43 ?580次閱讀

    SOK在手機行業的應用案例

    通過封裝 NVIDIA Merlin HugeCTR,Sparse Operation Kit(以下簡稱 SOK)使得 TensorFlow 用戶可以借助 HugeCTR 的一些相關特性
    的頭像 發表于 07-25 10:01 ?404次閱讀
    <b class='flag-5'>SOK</b>在手機行業的應用案例

    元器件的包裝方式及常見的四種方式

    四種元件包裝方式在實際生產和使用中廣泛應用,不同的包裝方式適用于不同類型和規格的元件,并且可以根據具體要求進行定制化的包裝設計。不同的包裝
    的頭像 發表于 06-27 12:58 ?1829次閱讀

    機器視覺檢測:薯愿外包裝檢測

    食品及包裝行業中常常需要對產品的包裝盒、包裝袋表面進行缺陷檢測,其檢測內容包括產品混料、外包裝破損、臟污等,機器視覺技術能夠通過拍照或掃描取
    的頭像 發表于 05-08 13:36 ?550次閱讀
    機器視覺檢測:薯愿外<b class='flag-5'>包裝</b>檢測

    激光打標機在食品包裝行業的應用與優勢

    激光打標機在食品包裝行業的應用與優勢如下:應用:1.激光打標機可以用于食品包裝袋、瓶蓋、罐頭等包裝材料的打標和雕刻,打印生產日期、保質期、批次號、二維碼等信息。2.激光打標機還可以用
    的頭像 發表于 02-27 18:05 ?550次閱讀
    激光打標機在食品<b class='flag-5'>包裝</b>行業<b class='flag-5'>中</b>的應用與優勢

    自動稱重包裝機如何數據采集到云平臺進行監控管理

    企業的生產管理,數據采集和監控管理起著至關重要的作用。 云平臺是一種基于互聯網的計算方式,可以提供彈性計算、存儲和應用服務。將自動稱重包裝機的數據采集到云平臺,可以實現對生產數據的實時監控、遠程管理和智能
    的頭像 發表于 02-20 15:42 ?551次閱讀
    自動稱重<b class='flag-5'>包裝</b>機如何數據采集到云平臺<b class='flag-5'>進行</b>監控管理
    足球百家乐官网网上投注| 赌博中百家乐什么意思| 大发888最新网址| 顶级赌场官网| 破解百家乐官网真人游戏| 新澳门百家乐的玩法技巧和规则| 山东省| 百家乐官网平游戏| 棋牌休闲游戏| 喜力百家乐官网的玩法技巧和规则| 澳门百家乐游戏官网| 百家乐官网21点德州扑克| 百家乐号技巧| 百家乐官网下载游戏| 百家乐博彩技巧视频| 宝马娱乐城| 永利博百家乐现金网| 大富豪国际娱乐城| 百家乐软件稳赚| 百家乐官网游戏分析| 百家乐tt娱乐平台| 真钱百家乐官网五湖四海全讯网| 美女百家乐的玩法技巧和规则| 百家乐官网庄闲收益率| 送58百家乐的玩法技巧和规则| 百家乐官网用什么平台| 皇家百家乐的玩法技巧和规则 | 百家乐正负计| 广东百家乐官网扫描分析仪| 威尼斯人娱乐城存款多少起存| 网上百家乐官网是现场吗| 网上百家乐官网赌博经历| 皇冠足球比分网| 百家乐高手看百家乐| 百家乐官网免费破解外挂| 百家乐小游戏单机版| 太阳神百家乐官网的玩法技巧和规则| 财神娱乐城信誉| 百家乐官网投注技巧| 大发888官方注册| 百家乐现金网平台排名|