那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

美光 DDR5 內存配合第四代 AMD EPYC 處理器,提升高性能計算工作負載

半導體芯科技SiSC ? 來源:半導體芯科技SiSC ? 作者:半導體芯科技SiS ? 2022-12-19 17:47 ? 次閱讀

來源:美光科技

作者:Krishna Yalamanchi、Sudharshan Vazhkudai

美光與AMD聯手為客戶及數據中心平臺提供一流的用戶體驗。雙方在奧斯汀建立聯合服務器實驗室,以減少服務器內存驗證時間,在產品驗證和發布期間共同進行工作負載測試。目前美光適用于數據中心的 DDR5 內存和第四代 AMD EPYCTMTM (霄龍)處理器均已出貨,我們對其進行了一些常見的高性能計算(HPC)工作負載基準測試。


長期以來,超級計算機承擔著高性能計算工作負載。此類大規模的數據密集型工作負載需要運行TB 級的數據量以進行數百萬個并行操作,以解決人類世界的難題,如天氣和氣候預測;地震建模;化學、物理和生物分析等。
隨著計算機架構的進步,此類工作負載往往托管在超大型“可橫向擴展”的高性能服務器集群中。這些服務器集群需要集合最強大的算力、架構、內存和存儲基礎設施,以滿足關鍵工作負載對可擴展性、低延遲和高性能的需求。然而隨著服務器 CPU 的性能和吞吐量不斷增長,DDR4 無法提供足夠的內存帶寬,來滿足不斷增長的高性能內核。

bea6d3e8455343ab99038b7f20105fb5~noop.image?_iz=58558&from=article.pc_detail&x-expires=1672047937&x-signature=2aDHL2bJwIrS6%2BKieAPskgWYV3Q%3D

為緩解這一瓶頸,美光 DDR5 內存與采用了Zen 4 服務器架構的第四代AMD EPYC 處理器強強聯合,使服務器 CPU 能夠更好地匹配內存產品,滿足數據密集型工作負載對性能和效率的需求。美光DDR5 內存可幫助企業從本地和云端數據中更快獲取洞察。我們對最新的 AMD Zen 4 96 核CPU和美光DDR5進行了行業內高性能計算工作負載基準測試,所有結果均顯示性能提升了兩倍。


美光 DDR5 搭配第四代 AMD EPYC 處理器,在STREAM 測試中實現內存帶寬翻倍

STREAM1 是常見的基準測試工具,用于測量高性能計算機的內存帶寬,可捕獲高性能計算系統的峰值內存帶寬。
該工作負載使用的軟件堆棧

· Alma 9 Linux kernel 5.14

· STREAM.f,2021 年 11 月 29 日發布版本

a43ad7485ed4470695b0f03577c95702~noop.image?_iz=58558&from=article.pc_detail&x-expires=1672047937&x-signature=QAtrZyDQkeRuFBGrE3l9Z3Rb12U%3D

測試設置

· DDR4 系統搭配第三代 64 核3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統2的 RDIMM 內存槽插滿,共 64GB

· DDR5 系統搭配第四代 96 核3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統3的 RDIMM 內存槽插滿,共 64GB

測試結果

· DDR5 系統每插槽內存帶寬翻倍,達到 378 GB/s

· 該結果意味著客戶能運行更大規模的人工智能/機器學習AI/ML)項目,或利用 DDR5 增加的內存帶寬進行更多高性能計算。

c3e1c9c00c7a437886bffa141678e0a6~noop.image?_iz=58558&from=article.pc_detail&x-expires=1672047937&x-signature=1O9SvWwkIs4Q4tFHtURmyyoc05A%3D

美光 DDR5, 助力天氣研究和預報 (WRF)4 速度提升2倍

此次測試使用的高性能計算工作負載代碼針對天氣和氣候。WRF模型在一些支持高性能浮點處理、高內存帶寬、低延遲網絡等傳統高性能計算架構中表現良好,測試對象為橫向分辨率為 2.5 公里的美國大陸地區 (CONUS)。
該工作負載使用的軟件堆棧

· Alma 9 Linux kernel 5.14

· WRF 2.3.5 & 4.3.3

· Open MPI v4.1.1

測試設置

· DDR4 系統搭配第三代64 核3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統2的 RDIMM 內存槽插滿,共 64GB

· DDR5 系統搭配第四代 96 核3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統3的 RDIMM 內存槽插滿,共 64GB

測試結果

· 美光 DDR5 搭配第四代 AMD EPYC 處理器,可實現 1.3567 時間步/秒 VS DDR4 系統的2.8533 時間步/秒

· 速度更快意味著可使用更大的數據庫或運行更多模型以進行天氣預測,進而改善預測的準確度。

美光 DDR5,助力OpenFOAM5 速度提升2倍
OpenFOAM 是一種計算流體動力學(CFD)的開源高性能計算工作負載,廣泛應用于多個行業,有助于縮短開發時間并降低成本。從消費類產品設計到航空航天設計,OpenFOAM能夠模擬不同應用中的物理互動,包括摩托車風擋湍流。在該模擬中,OpenFOAM 能夠計算摩托車和騎手周圍的穩定氣流。OpenFOAM 能夠根據用戶指定的進程數進行負載均衡計算,以此將網格分解成多個部分并分配給不同的進程求解。求解完成后,再將網格和解重新組合為單個域。


該工作負載使用的軟件堆棧

· OpenFOAM CFD 軟件(版本8),其中摩托車網格尺寸為:600 x 240 x 240

· Alma 9 Linux kernel 5.14

· Open MPI v4.1.1

測試設置

· DDR4 系統搭配第三代64 核3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統2的 RDIMM 內存槽插滿,共 64GB

· DDR5 系統搭配第四代 96 核3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統3的 RDIMM 內存槽插滿,共 64GB

測試結果
測試結果表明美光DDR5 產品組合將OpenFOAM 性能提高了 2.4 倍。OpenFOAM 為五大高性能計算軟件平臺之一,擁有大型開源社區。該軟件廣泛應用于大學和研發中心,可利用高帶寬內存和擁有密集內核的高性能CPU,實現高度的并行操作。
美光 DDR5 ,助力分子動力學6 速度提升2倍
CP2K 是一款開源量子化學工具,適用于許多應用,包括固態生物系統模擬。CP2K 能夠為不同的建模方法提供通用的框架。此次測試對象為水(H2O)的密度泛函理論(DFT),模擬盒子中共包含 6,144 個原子(2,048 個水分子)。
該工作負載使用的軟件堆棧

· H2O-DFT-LS.NREP4 及 H2O-DFT-LS

· Alma 9 Linux kernel 5.14

測試設置

· DDR4 系統搭配第三代64 核3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統2的 RDIMM 內存槽插滿,共 64GB

· DDR5 系統搭配第四代 96 核3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統3的 RDIMM 內存槽插滿,共 64GB

測試結果
測試結果表明美光DDR5 產品組合將分子動力學性能提高了2.1 倍。隨著內核數和內存帶寬增加,此類工作負載的性能也顯著提升。
總結
目前我們只針對少量高性能計算工作負載進行了測試,因此以上只是我們的初步成果。將高性能高帶寬內存與最新的服務器處理器(如第四代 AMD EPYC 處理器)相結合,可為高性能計算客戶創造新的可能。我們期待更多企業數據中心和云服務商,能夠在新平臺上應用美光 DDR5 產品,解鎖更高的性能與能效。

________________________

1 我們在 STREAM 基準測試中配置了 25 億個向量的STREAM Benchmark——運行在一臺單 AMD CPU 系統上
2 AMD DDR4 系統為一臺 64 核 AMD EPYC 7763 處理器, DDR4-3200 MHz 的RDIMM 內存槽插滿,共 64GB
3 AMD DDR5 系統為一臺 96 核 AMD EPYC 9654 處理器, DDR5-4800 MHz 的RDIMM 內存槽插滿,共 64GB
4 橫向分辨率為 12.5 公里CONUS 的 WRF 在 DDR4 系統上的運行時間為 929 秒,在 DDR5 系統上的運行時間為 287 秒(均包括存儲器的輸入/輸出時間)。該測試中 WRF 配置為 2.5 公里 CONUS,測試結果為 1.3567 時間步/ 秒, 相比之下DDR4 的運行時間為2.8533時間步/秒。
5 針對 OpenFOAM,我們運行了三種變體:
5a:1004040 runtimes,DDR4 系統運行時間為 1,144 秒,DDR5 系統運行時間為 478 秒
5b:1084646 runtimes,DDR4 系統運行時間為 1,633 秒,DDR5 系統運行時間為 698 秒
5c:1305252 runtimes,DDR4 系統運行時間為 2,522秒,DDR5 系統運行時間為 1,091 秒
6 分子動力學工作負載在 DDR4 系統上的運行時間為 2,519 秒,在 DDR5 系統上的運行時間為 1,242 秒

作者:

7a3997fc8af8458792653b846b047361~noop.image?_iz=58558&from=article.pc_detail&x-expires=1672047937&x-signature=z00jZ8Nd84Rkxh4762vC2JJRBUw%3D

Krishna Yalamanchi

Krishna 擔任美光生態系統高級開發經理,專注于研發 DDR5 和 CXL 解決方案。他曾在英特爾 IT 部門任職,領導 SAP HANA 的遷移工作,通過與SI、OEM和云服務提供商共同搭建的合作伙伴生態系統,推出了用于SAP工作負載的第三代與第四代 Intel Xeon 處理器。

011102cd1832464d9123be48756633d6~noop.image?_iz=58558&from=article.pc_detail&x-expires=1672047937&x-signature=Y4jjbrKUGC4R6BMb2CO%2BWX7z0Dg%3D

Sudharshan Vazhkudai

Sudharshan S. Vazhkudai 博士擔任美光系統架構和工作負載分析總監。他領導一支位于奧斯汀和印度海得拉巴的團隊,致力于研究內存和存儲(DDR、CXL、HBM 和 NVME)產品中層次結構的可組合性,并優化與數據中心工作負載相關的系統架構。

審核編輯 黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19408

    瀏覽量

    231187
  • 內存
    +關注

    關注

    8

    文章

    3055

    瀏覽量

    74331
  • DDR5
    +關注

    關注

    1

    文章

    430

    瀏覽量

    24209
收藏 人收藏

    評論

    相關推薦

    AN65-第四代LCD背光技術

    電子發燒友網站提供《AN65-第四代LCD背光技術.pdf》資料免費下載
    發表于 01-09 14:12 ?0次下載
    AN65-<b class='flag-5'>第四代</b>LCD背光技術

    安勤科技發布HPM-SIEUA服務主板,搭載AMD第四代Siena處理器

    。 HPM-SIEUA主板的核心亮點在于其支持的AMD第四代EPYC 8004系列處理器,該系列處理器被命名為“Siena”,并基于先進的
    的頭像 發表于 12-27 15:04 ?347次閱讀

    AMD EPYC嵌入式9004和8004系列處理器介紹

    可擴展至 96 核( 9004 系列),熱設計功率( TDP )自 70W 起( 8004 系列),第四代 AMD EPYC 嵌入式處理器旨在滿足下一
    的頭像 發表于 12-18 15:57 ?674次閱讀
    <b class='flag-5'>AMD</b> <b class='flag-5'>EPYC</b>嵌入式9004和8004系列<b class='flag-5'>處理器</b>介紹

    DDR3、DDR4、DDR5性能對比

    DDR3、DDR4、DDR5計算機內存類型的不同階段,分別代表第三、第四代和第五
    的頭像 發表于 11-29 15:08 ?3556次閱讀

    DDR5內存DDR4內存性能差異

    DDR5內存DDR4內存性能差異 隨著技術的發展,內存技術也在不斷進步。
    的頭像 發表于 11-29 14:58 ?769次閱讀

    DDR5內存工作原理詳解 DDR5DDR4的主要區別

    DDR5內存工作原理詳解 1. DDR5內存簡介 DDR5(Double Data Rate
    的頭像 發表于 11-22 15:38 ?2124次閱讀

    AMD 面向嵌入式系統推出高能效 EPYC 嵌入式 8004 系列

    AMD 憑借其 EPYC? 嵌入式處理器不斷樹立行業標準,為網絡、存儲和工業應用提供卓越的性能、效率、連接與創新。今天,我們正以第四代
    發表于 10-11 13:58 ?757次閱讀

    亞馬遜網絡服務即將推出第四代Graviton處理器

    7月10日,雅虎財經獨家報道了亞馬遜網絡服務(AWS)即將推出的重大技術進展——其第四代Graviton處理器,即Graviton4芯片。這一重要信息由AWS的計算與人工智能產品管理總監拉胡爾·庫爾卡尼在德克薩斯州奧斯汀的亞馬遜
    的頭像 發表于 07-10 15:51 ?663次閱讀

    AMD EPYC 9554處理滿足高頻率、多線程所需

    ,第四代AMD EPYC處理器家族已日臻完善,產品覆蓋了通用和企業計算,技術計算,云原生
    的頭像 發表于 06-29 15:26 ?1739次閱讀

    Rambus通過全新PMIC系列支持多基于 DDR5高性能服務

    提供業界領先的 DDR5 服務 PMIC,滿足AI及其他高級工作負載對最高性能與容量內存模塊的
    的頭像 發表于 06-20 15:13 ?958次閱讀

    capsense第四代和第五在感應模式上的具體區別是什么?

    據我所知,第五capsense相比第四代將電容(包括自電容+互電容技術)和電感觸摸技術集成到了一起,snr信噪比是上一的十多倍,同時功耗僅是上一的十分之一。但是這張圖在感應模式
    發表于 05-23 06:24

    國民技術第四代可信計算芯片NS350投入量產

    國民技術近日正式推出了其第四代可信計算芯片NS350 v32/v33系列,并已開始量產供貨。這款芯片是高性能、高安全性的TCM 2.0安全芯片,能夠滿足PC、服務平臺和嵌入式系統等不
    的頭像 發表于 05-13 15:17 ?1491次閱讀

    國民技術第四代可信計算芯片NS350正式投入量產

    2024年4月18日,國民技術第四代可信計算芯片NS350v32/v33系列產品正式發布并開始量產供貨。NS350v32/v33是一款高安全、高性能、超值可信密碼模塊2.0(TCM2.0)安全芯片
    的頭像 發表于 04-19 08:24 ?876次閱讀
    國民技術<b class='flag-5'>第四代</b>可信<b class='flag-5'>計算</b>芯片NS350正式投入量產

    國民技術第四代可信計算芯片NS350正式投入量產!

    2024年4月18日,國民技術第四代可信計算芯片NS350 v32/v33系列產品正式發布并開始量產供貨。NS350 v32/v33是一款高安全、高性能、超值可信密碼模塊2.0 (TCM 2.0)安全芯片,適用于PC、服務
    的頭像 發表于 04-18 16:22 ?790次閱讀
    國民技術<b class='flag-5'>第四代</b>可信<b class='flag-5'>計算</b>芯片NS350正式投入量產!

    AMD EPYC處理器:AI推理能力究竟有多強?

    如今,AMD EPYC處理器已經成為最常被選擇用于AI推理的服務平臺,尤其是第四代Genoa EPYC
    發表于 03-15 09:47 ?569次閱讀
    博彩百家乐字谜总汇二丹东| 扑克王百家乐官网的玩法技巧和规则| 乌兰浩特市| 开平市| 洪雅县| 网上百家乐官网合法吗| 百家乐官网赢钱皇冠网| 百家乐官网视频软件| 在线百家乐官网大家赢| 金盈会百家乐官网现金网| 百家乐官网币| 成人百家乐官网的玩法技巧和规则| 海立方百家乐官网的玩法技巧和规则 | 百家乐波音平台有假吗| 易胜博百家乐娱乐城| 网络百家乐破| 世界德州扑克大赛| 塔河县| 百家乐官网送彩金网络| 24山水口决阳宅| 高科技百家乐牌具| 新全讯网353788| 新澳博国际娱乐| 百家乐官网游戏机压法| 百家乐官网赌博器| 任你博百家乐现金网| 泰山百家乐的玩法技巧和规则| 大发888真人 新浪微群| 银河娱乐场| 百家乐官网网站建设| 龍城百家乐官网的玩法技巧和规则 | 金盈会百家乐现金网| 威尼斯人娱乐城老品牌值得您信赖lm0| 六合彩历史开奖记录| 百家乐官网的玩法和技巧| 新乐园百家乐官网娱乐城| 至尊百家乐facebook| 威尼斯人娱乐代理注测| 句容市| 为什么百家乐官网玩家越来越多选择网上百家乐官网 | 百家乐正规站|