換掉幾個硅部件,瞧,你有一個全新的芯片,不需要太多的設(shè)計工作。
這就是 AMD 的首席執(zhí)行官 Lisa Su 描述公司制造其新的 MI300X GPU 和代號為 Bergamo 的 128 核 Epyc CPU 的方式,該 CPU 的目標(biāo)是密集的服務(wù)器環(huán)境。
Su 出人意料地深入探討了如何使用該公司多年來一直使用的小芯片來構(gòu)建這些芯片。所有芯片均使用提供小芯片和封裝技術(shù)的臺積電制造。
這也是 AMD 吹噓自己領(lǐng)先于英特爾的一種方式,后者正在大肆宣傳在 PC 和服務(wù)器芯片中實施小芯片的更廣泛戰(zhàn)略。Intel 的 Ponte Vecchio GPU 基于 chiplet 方法,在 Intel 中使用 47 個“tile”。
針對 AI 應(yīng)用程序的純 GPU MI300X 是通過從其具有 GPU 和 CPU 的 MI300A 超級計算芯片中配置 CPU 小芯片并用 GPU 小芯片替換它們而制成的。
MI300X 直接定位為 Nvidia 的 H100 GPU 的競爭對手。MI300A 將用于即將推出的 El Capitan 超級計算機,預(yù)計其性能將超過 2 exaflops。
“我們在我們的產(chǎn)品中使用小芯片引領(lǐng)了行業(yè),我們在這個產(chǎn)品中使用小芯片實際上非常非常具有戰(zhàn)略意義。我們創(chuàng)造了一系列產(chǎn)品,”Su 說。
AMD 采用了 MI300A 超級計算芯片,移除了三個 Zen 4 CPU 芯片,并保留了 GPU 芯片。然后 MI300X 在公司在 Mi300A 繼承的芯片之上再插入兩個 CDNA 3 GPU 芯片后誕生。
MI300X 擁有 1530 億個晶體管,12 個 5 納米和 6 納米小芯片,包括新增的兩個 GPU 小芯片。MI300A 超級計算芯片有 13 個小芯片,三個 Zen 4 CPU 內(nèi)核。AMD 在 MI300X 中堆疊了更多的 HBM3 內(nèi)存,使其總?cè)萘窟_(dá)到 192GB。
“為了 MI300X 解決大型語言模型的更大內(nèi)存需求,我們實際上增加了額外的 64 GB HBM3 內(nèi)存,”Su 說。
AMD 還推出了 Bergamo 芯片,該芯片擁有 128 個內(nèi)核,更像是亞馬遜和 Ampere Computing 開發(fā)的基于 Arm 的低功耗芯片的 x86 版本。這是該公司的第一款專為通過云為網(wǎng)絡(luò)應(yīng)用程序提供服務(wù)的應(yīng)用程序而設(shè)計的芯片。
AMD 移除了 Genoa 芯片(基于 Zen 4 架構(gòu))并換入了 Bergamo 芯片。Bergamo 芯片基于 Zen 4c 內(nèi)核,這是 Zen 4 架構(gòu)的功率優(yōu)化版本。
Bergamo 擁有 820 億個晶體管,每個插槽支持 128 個內(nèi)核。它有八個計算芯片和 16 個 Zen 4c 內(nèi)核,這是 Zen 4 的變體,針對功率和性能進行了優(yōu)化
真正的工作是設(shè)計 Zen 4c 內(nèi)核,以確保它與 Genoa 芯片的插槽兼容。
芯片設(shè)計從與Zen 4相同的RTL設(shè)計開始,帶來了插座和軟件的兼容性。然后,該公司針對功率和面積優(yōu)化了 Zen 4c 的物理實現(xiàn),并重新設(shè)計了 L3 緩存層次結(jié)構(gòu)以獲得更大的吞吐量。
“如果將所有這些放在一起,結(jié)果是設(shè)計面積縮小 35%,每瓦性能顯著提高,”Su 說。
Meta 將在其數(shù)據(jù)中心部署 Bergamo,為 WhatsApp、Instagram 和 Facebook 等網(wǎng)絡(luò)應(yīng)用程序提供服務(wù)。這家社交媒體公司正在重新設(shè)計其數(shù)據(jù)中心以服務(wù)于人工智能和網(wǎng)絡(luò)應(yīng)用程序,并且似乎在貝加莫的設(shè)計中擁有很大的發(fā)言權(quán)。
Meta 與 AMD 合作,針對他們的工作負(fù)載優(yōu)化 Bergamo,包括“密集計算小芯片、核心與緩存比率、電源管理和制造優(yōu)化,幫助我們將大量此類服務(wù)器裝入機架,”副總裁 Alexis Black Bjorlin 說Meta 的基礎(chǔ)設(shè)施。
Black Bjorlin 說:“憑借 Bergamo 小芯片策略的靈活性,我們也很高興擁有一個 IO 密集型服務(wù)器選項,我們可以將其用于 HDD 和閃存存儲平臺。”
頂級 Bergamo 芯片稱為 Epyc 9754,擁有 128 個內(nèi)核,運行 256 個線程,功率高達(dá) 360W。該芯片擁有 256MB 的三級緩存,運行頻率高達(dá) 3.10GHz。中端 9754S 每個代碼僅運行一個線程。該系列中的第三款芯片 Epyc 9734 擁有 112 個內(nèi)核,每個內(nèi)核運行兩個線程,功耗為 320 瓦。
Bergamo 將面臨來自英特爾名為 Sierra Forest 的高密度服務(wù)器芯片的競爭,該芯片將于明年上市。Sierra Forest 擁有英特爾的 e-cores,也稱為效率核心。
-
芯片
+關(guān)注
關(guān)注
456文章
51190瀏覽量
427293 -
gpu
+關(guān)注
關(guān)注
28文章
4777瀏覽量
129360 -
chiplet
+關(guān)注
關(guān)注
6文章
434瀏覽量
12632
原文標(biāo)題:關(guān)于Chiplet,Lisa Su罕見分享
文章出處:【微信號:TenOne_TSMC,微信公眾號:芯片半導(dǎo)體】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
解鎖Chiplet潛力:封裝技術(shù)是關(guān)鍵
![解鎖<b class='flag-5'>Chiplet</b>潛力:封裝技術(shù)是關(guān)鍵](https://file1.elecfans.com/web3/M00/04/E1/wKgZPGd57EiADUV4AAArAy04cyI930.png)
Chiplet技術(shù)有哪些優(yōu)勢
2035年Chiplet市場規(guī)模將超4110億美元
IMEC組建汽車Chiplet聯(lián)盟
![IMEC組建汽車<b class='flag-5'>Chiplet</b>聯(lián)盟](https://file1.elecfans.com//web1/M00/F2/E9/wKgaoWcN_3OAYBlYAAOIEbhuMJs947.jpg)
如何成功的烘烤微流控SU-8光刻膠?
突破與解耦:Chiplet技術(shù)讓AMD實現(xiàn)高性能計算與服務(wù)器領(lǐng)域復(fù)興
![突破與解耦:<b class='flag-5'>Chiplet</b>技術(shù)讓AMD實現(xiàn)高性能計算與服務(wù)器領(lǐng)域復(fù)興](https://file1.elecfans.com/web2/M00/03/B2/wKgZombFzXmAaGpGAAB6s9bVYLc608.jpg)
雷軍公布SU7成績單 小米SU7鎖單量超過75723臺 交付5781臺
小米SU7充電時間
小米SU7詳細(xì)參數(shù)
小米SU7續(xù)航參數(shù)曝光 小米SU7跑多少公里
小米SU7上市時間及價格
Chiplet是否也走上了集成競賽的道路?
![<b class='flag-5'>Chiplet</b>是否也走上了集成競賽的道路?](https://file1.elecfans.com/web2/M00/C0/B3/wKgZomXYBP2AeC-kAAdXEhEEV44350.jpg)
評論