那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AMD最強芯片 全村的希望!

sakobpqhz ? 來源:半導體行業觀察 ? 2023-06-20 16:50 ? 次閱讀

由于 GPU 嚴重短缺,Nvidia 收取的費用是制造成本的 5 倍左右,業內每個人都迫切希望找到替代方案。雖然谷歌在 AI 工作負載方面具有結構性性能/TCO 優勢,但由于其 TPU具有成熟的硬件和軟件OCS,因此與其他大型科技公司相比,我們認為存在結構性問題會阻止他們成為外部使用的領導者。

1、谷歌 TPU 將只能從 1 個公司在 1 個云中獲得。

2、谷歌Google 在芯片部署很久之后才會公開他們的芯片,因為大買家需要在發布前記錄下來,并在 ramp 之前提供早期訪問系統。

3、多年來,谷歌一直向用戶隱藏多項主要硬件功能,包括內存/計算相關和網絡/部署靈活性。

4、谷歌拒絕為那些想要編寫自定義內核以最大化性能的奇才在外部提供低級別的硬件文檔。

谷歌在 AI 基礎設施方面的最大技術進步的守門人將使他們在結構上與基于 Nvidia 的云產品相比處于落后地位,除非谷歌改變他們的運作方式。來自亞馬遜和微軟等其他云的內部芯片仍然遠遠落后。

在商業芯片的世界里, Cerebras 目前是最接近的競爭對手,在 GPT-3 上表現穩定開源模型令人印象深刻,但硬件可訪問性非常有限,每臺服務器成本高達數百萬美元。在云中訪問 Cerebras 的唯一方法是通過他們自己的產品。缺乏訪問權會損害開發的靈活性。

Nvidia 生態系統的生命線是人們在各種各樣的系統上進行開發,從他們花費數百美元的游戲 GPU 到最終能夠擴展到擁有數萬個本地 GPU 或與所有第 3 方云服務提供商合作. 而Tenstorrent 等其他初創公司則表現出希望我們認為硬件/軟件距離真正大踏步前進還有一段距離。

盡管收購了兩家不同的數據中心 AI 硬件公司 Nervana 和 Habana,但世界上最大的商用芯片供應商英特爾卻不見蹤影。Nervana幾年前就被拋棄了,現在的Habana身上似乎也發生了同樣的事情。英特爾目前正在使用他們的第二代Habana Gaudi 2,除了 AWS 上可用的一些實例外,幾乎沒有采用。

此外,隨著該產品被納入 2025 Falcon Shores GPU,英特爾已經將路線圖宣告失敗。英特爾的 GPU,Ponte Vecchio 也好不到哪兒去。已經很晚了,直到最近才完成對拖延已久的 Aurora 超級計算機的交付,再過 2 年就沒有繼任者了。它的性能通常無法與 Nvidia 的 H100 GPU 競爭。

這就讓AMD成為了英偉達的最后一個有力競爭者。

AMD 是唯一一家擁有成功交付用于高性能計算的芯片記錄的公司。雖然這主要適用于他們的 CPU 端是一臺運行良好的執行機器,但它還可以進一步擴展。AMD 于 2021 年為全球首臺 ExaFLop 超級計算機 Frontier 交付了 HPC GPU 芯片。雖然為 Frontier 提供動力的 MI250X 足以完成其主要工作,但它未能在云計算和超大規模用戶的大客戶中獲得任何影響力。

現在,每個人都期待著 AMD 的 MI300,它將于今年晚些時候交付給 El Capitan,這是他們的第二個 Exascale 超級計算機獲勝者。出于這個原因,一旦您將目光脫離 Nvidia ,AMD 即將推出的 MI300 GPU 將成為討論最多的芯片之一。我們也一直在密切關注其與Meta 的 PyTorch 2.0 和 OpenAI 的 Triton軟件的適配前景。自 Nvidia 的 Volta GPU 和 AMD 的 Rome CPU 以來,數據中心芯片還沒有引起如此大的轟動。

MI300,代號 Aqua Vanjaram,由多個復雜的硅層組成,坦率地說是工程奇跡。首席執行官 Lisa Su 今年早些時候在 CES 上展示了 MI300 套件,讓我們了解 MI300 的結構。我們看到 4 個硅片被 8 個 HBM 堆棧包圍。這是 HBM3 的最高 5.6 GT/s 速度,八個 16GB 堆棧形成 128GB 統一內存,帶寬高達 5.734 TB/s。

與 3.3 TB/s 的 Nvidia H100 SXM 80GB 相比,其帶寬增加了 72%,容量增加了 60%。

AMD 獲得任何數量的 AI 計算美元的機會最終歸結為成為 hyperscalers 與 Nvidia 的可靠第二來源。假設是漲潮會托起所有船只。

當然,預計在 AI 數據中心基礎設施上的大量支出將以某種方式使 AMD 受益。

AMD 硬件只是 AI 支出熱潮中的一個注腳。事實上,目前 AMD 在生成 AI 基礎設施建設方面相對失敗,因為他們在數據中心 GPU 方面缺乏成功安利,在 HGX H100 系統中缺乏 CPU 勝利,以及 普遍放棄 CPU 支出。因此,MI300 的成功至關重要。

01.基本構建塊 - Elk Range 有源中介層芯片

MI300 的所有變體都以稱為 AID(active interposer die) 的相同基本構建塊開始,即是所謂的有源中介層裸片。這是一款名為 Elk Range 的小芯片,尺寸約為 370mm2,采用臺積電的 N6 工藝技術制造。該芯片包含 2 個 HBM 內存控制器、64MB 內存附加末級 (MALL) Infinity Cache、3 個最新一代視頻解碼引擎、36 通道 xGMI/PCIe/CXL,以及 AMD 的片上網絡 (NOC)。在 4 塊配置中,MALL 緩存為 256MB,而 H100 為 50MB。

AID 最重要的部分是它在 CPU 和 GPU 計算方面是模塊化的。AMD 和臺積電使用混合鍵合技術將 AID 連接到其他小芯片。這種通過銅 TSV 的連接允許 AMD 混合和匹配 CPU 與 GPU 的最佳比例。四個 AID 以超過 4.3 TB/s 的對分帶寬相互通信,啟用超短距離 (USR:Ultra Short Reach) 物理層,如 AMD Navi31 游戲 GPU 中的小芯片互連所示,盡管這次同時具有水平和垂直鏈路和具有對稱的讀/寫帶寬。方形拓撲還意味著對角線連接需要 2 跳(hops),而相鄰 AID 需要 1 跳。

ab1c2af6-0c02-11ee-962d-dac502259ad0.png ?

這些 AID 中的 2 個或 4 個(根據 MI300 變體具有不同的計算)在CoWoS 硅中介層的頂部組合在一起。AID 有兩種不同的流片,它們的. T鏡像很像英特爾的 Sapphire Rapids。

02.Compute Tiles——Banff XCD 和 DG300 Durango CCD

AID 之上的模塊化計算塊可以是 CPU 或 GPU。

在 GPU 方面,計算小芯片稱為 XCD,代號為 Banff。Banff在 TSMC N5 工藝技術上制造,約為 ~115mm2 。盡管只啟用了 38 個計算單元,但它總共包含 40 個計算單元。

該架構由 AMD 的 MI250X 演變而來,在 GitHub 上,AMD 將其稱為 gfx940,但公開稱其為 CDNA3。它針對計算進行了優化,盡管是“GPU”,但不能真正處理圖形。

這同樣適用于 Nvidia 的 H100,它們的大部分 GPC 都無法處理圖形。

ab42d4da-0c02-11ee-962d-dac502259ad0.png ?

總的來說,每個 AID 可以有 2 個 Banff die,總共有 76 個 CU。MI300 的最大 XCD/GPU 配置將提供 304 個 CU。作為對比,AMD MI250X 具有 220 個 CU。 MI300 的另一個模塊化計算方面是 CPU 方面。AMD 部分重用了他們的 Zen 4 CCD 小芯片,盡管進行了一些修改。

他們改變了一些金屬層掩模,為 SoIC 和 AID 創建焊盤,需要重新設計一些金屬掩模的新流片。這個修改過的 Zen 4 CCD,GD300 Durango 禁用了 GMI3 PHY。AID 的帶寬明顯高于 GMI3。此 CCD 采用 TSMC 的 5nm 工藝技術,并保留與臺式機和服務器上的 Zen 4 CCD相同的 ~70.4mm 2芯片尺寸。

每個 AID 可以有 3 個 Zen 4 小芯片,總共 24 個內核。MI300的最大CCD/CPU配置可以提供多達96個核心。

03.先進封裝——品味未來

AMD 的MI300 是世界上最令人難以置信的先進封裝形式。有超過 100 塊硅粘在一起,全部位于使用 TSMC 的 CoWoS-S 技術的破紀錄的 3.5x 光罩硅中介層之上。

這種硅的范圍從 HBM 存儲層到有源中介層以進行計算,再到用于結構支持的空白硅。這個巨大的中介層幾乎是 NVIDIA H100 上中介層的兩倍。MI300 的封裝工藝流程非常復雜,是行業的未來。

ab7fac3e-0c02-11ee-962d-dac502259ad0.png ?

復雜的封裝需要 AMD 的重大靈活性和修改才能按時獲得 MI300。最初的設計是使用采用臺積電CoWoS-R技術的有機再分布層 (RDL) 中介層。事實上,臺積電去年確實推出了CoWoS-R測試封裝,其結構與小米300有著驚人的相似之處。可能由于具有如此大尺寸的有機中介層的翹曲和熱穩定性問題而改變了中介層材料。

AID 以 9um 間距與 SoIC gen 1 混合鍵合到 XCD 和 CCD。由于工藝不成熟,AMD 不得不放棄轉向TSMC 的 SoIC gen 2 的計劃,該 SoIC 的間距為 6um 。

然后將它們封裝在 CoW 無源中介層之上。通過這個過程有十幾塊支撐硅片。最終的 MI300 包含傳統的倒裝芯片質量回流和 TCB 以及晶圓上的芯片、晶圓上的晶圓和晶圓上的重構晶圓混合鍵合。

04.MI300 配置

AMD MI300 有 4 種不同的配置,但我們不確定是否所有 4 種都會真正發布。

ab9a43aa-0c02-11ee-962d-dac502259ad0.png ?

MI300A 憑借異構 CPU+GPU 計算成為頭條新聞,El Capitan Exascale 超級計算機正在使用該版本。MI300A 在 72 x 75.4mm 基板上采用集成散熱器封裝,適合插槽 SH5 LGA 主板,每塊板有 4 個處理器。它有效地支付了開發成本。它已經出貨,但真正在第三季度出現增長。標準服務器/節點將是 4 個 MI300A。

不需要主機 CPU,因為它是內置的。這是迄今為止市場上最好的 HPC 芯片,并將保持一段時間。

MI300X 是 AI hyperscaler 變體,如果成功,將成為真正的容量推動者。全是 GPU,以實現 AI 的最佳性能。AMD這里推的服務器級配置是8顆MI300X+2顆Genoa CPU。

MI300C 將走相反的方向,成為僅具有 96 核 Zen4 + HBM 的 CPU,以響應英特爾的 Sapphire Rapids HBM。然而,這個市場可能太小而且產品太貴,以至于 AMD 無法生產這個變體。

MI300P 就像一半大小的 MI300X。它是一種可以以較低功率進入 PCIe 卡的產品。這又需要主機 CPU。這將是最容易開始開發的版本,盡管我們認為它更像是 2024 年的版本。





審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • TSMC
    +關注

    關注

    3

    文章

    177

    瀏覽量

    84604
  • TPU
    TPU
    +關注

    關注

    0

    文章

    144

    瀏覽量

    20784
  • USR
    USR
    +關注

    關注

    1

    文章

    49

    瀏覽量

    11091
  • GPU芯片
    +關注

    關注

    1

    文章

    303

    瀏覽量

    5898

原文標題:AMD最強芯片,全村的希望!

文章出處:【微信號:算力基建,微信公眾號:算力基建】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AMD最強AI芯片,性能強過英偉達H200,但市場仍不買賬,生態是最大短板?

    電子發燒友網報道(文/吳子鵬)當地時間本周四,AMDAMD Advancing AI 2024上發布了一系列新品,包括全新旗艦AI芯片、服務器CPU、AI網卡、DPU和AI PC移動處理器
    的頭像 發表于 10-14 01:32 ?3563次閱讀
    <b class='flag-5'>AMD</b><b class='flag-5'>最強</b>AI<b class='flag-5'>芯片</b>,性能強過英偉達H200,但市場仍不買賬,生態是最大短板?

    Lunar Lake大戰Strix Point!AMD、英特爾掀起新一輪AI PC芯片“大躍進”

    傳統PC芯片大廠的動作來看,AI PC的趨勢,以及Arm陣營的強勢產品入局,都讓AMD、Intel加快了產品迭代進度。 ? AMD :拿下最強NPU 寶座
    的頭像 發表于 06-06 09:15 ?4150次閱讀

    AMD MI300X AI芯片面臨挑戰

    近日,據芯片顧問機構Semianalysis經過5個月的深入調查后指出,AMD最新推出的“MI300X”AI芯片在軟件缺陷和性能表現上未能達到預期,因此在挑戰NVIDIA市場領導地位方面顯得
    的頭像 發表于 12-25 10:57 ?398次閱讀

    AMD或涉足手機芯片市場

    近日,據行業內部知情人士透露,全球知名的半導體巨頭AMD正計劃進軍移動設備芯片市場,此舉或將為移動計算領域帶來一場新的變革。 據悉,AMD擬推出的新產品將采用臺積電先進的3納米工藝制造,這一決策不僅
    的頭像 發表于 11-26 10:56 ?382次閱讀

    AMD發布新一代AI芯片MI325X

    在舊金山舉辦的Advancing AI 2024大會上,AMD正式推出了其新一代AI芯片——GPU AMD Instinct MI325X。這款芯片的發布標志著
    的頭像 發表于 10-11 15:55 ?476次閱讀

    AMD最強AI芯片發布但不及市場預期

    行業芯事行業資訊
    電子發燒友網官方
    發布于 :2024年10月11日 11:46:36

    英特爾錯失索尼PS6芯片大單,AMD勝出

    在索尼即將推出的PlayStation 6(PS6)芯片設計與制造競標中,英特爾遺憾落敗于AMD,錯失了一項價值高達300億美元的重大合同。據知情人士透露,這場激烈的競爭最終定格在英特爾與AMD之間,而
    的頭像 發表于 09-24 14:32 ?389次閱讀

    AMD穩固合作,贏得索尼PS6處理器芯片設計合同

    9月18日,國際科技界傳來重要消息,據權威外媒披露,AMD已成功奪得索尼下一代游戲主機PS6的處理器芯片設計訂單,這一合作不僅標志著AMD與索尼自PS4、PS5時代以來穩固伙伴關系的延續,也彰顯了
    的頭像 發表于 09-18 16:37 ?939次閱讀

    AMD AI芯片需求井噴,業績預估再獲提升

    全球芯片巨頭AMD近期發布的財報與未來財測數據令人矚目,尤其是其在數據中心領域的強勁表現,再次引發了市場的熱烈反響。AMD的執行長蘇姿豐更是直接表示,AI芯片的需求“超乎預期”,這一積
    的頭像 發表于 08-02 16:38 ?757次閱讀

    使用STM32F407ZGT6的設備無法連接到AMD處理器的電腦上,怎么處理?

    使用貴公司的STM32芯片,型號:STM32F407ZGT6。CAN總線轉串口,可以正常連接到英特爾處理器的電腦上;但是無法連接到AMD處理器的電腦上。請問怎么處理? 連接到AMD處理器的電腦上,串口顯示如下:
    發表于 07-23 07:58

    AMD發布全新AI芯片Instinct MI325X

    在近日舉行的COMPUTEX臺北國際電腦展上,AMD董事長兼CEO蘇姿豐發表了精彩演講,并正式發布了一款備受矚目的AI芯片——Instinct MI325X。這款芯片預計將于2024年第四季度正式上市,將為AI領域帶來全新的性能
    的頭像 發表于 06-04 14:49 ?1057次閱讀

    英特爾、AMD等聯手推出UALink,希望用它取代Nvidia NVLink接口

    周四,英特爾、AMD、博通、思科、谷歌、HPE、Meta和微軟宣布正在建立一個新的行業組織——Ultra Accelerator Link(UALink)推廣組,以指導數據中心AI加速器芯片之間連接組件的發展。
    的頭像 發表于 05-31 11:46 ?2158次閱讀
    英特爾、<b class='flag-5'>AMD</b>等聯手推出UALink,<b class='flag-5'>希望</b>用它取代Nvidia NVLink接口

    AMD預計提前推出X860(E)芯片

    AMD近日宣布,將提前推出全新的消費級旗艦主板芯片組X860(E),這一舉動打破了原先預計的X760(E)更迭計劃。新芯片組將與英特爾的Z890旗艦主板芯片組同屬800系列,展示了
    的頭像 發表于 05-29 14:26 ?968次閱讀

    AMD Chiplet小芯片架構年減排數萬噸溫室氣體

    AMD公司的企業責任總監Justin Murrill介紹,在生產第四代EPYC(霄龍) CPU時,AMD采用了8個獨立的計算芯片CCD,而非整塊單芯片,此舉有望在2023年減少約5萬噸
    的頭像 發表于 04-24 16:05 ?543次閱讀

    AMD收盤市值站上3100億美元 華爾街熱捧AI芯片制造商

    市場分析師對AMD的樂觀預測得到了花旗銀行的支持。該銀行近期報告中將AMD、博通(Braodcom)和英偉達列為AI芯片半導體領域的優選股票。
    的頭像 發表于 03-01 15:59 ?1268次閱讀
    六合彩最快开奖| 188金宝博| 百家乐如何写路| 百家乐官网技巧论坛| 大发888中文版| 7人百家乐桌布| 皇家百家乐官网出租平台| 金濠国际娱乐城| 巴西百家乐的玩法技巧和规则| 蒙山县| 大发888娱乐场17| 百家乐电子发牌盒| 百家乐的路怎样看| 百家乐如何取胜| 试玩区百家乐官网1000| 双鸭山市| 顶级赌场| 太阳城团购| 百家乐小路规则| 百家乐下注的规律| 百家乐官网玩的技巧| 网上赌百家乐官网被抓应该怎么处理| 瑞丰娱乐| 舟山星空棋牌下载| 百家乐园能贷款吗| 百家乐赌博赌博网站| 百家乐注册赠分| 淘宝博百家乐官网的玩法技巧和规则 | 百家乐官网特殊计| 波音百家乐官网现金网| 明升备用| 澳门娱乐城| 德州扑克加注规则| 大发888下载 大发888游戏平台| 澳门百家乐经| 威尼斯人娱乐城注册送彩金| 巴宝莉百家乐的玩法技巧和规则| 百家乐真钱斗地主| 百家乐赌博在线娱乐| 新加坡百家乐的玩法技巧和规则| 网上百家乐是假|