來源:新智元
當地時間10月17日,美國正式發布新規,全面收緊尖端AI芯片對華出口,并將13家中國GPU實體列入“實體清單”。商務部長雷蒙多表示,管制目的就是遏制中國獲得先進芯片,從而阻礙「人工智能和復雜計算機領域的突破」。自此,英偉達和其他芯片制造商向我國銷售高性能半導體,受到的限制愈加嚴重,而相關公司想找到繞過限制的方法,也愈加艱難。 根據相關文件,GPU芯片只要滿足以下條件的其中一個,就會受到出口限制——
來源:中信證券 隨著新規的出臺,英偉達、AMD和英特爾的股價也一度大跌。 據稱,英偉達在數據中心芯片方面的收入,有多達25%都依賴于中國市場。
此外,作為新規的一部分,芯片設計公司摩爾線程和壁仞科技,也被拉入了最新的黑名單中。
30天內,立即生效!
根據美國商務部下發的文件,禁令將在30天內生效。 同時,雷蒙多還表示,以后法規可能會至少每年更新一次。
文件鏈接:https://www.bis.doc.gov/index.php/about-bis/newsroom/2082
總算力低于300 TFLOPS,且每平方毫米370 GFLOPS以下
在去年的禁令中,美國曾禁止出口超過2個閾值的芯片:一個是芯片所含算力的大小,另一個是芯片之間相互通信的速率。 之所以做如此規定,是因為AI系統需要在同一時間將成千上萬的芯片串聯在一起,處理大量數據。
而英偉達特供版的芯片H800/A800做到了保持在通信限制之下,同時仍能訓練AI模型,因為它們保留了強大的計算能力。 此前,路透社報道稱,英偉達H800芯片間數據的傳輸速度為每秒400 GB/s,不到H100峰值速度(每秒900 GB/s)的一半。
這一次,美國官員表示,新規將更專注于算力,這就可以控制更多芯片,包括英偉達的特供版。 算力方面,美商務部這次取消了「帶寬參數」,取而代之的是「性能密度」。 根據新規,修改后的出口管制禁止向中國公司出售運行速度為300 TFLOPS(一萬億運算/秒)及以上的數據中心芯片。
如果速度為150-300 TFLOPS的芯片的「性能密度」為每平方毫米370 GFLOPS(十億次運算/秒)或更高,則將被禁止銷售。 以上述速度運行,但性能密度較低的芯片屬于「灰色地帶」,這意味著必須向美政府通報對中國的銷售情況。 雖然這些規則不適用「消費產品」的芯片,但美商務部表示,出口商在出口速度超過300 TFLOPS的芯片時也必須上報,以便當局可以跟蹤這些芯片是否被大量用于訓練AI模型。
根據新規,受影響的英偉達芯片包括但不限于A100、A800、H100、H800、L40和L40S,甚至連RTX 4090也需要額外的許可要求。 現在剩下的,似乎只有英偉達V100了。根據該芯片參數,芯片相互通信速率是300 GB/s,運行速度最大為125 TFLOPS。
此外,任何集成了一個或多個所涵蓋集成電路的系統(包括但不限于DGX和HGX系統)也在新許可要求的涵蓋范圍之內。 不過,英偉達預計,短期內美國最新限令不會產生重大影響。
堵住Chiplet漏洞
美國這次試圖解決的另一個問題,是Chiplet。通過這種技術,芯片的較小部分可以連接在一起,形成一個完整芯片。 美國擔心中國公司通過Chiplet獲取符合規定的小芯片,然后再秘密組裝成更大的芯片。
這次新規增加了「性能密度」的限制,對芯片在一定尺寸中的計算能力加以限制,就是針對此類變通方法。 Chiplet方法,或許是中國半導體行業未來的核心。
中國GPU企業,通通列入黑名單
業內人士認為,如果美國芯片在中國被禁,中國公司會努力填補市場上的空白。 摩爾線程和壁仞科技都是由英偉達前員工創立的,被認為是中國生產英偉達芯片國產替代品的最佳候選者。 但現在,這兩家公司也被添加到了實體清單,這阻斷了臺灣半導體公司或其他使用美國設備的制造商為它們制造芯片。
對應的中文公司名稱如下:
- 北京壁仞科技開發有限公司
- 廣州壁仞集成電路有限公司
- 杭州壁仞科技開發有限公司
- 光線云(杭州)科技有限公司;
- 摩爾線程智能科技(北京)有限責任公司;
- 摩爾線程智能科技(成都)有限責任公司;
- 摩爾線程智能科技(上海)有限責任公司;
- 上海壁仞信息科技有限公司;
- 上海壁仞集成電路有限公司;
- 上海壁仞科技股份有限公司(曾用名:上海壁仞智能科技有限公司);
- 超燃半導體(南京)有限公司;
- 蘇州芯延半導體科技有限公司;
- 珠海壁仞集成電路有限公司
芯片工廠的危險信號
美國表示,任何包含500億或更多晶體管、并使用高帶寬內存的芯片,都包含著危險信號。 出口商需要格外注意,是否需要許可證才能向中國發貨。 而這一門檻,幾乎涵蓋了所有先進的AI芯片,幫助芯片工廠發現規避規則的行為。
DUV***也受限
美國還將先進芯片的出口許可證要求增加到22個國家。 管制范圍也擴大到最終母公司總部設在上述國家的任何公司,以防止境外子公司購買違禁芯片。 美國還對其余21個國家提出了芯片制造工具的許可要求,擔心這些設備可能被轉移到中國。
荷蘭的DUV光刻系統也受到了限制,以防止ASML向中國的芯片工廠運輸一些較舊的DUV型號和配件。 DUV設備比不上最先進的EUV設備,但它可以以更高的成本制造芯片。而EUV早已全面被禁。
大廠囤貨:10萬塊A800,今年交付
對于國內互聯網巨頭來說,現在手里還有多少存貨? 目前,這一具體數額未知。不過,國內大廠剛剛發聲:我們囤得夠了。 前段時間,外媒FT曾報道稱,國內互聯網大廠競相訂購了價值約50億美元的英偉達芯片。 據介紹,百度、字節、騰訊、阿里已經向英偉達下單A800,價值10億美元,共10萬塊芯片,將于今年交付。 另外,還有40億美元GPU訂單,也將于2024年交付。
兩位內部人士透露,字節已經儲備了至少1萬個英偉達GPU來支持各種生成式人工智能產品。 他們補充道,該公司還訂購了近7萬個A800芯片,將于明年交付,價值約7億美元。 英偉達在一份聲明中表示,「消費者互聯網公司和云提供商,每年在數據中心組件上投資數十億美元,而且往往提前數月下單。」 今年早些時候,隨著全球生成式AI的不斷推進,據國內科技公司的內部人表示,大多數中國互聯網巨頭可用于訓練大型語言模型的芯片庫存不到幾千個。 自那以來,隨著需求的增長,這些芯片的成本也在增長。一位英偉達分銷商表示,「分銷商手中的A800價格上漲了50%以上」。
比如,阿里發布自家大模型通義千問后,并將其整合到各線產品中。 與此同時,百度也在全力投入大模型的研發和應用中,文心一言不斷迭代升級,現能與GPT-4媲美。 騰訊云今年4月,發布了一個全新的服務器集群,其中就使用了英偉達H800。 另據2位人士透露,阿里云還從英偉達獲得了數千個H800,而且許多客戶與阿里建立聯系,希望使用這些芯片驅動的云服務,以推動自家模型的研發。
訓練大模型,用什么芯片?
從年初至今,業界紛紛發展自家的大模型,通常對標的是「地表最強」GPT-4模型。 此前爆料稱,GPT-4采用的是MoE架構,由8個220B模型組成,參數量達1.76萬億。 這一參數量已經讓許多人望塵莫及,對算力的消耗已經是最大極限。 具體來說,OpenAI訓練GPT-4的FLOPS約為2.15e25,在大約25000個A100上訓練了90到100天,利用率在32%到36%之間。
那么,對于下一代模型,人們口中的「GPT-5」,對算力又將有多大的需求? 此前,摩根士丹利曾表示,GPT-5將使用25000個GPU,自2月以來已經開始訓練,不過Sam Altman之后澄清了GPT-5尚未進行訓。 另根據馬斯克的說法,GPT-5可能需要30000-50000塊H100。
這意味著,如果科技大廠想要進一步推進大模型的迭代升級,還需要極大的算力支持。 對此,英偉達首席科學家Bill Dally曾表示:「隨著訓練需求每6到12個月翻一番,這一差距將隨著時間的推移而迅速擴大。」
審核編輯 黃宇
-
芯片
+關注
關注
456文章
51164瀏覽量
427200 -
gpu
+關注
關注
28文章
4772瀏覽量
129349 -
AI
+關注
關注
87文章
31507瀏覽量
270302 -
英偉達
+關注
關注
22文章
3847瀏覽量
91959
發布評論請先 登錄
相關推薦
評論