2月21日,英偉達(dá)(Nvidia)公布截止到2024年1月28日的第四季度營(yíng)收,收入達(dá)到221億美元,比較上一季度增長(zhǎng)22%,較去年同期增長(zhǎng)265%。英偉達(dá)2024財(cái)年收入增長(zhǎng)126%,達(dá)到609億美元。
在公布強(qiáng)勁財(cái)報(bào)后,Nvidia周四股價(jià)飆升16%,市值增加約2770億美元,令其總市值接近2萬(wàn)億美元。擊敗Facebook母公司Meta Platform在今年2月早前達(dá)到的1,960億美元,成為華爾街史上單日市值增加最多的企業(yè)。
Nvidia創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“加速計(jì)算和生成式AI已經(jīng)達(dá)到一個(gè)轉(zhuǎn)折點(diǎn)。全球企業(yè)、行業(yè)和各個(gè)國(guó)家的需求都在激增。由于生成式AI以及整個(gè)行業(yè)從中央處理器轉(zhuǎn)向英偉達(dá)制造的加速器,對(duì)英偉達(dá)GPU的需求將保持高位?!?br />
摩根士丹利分析師Joseph Moore表示,Nvidia的表現(xiàn)超過(guò)預(yù)期,直到幾個(gè)季度前,我們從未見(jiàn)過(guò)超過(guò)20億美元的季度收入指引,但在AI激增期間,這已經(jīng)成為常規(guī)。AI需求的強(qiáng)勁持續(xù)令人矚目。
2022年10月和2023年10月,美國(guó)商務(wù)部工業(yè)和安全局(BIS)兩次更新對(duì)中國(guó)的先進(jìn)半導(dǎo)體和計(jì)算設(shè)備的出口管制,英偉達(dá)中國(guó)特供版GPU產(chǎn)品A800、H800芯片均已經(jīng)于去年11月17日起在中國(guó)禁售。除此之外,AMD發(fā)布的性能最強(qiáng)的MI300X、MI300A、MI250X也不能賣到中國(guó)。在ChatGPT、AI大模型帶動(dòng)下各國(guó)算力需求激增,中國(guó)芯片廠商如何挖掘這個(gè)市場(chǎng)的商機(jī)?本文進(jìn)行主要的分析。
阿里云平頭哥
2023年的云棲大會(huì)上,阿里巴巴集團(tuán)董事會(huì)主席蔡崇信闡釋了阿里云的新愿景:“打造AI時(shí)代最開(kāi)放的云”。 他表示,隨著AI大模型技術(shù)的迅速發(fā)展,智能化時(shí)代正在開(kāi)啟,AI將成為各行各業(yè)的新型生產(chǎn)力,并對(duì)算力提出更高要求。
成立于2018年的阿里平頭哥,正處于云計(jì)算的拐點(diǎn)之上。這是一家阿里巴巴全資的半導(dǎo)體芯片公司,業(yè)務(wù)主體擁有端云一體全棧產(chǎn)品系列,涵蓋數(shù)據(jù)中心芯片、IoT 芯片、處理器 IP 授權(quán)等,實(shí)現(xiàn)芯片端到端設(shè)計(jì)鏈路全覆蓋。
阿里平頭哥 2019 年 9 月推出了其首款高性能人工智能推理芯片──含光800,基于 12nm 制程與自研架構(gòu),整合 170 億晶體管,性能峰值算力達(dá) 820 TOPS。 在業(yè)界標(biāo)準(zhǔn)的 ResNet-50測(cè)試中,推理性能達(dá)到 78563 IPS,能效比達(dá) 500 IPS/W。
2023 年 8 月,阿里平頭哥發(fā)布了首個(gè)自研 RISC-V AI 平臺(tái),支持運(yùn)行 170 余個(gè)主流 AI 模型,推動(dòng) RISC-V 進(jìn)入高性能 AI 應(yīng)用時(shí)代。同時(shí),平頭哥宣布玄鐵處理器 C920 全新升級(jí),C920 執(zhí)行 GEMM(矩陣的矩陣乘法) 計(jì)算較 Vector 方案可提速 15 倍。
11月21日,平頭哥玄鐵RiSC-V上新了三款處理器:首次實(shí)現(xiàn)AI矩陣擴(kuò)展的C907、滿足Vector1.0標(biāo)準(zhǔn)的C920,以及實(shí)時(shí)處理器R910,將加速推動(dòng)RiSC-V在自動(dòng)駕駛、人工智能、企業(yè)級(jí)SSD、網(wǎng)絡(luò)通信等場(chǎng)景和領(lǐng)域的大規(guī)模商用落地。C920較上一代提升了最高3.9倍的AI性能,可以跑Transformer模型,適合機(jī)器學(xué)習(xí)、自動(dòng)駕駛領(lǐng)域。
華為昇騰910系列
Nvidia在最新提交給美國(guó)證券交易所的一份檔案,認(rèn)定華為是AI芯片領(lǐng)域的主要競(jìng)爭(zhēng)對(duì)手。Nvidia指出,與華為在AI芯片領(lǐng)域進(jìn)行競(jìng)爭(zhēng),包括GPU、CPU和網(wǎng)絡(luò)芯片。
在2018 全聯(lián)接大會(huì)上,華為提出 AI 戰(zhàn)略和全棧全場(chǎng)景 AI 解決方案,并發(fā)布了 2 顆全新的 AI 芯片:昇騰 910(Ascend 910)和昇騰 310(Ascend 310)。
兩款 AI 芯片均基于華為自研達(dá)芬奇架構(gòu),其中 Ascend 910(用于訓(xùn)練)采用 7nm 制程,半精度達(dá)256TFOPs,功耗為 350W,運(yùn)算密度號(hào)稱超越了 NVIDIA Tesla V100 和Google TPU v3。
Nvidia在2020 年和 2022 年推出了 A100 和 H100 芯片,占據(jù)了全球 AI 芯片市場(chǎng)的最大份額,華為昇騰910B據(jù)稱采用的是7nm制程。業(yè)界認(rèn)為,華為昇騰 910B 能力已經(jīng)基本做到可對(duì)標(biāo) Nvidia A100。
華為計(jì)算官網(wǎng)顯示,基于昇騰 910(Ascend 910)和昇騰 310(Ascend 310),華為還推出了Atlas AI 計(jì)算解決方案。華為目前 Atlas 300T 產(chǎn)品有三個(gè)型號(hào),分別對(duì)應(yīng)升騰 910A、910B、910 Pro B,最大 300W 功耗,前兩者 AI 算力均為 256 TFLOPS,而 910 Pro B 可達(dá) 280 TFLOPS(FP16)。
此前路透社的報(bào)道,國(guó)內(nèi)搜索巨頭百度向華為下了訂單,購(gòu)買昇騰910B用于AI服務(wù)器。
最新中國(guó)移動(dòng)智算中心AI服務(wù)器采購(gòu)大單,華為昇騰再次成為贏家。此次四家中標(biāo)候選人中,河南昆侖為超聚變?nèi)Y子公司,與華鯤振宇、烽火通信(控股子公司長(zhǎng)江計(jì)算)、神州數(shù)碼均為華為昇騰認(rèn)證的合伙伙伴。
百度昆侖芯
百度集團(tuán)執(zhí)行副總裁、百度ACG(智能云事業(yè)群)總裁沈抖表示,未來(lái)所有的企業(yè)都會(huì)強(qiáng)依賴大模型,而且所有的產(chǎn)品都會(huì)基于大模型來(lái)開(kāi)發(fā)。
昆侖芯1代AI芯片于2020年量產(chǎn),在百度搜索引擎、小度等業(yè)務(wù)中部署數(shù)萬(wàn)片,是國(guó)內(nèi)唯一一款經(jīng)歷過(guò)互聯(lián)網(wǎng)大規(guī)模核心算法考驗(yàn)的云端AI芯片。昆侖芯2代AI芯片于2021年8月量產(chǎn),是國(guó)內(nèi)首款采用GDDR6顯存的通用AI芯片,相比昆侖芯1代AI芯片性能提升2-3倍,且在通用性、易用性方面也有顯著增強(qiáng)。
而昆侖芯2代則采用了TSMC 工藝,性能和功耗都有顯著提升。
寒武紀(jì)推出思元370、590系列及加速卡
2022年,寒武紀(jì)首顆訓(xùn)推一體的Chiplet智能芯片思元370及系列加速卡初次亮相WAIC,思元370是寒武紀(jì)第三代云端產(chǎn)品,采用7nm制程工藝,最大算力高達(dá)256TOPS(INT8),是寒武紀(jì)第二代云端推理產(chǎn)品思元270算力的2倍。同時(shí),思元370芯片支持LPDDR5內(nèi)存,內(nèi)存帶寬是思元270的3倍,可在板卡有限的功耗范圍內(nèi)給人工智能芯片分配更多的能源,輸出更高的算力。
而寒武紀(jì)在2016年成立,專注于人工智能芯片產(chǎn)品的研發(fā)與技術(shù)創(chuàng)新,提供云邊端一體、軟硬件協(xié)同、訓(xùn)練推理融合、具備統(tǒng)一生態(tài)的系列化智能芯片產(chǎn)品和平臺(tái)化基礎(chǔ)系統(tǒng)軟件,產(chǎn)品廣泛應(yīng)用于服務(wù)器廠商和產(chǎn)業(yè)公司。
據(jù)悉,寒武紀(jì)最新一代思元590在性能上對(duì)標(biāo)英偉達(dá)A100、A800,有可能在2024年上半年量產(chǎn),成為國(guó)產(chǎn)替代的備選之一。
近年來(lái)寒武紀(jì)陸續(xù)推出思元、玄思等芯片/加速卡產(chǎn)品系列。 在目前AI算力建設(shè)大爆炸時(shí)期,特別是高端進(jìn)口算力芯片受限下,國(guó)產(chǎn)替代的需求或讓寒武紀(jì)公司的芯片在算力時(shí)代搶得一定的市場(chǎng)份額。
沐曦:推出人工智能推理GPU曦思N100和通用計(jì)算芯片曦云C500
沐曦集成電路公司于2020年在上海成立,致力于為異構(gòu)計(jì)算提供安全可靠的GPU芯片及解決方案,打造全棧GPU芯片產(chǎn)品。
2022年,沐熙集成電路推出了曦思N100,現(xiàn)處于規(guī)?;慨a(chǎn)和大規(guī)模出貨狀態(tài)。曦思N100是沐曦面向人工智能推理場(chǎng)景推出的高效能GPU產(chǎn)品,內(nèi)置 MXN100 異構(gòu) GPGPU 處理器以及 HBM2E 顯存,單卡算力達(dá) 160TOPS(INT8)和 80TFLOPS(FP16),能夠提供最高 128 路編碼和 96 路解碼的視頻處理能力,兼容 HEVC、H.264、AV1、AVS2 等多種視頻格式,最高支持 8K 分辨率。
此外,沐曦首款面向人工智能訓(xùn)練及通用計(jì)算的旗艦產(chǎn)品曦云C500在2023年6月流片,這款芯片基于自研的高性能GPU IP,特別適合千億參數(shù)AI大模型的訓(xùn)練和推理,能夠提供構(gòu)建高密度算力和云計(jì)算部署的優(yōu)秀國(guó)產(chǎn)GPU解決方案,在2023年底實(shí)現(xiàn)規(guī)模量產(chǎn)。
小結(jié):
分析師估計(jì)中國(guó)人工智能芯片市場(chǎng)價(jià)值70億美元。目前在大模型推理方面,國(guó)內(nèi) AI 芯片910B僅能達(dá)到Nvidia公司A100的60%-70%左右,集群的模型訓(xùn)練難以為繼。而就在2月21日,Nvidia CEO黃仁勛向媒體表示,英偉達(dá)目前正在向客戶提供兩款面向中國(guó)市場(chǎng)的新型人工智能(AI)芯片樣品,以在美國(guó)采取對(duì)華芯片出口管制措施的背景下維持該公司在中國(guó)市場(chǎng)的地位。
此外,除了華為昇騰外,寒武紀(jì)、沐曦、天數(shù)智芯都公布過(guò)AI訓(xùn)練及推理芯片,但是AI芯片生態(tài)尚未有效建立,和Nvidia CUDA生態(tài)對(duì)比,還有不少短板。
-
AI
+關(guān)注
關(guān)注
87文章
31516瀏覽量
270333
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論