那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

百核千核,服務器芯片多核才是王道?

E4Life ? 來源:電子發燒友網 ? 作者:周凱揚 ? 2022-06-01 00:05 ? 次閱讀

要說造芯這件事,不僅手機和汽車廠商熱衷于此,如今服務器廠商也紛紛投入自研大軍中來,無論是國內的阿里云,還是國外的亞馬遜,在收購一大批芯片設計廠商網羅了一眾芯片設計精銳后,也開始推出基于自己芯片的服務器,所用工藝也已經升級到了7nm和5nm。

此外,第三方服務器芯片廠商也順勢發力,打算為這些云服務廠商提供更高的吸引力,而不是讓他們整天想著節省成本用自研方案替換掉自己的產品。好在大部分云服務廠商自研的芯片主要還是集中在AI加速芯片和網絡芯片這一塊,CPU很大一部分仍是第三方的地盤。而在第三方的CPU設計中,我們可以看到多核已經成了當下的主流方案。

多核云端更吃香?

首先我們來看最常見也最直接的一種提升性能方式,堆核心。這種操作我們已經在消費芯片或是各個電子產品的宣傳術語中聽得耳朵生繭了,且向來都是一種相當有效的性能提升方式。盡管則對芯片的面積限制較大,但不可否認的是,在對面積沒那么看重的服務器市場上,走多核路線的芯片廠商越來越多。

AmpereComputing的AmpereAltra應該是國內出貨量最高的Arm服務器CPU系列了,這款最高128核的處理器已經在不少云服務的實例上亮相。AmpereComputing與微軟Azure和OracleCloud達成了合作,在中國不僅擁有阿里云、騰訊云、京東云和UCloud這些公有云客戶,百度、美團和字節跳動等公司也在使用其產品。

AmpereAltraMax封裝 / AmpereComputing


再來看看英偉達的ArmCPU Grace,雖然采用了Arm的Neoverse參考設計,但英偉達同樣選了144核的多核心設計,那么為何多核在服務器上如此吃香呢?我們上面也提到了AmpereAltra在中國收獲了不小的市場,其實歸根結底就是其多核心數的功勞。

國內使用公有云的用戶數遠超國外,對于云服務廠商來說,這種多核處理器意味著可以將單服務器切分為更多的vCPU,也就意味著更多的可用實例。這還沒完,以AmpereAltra為例,每個核心上只運行單個線程,這樣即便多用戶同時使用下,依然能夠維持穩定的性能。

Ampere處理器路線圖 / AmpereComputing


值得一提的是,Ampere近期發布了自研5nm處理器,AmpereOne,一個基于自研Arm核心的服務器處理器。這對于其他廠商來說或許無法實現,但Ampere作為Arm架構的授權商,是可以像高通、華為和蘋果等廠商一樣,開發定制自己的Arm核心的。

也或許是因為這次終于沒有繼續沿用ArmNeoverseN1或N2這樣的參考設計,Ampere才將這一產品命名為AmpereOne。Ampere并沒有公布這一產品的核心數,但從現有產品最小核心數也有32核的設計,以及AmpereOne實物圖與AmpereAltraMax近似的封裝來推斷,這一新品追求的必然是更高性能的云原生應用,而不是面向只需較低核心數就能滿足需求的邊緣計算市場。

服務器AI芯片靠數量和能耗制勝

與處理器芯片處理通用計算的多核策略不同,AI芯片的多核主要還是提高AI計算效率,而且單核能效比和單位面積效率往往高于傳統的處理器架構,導致核心數更多。以打造千核RISC-V AI芯片的Esperanto為例,其ET-SoC-1芯片基于臺積電7nm打造,集成了1092個RISC-V核心。

ET-SoC-1芯片 / Esperanto


但就是這樣一個千核芯片,卻可以做到20W以內的功耗和570mm2的diesize。正因如此,即便單個ET-SoC-1的算力不及英偉達A100這類GPU,也可以憑借多塊芯片組成的AI加速器板卡來實現同等的性能,甚至低上一大截的功耗。

對于依賴陣列乘法器這類專用硬件和少量CPU核心的芯片,一旦問題不能完全由專用硬件解決,就會把任務交給有限的通用CPU核心。而Esperanto的ET-SoC-1方案中,上千顆通用RISC-V核心帶來的完全并行可以顯著加快執行速度。何況哪怕相較于5nm而言,7nm的能效比也還是非常優異的,所以更適合這類超多核心數的設計,也更符合數字中心的低碳設計理念。

結語

有的讀者可能會有疑惑,既然多核能給服務器芯片帶來顯著的提升,為何英特爾AMD這些x86服務器芯片廠商不設計百核以上的架構呢?這就與CISC與RISC架構的差異有關了,哪怕在同等工藝和同等核心數下,x86芯片的diesize也絕對要大于Arm和RISC-V芯片,而隨著diesize的增加,芯片的良率也會一并減少。再者就是多核下的并行問題了,一些通用計算任務在多核下的并行執行效率并不高,而且會大幅提升復雜性。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    456

    文章

    51185

    瀏覽量

    427282
  • 服務器
    +關注

    關注

    12

    文章

    9304

    瀏覽量

    86066
  • 服務器芯片
    +關注

    關注

    2

    文章

    123

    瀏覽量

    19285
收藏 人收藏

    評論

    相關推薦

    景銳51芯片ISP燒錄工具免費下載

    景銳51芯片ISP燒錄工具
    發表于 01-22 17:24 ?0次下載

    服務器部署k8s需要什么配置?

    服務器部署K8s需要至少2CPU、4GB內存、50GBSSD存儲的主節點用于管理集群,工作節點建議至少2CPU、2GB內存、20GBSSD。還需安裝Docker,選擇兼容的Kubernetes版本,配置網絡插件,以及確保系
    的頭像 發表于 10-09 15:31 ?247次閱讀

    高斯濾波的卷積怎么確定

    N為一個奇數,如3、5、7等。奇數大小的卷積有助于確定一個中心像素點,便于計算。 大小選擇 :卷積的大小決定了濾波的范圍。較大的卷積核可以覆蓋更多的像素點,從而更好地平滑圖像,但也可能導致圖像細節丟失過多。因此,在
    的頭像 發表于 09-29 09:29 ?764次閱讀

    關于2K1000LA的間中斷

    我試圖閱讀2K1000LA處理器用戶手冊(V1.0)以在我開發的操作系統中支持多核啟動。實際上我對此有一些疑惑,2K1000LA啟動的時候,是兩個核心都會一起啟動,還是只會啟動一個,而另一個等待
    發表于 08-27 22:04

    龍芯中科胡偉武:3B6600 八桌面 CPU 性能將達到英特爾中高端酷睿 12~13 代水平

    推出的桌面端 CPU 龍芯 3A6000,實測性能相當于英特爾公司 2020 年上市的第十代酷睿四處理;龍芯今年研制成功的16 及 32 版龍芯 3C6000
    發表于 08-13 11:16

    集特雙路服務器GDC-2001介紹

    處理的峰值性能已經能與典型 ARM 64 處理的峰值性能相當 下面要給大家介紹的集特家族長江系列服務器新成員——GDC-2001服務器
    的頭像 發表于 07-04 11:45 ?396次閱讀
    集特雙路<b class='flag-5'>服務器</b>GDC-2001介紹

    FPGA的IP軟使用技巧

    的IP軟 : 根據項目需求選擇合適的IP軟,如FIFO、RAM、FIR濾波、SDRAM控制、PCIE接口等。確保所選IP軟核能夠滿足項目的功能需求。 注意IP軟
    發表于 05-27 16:13

    關于FPGA IP

    對于深入學習使用FPGA的小伙伴們,特別是一些復雜的、大規模的設計應用,適宜的IP核對開發能起到事半功倍的作用。IP的概念與我們sdk里庫的概念相似。IP即電路功能模塊,用戶可以直接調用這些模塊
    發表于 04-29 21:01

    RISC-V在服務器方面應用與發展前景

    RISC-V在服務器方面的應用與發展前景十分廣闊。作為一種開源、開放、簡潔、靈活的指令集,RISC-V近年來在芯片產業中發展迅速,并逐漸引領新一輪處理芯片技術與產業的變革浪潮。 在
    發表于 04-28 09:04

    RISC-V在服務器方面的應用與發展前景如何?剛畢業的學生才開始學來的及嗎?

    RISC-V在服務器方面的應用與發展前景十分廣闊。作為一種開源、開放、簡潔、靈活的指令集,RISC-V近年來在芯片產業中發展迅速,并逐漸引領新一輪處理芯片技術與產業的變革浪潮。 在
    發表于 04-28 08:49

    多核架構高性能電機控制芯片

    基于傳統單核架構的電機控制芯片已無法應對新出現的嚴峻挑戰,多核架構的控制芯片應運而生。雙架構芯片已在許多領域成功應用,并顯示出其獨特的優勢
    的頭像 發表于 04-19 14:46 ?8495次閱讀
    <b class='flag-5'>多核</b>架構高性能電機控制<b class='flag-5'>芯片</b>

    配置一個邊緣IO服務器服務器共有1-8個COM口,怎樣的分配才是最高效的呢?

    在配置一個邊緣IO服務器,此服務器共有1-8個COM口,將每兩個COM口用來插DO板和DI板,共為四組,比如COM-1口可以和COM-2口為一組。本設備希望用DO板來控制DI板,故希望DO在發送數據時跟DI收到的數據一致,請問應該怎樣以怎樣的分配
    發表于 04-02 06:19

    新品發布|3C5000/7A2000雙路服務器GDC-2001

    龍芯 3C5000 系列是龍芯中科面向服務器領域傾力打造的高性能通用處理,而本次發布的 3C5000 采用了完全自主的 LoongArch 指令架構,號稱“具備超強算力”,其 16 核心單芯片
    的頭像 發表于 03-16 09:25 ?669次閱讀
    新品發布|3C5000/7A2000雙路<b class='flag-5'>服務器</b>GDC-2001

    性能強勁、穩定高效的雷神雙路64服務器升級亮相

    近期,雷神科技基于兆芯開勝KH-40000系列處理打造的博睿FX2服務器迎來升級更新,搭載雙路KH-40000/32處理的雷神FX2-Z1UC1服務器,具備性能卓越、運行穩定、生態
    的頭像 發表于 02-23 11:31 ?875次閱讀

    linux服務器和windows服務器

    應用和企業環境中使用,那么Win dows服務器可能更適合你的需求。 綜上所述,Linux服務器和Windows服務器各有優劣,選擇適合自己需求的服務器操作系統是確保
    發表于 02-22 15:46
    金濠国际网| 百家乐娱乐平台官网网| 百家乐加牌规则| 皇冠百家乐皇冠网| 百家乐开户送彩网址| 百家乐视频无法显示| 百家乐官网缆的打法| 百家乐官网作弊视频| 百家乐防伪筹码套装| 温州市百家乐ktv招聘| 百家乐可以作假吗| 百家乐群详解包杀| 大发888网页游戏平台| 至尊百家乐| 全讯网qx1860.com| 百家乐园蒙| 波克棋牌游戏大厅| 赌博堕天录漫画| 博九网百家乐官网现金网| 百家乐官网赌钱| 现场百家乐官网玩法| 风水97年农历6月24八字| 百家乐博彩平台| 有关百家乐玩家论坛| 老虎机在线ap888| 大富豪棋牌游戏下载| 天气| 破战百家乐官网的玩法技巧和规则| 15人百家乐官网桌| 百家乐二代理解| bet365提款多久到账| 百家乐官网中的概率| 百家乐官网谁能看准牌| 百家乐网址皇冠现金网| 免费百家乐预测工具| 瑞丰娱乐场| 百家乐官网顺序| 大哥大百家乐官网的玩法技巧和规则 | 太阳城百家乐注册平台| 大发888为什么进不去| 牡丹江市|