得數據中心者的天下,擁有海量數據中心的企業,像亞馬遜、英特爾等外企都有自己領先的產品,國內阿里云、騰訊、字節跳動等互聯網巨頭都在自研DPU產品,此外還有很多DPU創業公司如云豹智能、星云智聯、云脈芯聯、中科馭數、大禹智芯、益思芯、芯啟源等。
一時間DPU市場異常火爆,當然,這是2020年的情況。
在2020年被英偉達CEO黃仁勛稱為“數據中心第三顆主力芯片”后,DPU就以驚人的速度崛起,成為整個行業甚至整個社會的關注重點。
幾年過去了,國內DPU的分布和格局怎么樣了呢?這篇文章就來簡單介紹梳理一下。
先簡單介紹一下DPU為什么出現,解決哪些問題。
DPU 處理器是一種低功耗、低成本的專用處理單元,處理數據的效率遠高于同類處理器,它出現的底層邏輯是為了提高CPU的處理效率,釋放CPU算力,同時為CPU和GPU提供基礎數據服務。
由于每個數據中心都具有不同的架構和要求,因此 DPU 必須是高度可編程的。所以在DPU技術路線上,有不同的選擇。DPU有ASIC、FPGA和SoC三種實現路徑,在成本、編程簡易性和靈活性方面各有利弊,目前DPU主流的市場方案包括以Arm核為主的架構、FPGA+CPU架構,以及SoC架構,前兩者已經在云計算廠商得到批量部署,整體看SoC方案則是今后的趨勢。
DPU需要分擔數據中心其他處理器的工作(可以是網絡卸載、計算卸載或數據服務卸載)來節省成本,尤其是降低進入數據中心的資本成本和降低數據中心的運營成本。
DPU的核心作用
DPU最直接的作用是作為CPU的卸載引擎,接管網絡虛擬化、硬件資源池化等基礎設施層服務,釋放CPU的算力到上層應用。
DPU可以成為新的數據網關,將安全隱私提升到一個新的高度。在網絡環境下,網絡接口是理想的隱私邊界,但是加密、解密算法開銷都很大,如果用CPU來處理,會消耗掉大量的CPU算力。而這些都可以通過將其固化在DPU中來實現。
DPU也可以成為存儲的入口,將分布式的存儲和遠程訪問本地化。隨著SSD性價比逐漸可接受,部分存儲遷移到SSD器件上已經成為可能,傳統的面向機械硬盤的SATA協議并不適用于SSD存儲,所以,將SSD通過本地PCIe或高速網絡接入系統就成為必選的技術路線。
NVMe(Non Volatile Memory Express)就是用于接入SSD存儲的高速接口標準協議,可以通過PCIe作為底層傳輸協議,將SSD的帶寬優勢充分發揮出來。同時,在分布式系統中,還可通過NVMe over Fabrics(NVMe-oF)協議擴展到InfiniBand、Ethernet、或Fibrechannel節點中,以RDMA的形式實現存儲的共享和遠程訪問。
這些新的協議處理都可以集成在DPU中以實現對CPU的透明處理。進而,DPU將可能承接各種互連協議控制器的角色,在靈活性和性能方面達到一個更優的平衡點。
隨著云平臺虛擬化技術的發展,智能網卡的發展基本可以分為三個階段
上面簡單介紹了DPU的發展背景和概念,下面看看一些在DPU上布局的公司和產品,不完全統計。
圖片來源(SDNLAB醬公眾號)
我們挑幾個熟悉的DPU公司進行簡單介紹
阿里:CIPU
2017年阿里云推出神龍架構,2022年又發布了全新的云數據中心專用處理器—CIPU,不同于傳統的以CPU為中心的架構設計,CIPU被定義為云計算的控制和核心性能加速中心。
CIPU向下云化管理數據中心硬件,加速計算、存儲和網絡資源;向上接入飛天云操作系統,將全球上百萬臺服務器變成一臺“超級計算機”。
總體來說,CIPU主要有兩大功能:一是具備對底層基礎設施資源的虛擬化管理能力,二是能承載飛天對這些資源的編排和調度需求,并具備計算、網絡、存儲、安全等硬件加速能力。
騰訊:水杉、銀衫
2020年9月,騰訊第一代基于FPGA的自研智能網卡正式上線,命名為“水杉”。水杉投入應用后,“銀杉”的研發工作也緊鑼密鼓地啟動,并于2021年10月正式上線,關于騰訊芯片的更多細節,我們在之前一篇文章有介紹過(騰訊芯片)。
2021 年 11 月,騰訊發布了“玄靈”智能網卡芯片,將原來運行在主CPU上的虛擬化、網絡/存儲IO等功能下移到DPU芯片,實現了主CPU的零占用,相比業界產品性能提升了4倍。
這一芯片的目標或許和云計算有關,更進一步或許和云游戲相關,游戲業務對騰訊至關重要,而云游戲則面向未來,通過玄靈智能網卡芯片,騰訊或將進一步完成其在云游戲領域的深入布局。
百度:太行DPU2.0
百度智能云對 DPU2.0的核心定位是“Cloud Native IO Engine”。解決在多租戶、細粒度算力形態、后端解耦的硬件資源池架構下,海量的 IO 數據搬移、通信、處理、安全等等問題。
百度太行 DPU2.0主要包含有軟件定義虛擬化,支持萬級虛擬設備;網絡硬件加速,由軟件轉發變成硬件轉發;高性能的 RDMA 網絡,用自研協議解決流控留空、擁塞等問題;存算分離硬件加速,通過超大資源池打平本地和遠程的區別;云管控硬件通道,保證各形態計算實例共池,實現熱遷移、熱升級、熱插拔等特性,支持千億級模型訓練等。
百度太行DPU大致發展路徑如下所示:
字節跳動:DPU
字節跳動擁有海量的數據,根據亞馬遜成功的案例來看,做DPU變得順理成章,為數據中心的網絡、存儲和計算加速,一方面對內業務提供硬件加速服務,另一方面通過火山引擎產品的方式對外服務。關于字節的DPU官方信息對外同步的比較少,感興趣的朋友可以私聊了解內部情況。
天翼云:紫金DPU 2.0
天翼云紫金DPU 2.0采用FPGA+SoC架構,依托于FPGA超高的性能和靈活的可編程特性,將數據面全卸載到FPGA,實現業務的直接硬件卸載加速,支持網絡虛擬化、存儲虛擬化、IO虛擬化、RDMA、高可用等關鍵技術。
天翼云紫金DPU主要為天翼云自身產品提供底層和技術支撐,通過彈性裸金屬、云主機、容器等產品進行整體售賣,目前已經在天翼云部分資源池推廣部署2000+臺服務器,后續將在整個云數據中心全面推廣部署。
新華三:赤霄
新華三自研的赤霄智能加速卡實現了網絡無損、存儲無損、計算無損和安全無損的全無損能力。
UIS赤霄智能加速架構的核心是實現了網絡加速和存儲加速。采用加速卡加速以后,在主機上僅需運行虛擬化平臺,承擔CPU、內存及少量外設的虛擬化,而網絡訪問,存儲訪問及存儲的處理邏輯全部下沉到加速卡上去處理。
DPU市場目前進入了深水區,考驗的就是各家商業落地和變現能力,互聯網企業在這方面有著天然的優勢,像亞馬遜、谷歌等就是典型的案例,由于篇幅原因,下一章會專門介紹國內專注做DPU的芯片設計公司,如云豹智能、星云智聯、云脈芯聯、中科馭數、大禹智芯、益思芯、芯啟源等
-
處理器
+關注
關注
68文章
19407瀏覽量
231186 -
網絡接口
+關注
關注
0文章
87瀏覽量
17291 -
DPU
+關注
關注
0文章
368瀏覽量
24258
原文標題:風靡一時的DPU市場,現在怎么樣了?(上)
文章出處:【微信號:IC學習,微信公眾號:IC學習】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論