以下文章來源于騰訊云 ,作者YHQ
![pYYBAGKsLLSAMsPKAACLVK9VbdA785.jpg](https://file.elecfans.com//web2/M00/4C/13/pYYBAGKsLLSAMsPKAACLVK9VbdA785.jpg)
事后想來,芯片驗(yàn)證工程師Lynda進(jìn)騰訊有點(diǎn)“草率”了。
“我們的仿真工具呢?”
“沒有,還在談。”
“驗(yàn)證環(huán)境怎么說?”
“還沒有。”
“那……驗(yàn)證流程呢?”
“也沒有。“
那是2019年1月。加入騰訊,Lynda正準(zhǔn)備擼起袖子,大干一場,卻劈面遭遇“一問三沒有”。
“我們是從零開始做芯片。”
面試時(shí),主導(dǎo)芯片設(shè)計(jì)工作的Henry給她打過心理預(yù)防針。
Lynda正好想?yún)⑴c芯片研發(fā)的全過程,倒不怕從頭開始。但她實(shí)在沒料到,連仿真工具、驗(yàn)證環(huán)境、驗(yàn)證流程這些必備品都能 “三無”。
眾所周知,芯片研發(fā)高門檻、高投入、高風(fēng)險(xiǎn),而驗(yàn)證工程師就是守門員。軟件開發(fā)尚可后期不斷改bug,芯片如果設(shè)計(jì)問題沒被前期驗(yàn)證發(fā)現(xiàn),一旦流片,只能淪為一塊“磚頭”。
因此,很多芯片公司對(duì)設(shè)計(jì)工程師與驗(yàn)證工程師的人員配比是1:3。而在蓬萊實(shí)驗(yàn)室,Lynda只有一個(gè)并肩作戰(zhàn)的驗(yàn)證同事,和一行代碼都沒有的驗(yàn)證條件。
這時(shí)候,Lynda才開始明白Henry口中的“從零開始”意味著什么,以及她面臨著怎樣一場艱難的戰(zhàn)役。
1
一個(gè)差點(diǎn)解體的團(tuán)隊(duì)
在騰訊云副總裁、云架構(gòu)平臺(tái)部總經(jīng)理謝明看來,芯片這場戰(zhàn)役,騰訊“蓄謀已久、勢在必行”。
這個(gè)團(tuán)隊(duì)肩負(fù)著QQ等國民級(jí)應(yīng)用的后臺(tái)架構(gòu),站在騰訊海量業(yè)務(wù)數(shù)據(jù)沖刷的前線,深刻地明白底層技術(shù)創(chuàng)新對(duì)上層應(yīng)用的放大價(jià)值。
2013年,QQ相冊(cè)已經(jīng)發(fā)展成騰訊最大的一個(gè)存儲(chǔ)類業(yè)務(wù)。
讓用戶訪問相冊(cè)的速度更快、體驗(yàn)更順滑,成了一個(gè)很急迫的需求。轉(zhuǎn)化成相應(yīng)的技術(shù)問題,就是圖片能否更快地轉(zhuǎn)碼?能否在不損畫質(zhì)的情況下壓縮?能否以更低的成本存儲(chǔ)?
他們反復(fù)地追問。
伴隨著軟件架構(gòu)上永無止盡的自我超越,團(tuán)隊(duì)敏銳地察覺到,只有在硬件上也作出創(chuàng)新,才能實(shí)現(xiàn)更深層次的突破。
一個(gè)做軟件出身的團(tuán)隊(duì),怎么去做硬件?
一圈研究之后,他們決定先拿FPGA(可編程陣列邏輯)試水。FPGA相比起芯片容錯(cuò)率高,但在吞吐率、延遲、功耗和靈活性等維度上都很平衡。尤其是在處理海量數(shù)據(jù)時(shí),F(xiàn)PGA相比GPU具有超低延時(shí)的顯著優(yōu)勢。
事實(shí)驗(yàn)證了這種判斷。2015年,團(tuán)隊(duì)集中力量研發(fā)的圖片編碼FPGA,取得了比CPU編碼和軟件編碼更高的壓縮率和更低的延時(shí),也幫助QQ相冊(cè)很大程度上降低了存儲(chǔ)成本。他們看到了在FPGA方向探索和深入的可能性。
2016年前后,由AlphaGo引爆的AI熱潮更把FPGA拉入了主流視野。團(tuán)隊(duì)通過FPGA對(duì)深度學(xué)習(xí)模型的CNN算法進(jìn)行加速后,處理性能達(dá)到通用CPU的4倍,而單位成本僅為1/3。
FPGA效果雖好,但技術(shù)門檻比較高,“如果把FPGA云化,是不是一個(gè)能夠擴(kuò)大應(yīng)用的解決路徑?”
帶著這樣的期待,2017年1月20日,騰訊云推出了國內(nèi)首款FPGA云服務(wù)器,希望以云計(jì)算的方式,將FPGA能力推廣到更多企業(yè)。
從效果上來說,在FPGA云服務(wù)器上進(jìn)行FPGA硬件編程的企業(yè),確實(shí)能將性能提升至通用CPU服務(wù)器的30倍以上,而只需支付相當(dāng)于通用CPU約40%的費(fèi)用。以一家著名的基因檢測公司為例,傳統(tǒng)用CPU需要檢測一周的基因序列,F(xiàn)PGA可以壓縮到數(shù)小時(shí)完成。
然而,殘酷的現(xiàn)實(shí)給團(tuán)隊(duì)從頭到腳澆了盆冷水,云化后的FPGA,沒能如預(yù)期般迅速席卷整個(gè)行業(yè)。
一方面,許多企業(yè)還是無法獨(dú)立勝任FPGA開發(fā),需要更加上層的服務(wù);另一方面,GPU成本的迅速下降,也給FPGA造成了巨大的沖擊。
云端商業(yè)化的受挫,把團(tuán)隊(duì)的熱情從巔峰一下子打到了谷底,同時(shí)也把一個(gè)問題赤裸裸地拋到整個(gè)團(tuán)隊(duì)的眼前:FPGA對(duì)業(yè)務(wù)的價(jià)值究竟有多大?FPGA還能繼續(xù)做嗎?
受此打擊,團(tuán)隊(duì)在2018年也近乎分崩離析,人員開始集中式地離開。
2
柳暗花明,“蓬萊”問世
時(shí)間進(jìn)入2019年。那是人工智能規(guī)模化應(yīng)用的元年,內(nèi)外部業(yè)務(wù)都提出了對(duì)AI芯片的強(qiáng)烈訴求。
在FPGA云服務(wù)器受挫后,騰訊需要重新思考硬件之路要怎么走下去。
AI芯片,要不要做?
這個(gè)問題被提出來的時(shí)候,管理層有過反對(duì)的聲音,擔(dān)心技術(shù)人員只是頭腦發(fā)熱,只是為了追逐熱點(diǎn),只是看似自信的盲目自負(fù),但也沒有明令禁止小團(tuán)隊(duì)的探索。
以小規(guī)模、低成本、特定應(yīng)用場景的方式先行試水,成了大家的共識(shí)。
云架構(gòu)平臺(tái)部將第一款芯片敲定AI推理方向,取名“蓬萊”,希望這款芯片能像中國古代神話里的海外仙山一樣,穩(wěn)固地立于洶涌波濤之上。
這支硬件突圍小分隊(duì),也被正式命名為“蓬萊實(shí)驗(yàn)室”。
![pYYBAGKsLLWAP3wMAABl_gJPFYA312.jpg](https://file.elecfans.com//web2/M00/4C/13/pYYBAGKsLLWAP3wMAABl_gJPFYA312.jpg)
經(jīng)歷過FPGA,蓬萊實(shí)驗(yàn)室對(duì)硬件編程語言已經(jīng)相當(dāng)熟練,也在標(biāo)準(zhǔn)接口、總線等方面積累了一些平臺(tái)化的設(shè)計(jì)。然而,兩者的研發(fā)要求,不可同日而語。
如果說做FPGA是搭現(xiàn)成的積木,那么做芯片就是直接從原木著手來制造積木。FPGA出了問題可以重新編程,而芯片只有一次流片機(jī)會(huì),一旦出錯(cuò),付諸東流。
此外, FPGA的資源是現(xiàn)成固定的,芯片的資源卻是由自己定義的。
一個(gè)字,就是要“摳”:用最小的資源做最大的事。
芯片架構(gòu)工程師Rick用“裝修”改“重建”來形容整個(gè)蓬萊項(xiàng)目。
一開始,團(tuán)隊(duì)以為能把之前FPGA的技術(shù)較為簡單地轉(zhuǎn)成芯片。做著做著發(fā)現(xiàn),以為終歸只是以為——FPGA架構(gòu)在芯片中能直接復(fù)用的并不多,團(tuán)隊(duì)只能把原來的架構(gòu)整個(gè)拆掉,重寫的代碼量高達(dá)85%。
像DDR存儲(chǔ)器這樣的重中之重,芯片廠商通常會(huì)有專門的驗(yàn)證人員負(fù)責(zé),而剛起步的蓬萊實(shí)驗(yàn)室沒這個(gè)條件,只能靠搶時(shí)間把功課補(bǔ)回來。
2020年1月,蓬萊芯片流片完成,被合作方快遞到深圳。新冠疫情剛剛在全國范圍內(nèi)暴發(fā),公司已經(jīng)開啟集體遠(yuǎn)程辦公。
![poYBAGKsLLWAaQknAACzcBtFli8121.jpg](https://file.elecfans.com//web2/M00/4B/77/poYBAGKsLLWAaQknAACzcBtFli8121.jpg)
● 流片完成的蓬萊芯片被快遞回深圳
Henry戴著手套取到快遞,用酒精仔細(xì)消毒后,帶到空空蕩蕩的辦公樓,大開著窗戶和風(fēng)扇,和幾個(gè)同事一起開始點(diǎn)亮操作。
所謂點(diǎn)亮,就是給芯片上電,首先看有沒有短路冒煙,接著就是測試一些基本功能。
是芯片還是“磚頭”,成敗在此一舉。
![pYYBAGKsLLaAA-PTAAFfHjZx1CU346.jpg](https://file.elecfans.com//web2/M00/4C/13/pYYBAGKsLLaAA-PTAAFfHjZx1CU346.jpg)
● 調(diào)試蓬萊芯片的時(shí)鐘
結(jié)果,芯片的時(shí)鐘頻率一直沒出來。要知道,時(shí)鐘頻率是芯片的“節(jié)拍器”,沒有時(shí)鐘頻率,芯片的不同模塊等于沒對(duì)好表,就無法協(xié)同工作。
是不是這塊芯片的問題?實(shí)驗(yàn)人員換了一塊芯片,依然沒有信號(hào)輸出。
再換一塊,還是沒有。
現(xiàn)場鴉雀無聲。實(shí)驗(yàn)人員已經(jīng)不敢動(dòng)手了。
有人忍不住開玩笑,是不是該回家改簡歷了?但大家心里更多的是疑惑:
雖然人少、資源少、白手起家,但蓬萊實(shí)驗(yàn)室從設(shè)計(jì)人員到驗(yàn)證人員,都有信心說,每一步都做好了。到底是哪里不對(duì)呢?
在無比凝重的氣氛中,放板、上電、讀取信號(hào)……
第四塊芯片,亮了。剩下的所有芯片,也都沒問題。
真相就是這么簡單。28納米工藝的芯片,不良率只有3%,偏偏隨機(jī)測試的前三片就全趕上了,讓他們把“生一胎”的緊張情緒體驗(yàn)到十足。
經(jīng)歷這名副其實(shí)的一波三折,騰訊第一款芯片,宣告問世。
3
更上一層,“紫霄”凌云
蓬萊芯片的實(shí)戰(zhàn)表現(xiàn)也不負(fù)眾望,助力騰訊推出中國第一臺(tái)獲準(zhǔn)進(jìn)入醫(yī)院臨床應(yīng)用的智能顯微鏡,實(shí)現(xiàn)自動(dòng)識(shí)別醫(yī)學(xué)圖像、統(tǒng)計(jì)細(xì)胞數(shù)目并直接顯示在視野上,性能表現(xiàn)完全符合設(shè)計(jì)要求。
![poYBAGKsLLaAdHI4AACKrKJDzkM426.jpg](https://file.elecfans.com//web2/M00/4B/78/poYBAGKsLLaAdHI4AACKrKJDzkM426.jpg)
● 蓬萊芯片在智能顯微鏡上調(diào)試
高效地造出直面應(yīng)用、性能卓越的芯片,這條路,騰訊走得通。
終端芯片蓬萊的問世,只是完成了從0到1的任務(wù)。團(tuán)隊(duì)已經(jīng)迫不及待的要從1到N,向著大規(guī)模云端芯片進(jìn)軍。
蓬萊實(shí)驗(yàn)室負(fù)責(zé)人Alex將大芯片申請(qǐng)立項(xiàng)戲稱為“A輪融資”。
初試鋒芒之后,團(tuán)隊(duì)需要向公司說明,為什么需要用更大的投入去做大規(guī)模芯片?在短期和長期能否保持領(lǐng)先性?如何與內(nèi)外部業(yè)務(wù)結(jié)合創(chuàng)造價(jià)值?
騰訊這次面臨的決策,要容易做得多。
蓬萊的成功給了足夠的信心和底氣。蓬萊實(shí)驗(yàn)室邊走路邊成長,完成了一次次蛻變,建立起完整、嚴(yán)謹(jǐn)、規(guī)范的芯片研發(fā)體系和流程。
這已經(jīng)是一支“正規(guī)軍”。
更重要的是,團(tuán)隊(duì)證明了騰訊做芯片的優(yōu)勢和站位。
謝明解釋說,從行業(yè)來看,做芯片除了要考慮技術(shù)和工藝,最大的難點(diǎn)在于對(duì)芯片的“定義”。傳統(tǒng)芯片廠商的優(yōu)勢在于前者,但芯片做出來之后再去匹配需求,在很多場景下真實(shí)性能是損失的。Google、騰訊這類科技企業(yè)的優(yōu)勢在于自身就是需求方,對(duì)需求的理解和洞察最深刻、最透徹。
方向沒有問題,技術(shù)和工藝也沒問題,騰訊高級(jí)執(zhí)行副總裁、TEG(技術(shù)工程事業(yè)部)總裁盧山給予了全面支持,并通過總辦爭取到了更多的headcount和資金。
有了公司戰(zhàn)略的支持,團(tuán)隊(duì)志氣昂揚(yáng)奔赴更大的戰(zhàn)場。蓬萊實(shí)驗(yàn)室副總監(jiān)Austin決定兵分兩路,在AI推理和視頻編解碼上并行推進(jìn)。
AI小分隊(duì)繼續(xù)做蓬萊的2.0版“紫霄”。這是《封神演義》里鴻鈞老祖所居宮殿的名字。在穩(wěn)固的仙山上牢筑“紫霄”,代表了新的野心:
這次,他們將目標(biāo)直接定為業(yè)界第一。
![pYYBAGKsLLaAavqkAABn0xYiBlc218.jpg](https://file.elecfans.com//web2/M00/4C/13/pYYBAGKsLLaAavqkAABn0xYiBlc218.jpg)
紫霄所有的架構(gòu)都圍繞著有效算力去做。團(tuán)隊(duì)優(yōu)化片上緩存設(shè)計(jì),并摒棄競品常用的GDDR6內(nèi)存,采用先進(jìn)的2.5D封裝技術(shù),把HBM2e內(nèi)存與AI芯片合封在一起,從而把內(nèi)存帶寬提升了近40%。
技術(shù)迭代一日千里。紫霄立項(xiàng)后,業(yè)內(nèi)最高性能表現(xiàn)又被競品刷新。雖然紫霄的設(shè)計(jì)性能相比這個(gè)最高表現(xiàn)還足夠“安全”,但團(tuán)隊(duì)還打算繼續(xù)加碼。
經(jīng)過研究,他們?cè)谛酒瑑?nèi)部增加了計(jì)算機(jī)視覺CV加速器以及視頻編解碼加速器,可創(chuàng)新性地大幅減小AI芯片和x86 CPU之間的交互和等待。
即便因此而增加了兩個(gè)復(fù)雜的自研模塊,團(tuán)隊(duì)仍然在計(jì)劃的6個(gè)月時(shí)間里完成了從架構(gòu)確定到驗(yàn)證以及流片的全部流程。
2021年9月10日,紫霄順利點(diǎn)亮。
![poYBAGKsLLaAXXvKAAC7UbwoB5M375.jpg](https://file.elecfans.com//web2/M00/4B/78/poYBAGKsLLaAXXvKAAC7UbwoB5M375.jpg)
在圖片和視頻處理、自然語言處理、搜索推薦等應(yīng)用場景下,這款芯片打破了制約算力發(fā)揮的瓶頸點(diǎn),最終在實(shí)際業(yè)務(wù)場景性能表現(xiàn)達(dá)到了業(yè)界標(biāo)品的2倍。
4
獨(dú)立自研,“滄海”一笑
2022年3月5日,Derick和他帶領(lǐng)的視頻編解碼小分隊(duì)收到流片回來的芯片“滄海”,又正逢深圳因疫情而全面遠(yuǎn)程辦公。
他們申請(qǐng)?zhí)嘏M(jìn)入空空蕩蕩的辦公樓。這情景,和兩年前點(diǎn)亮蓬萊時(shí)何其相似。
![pYYBAGKsLLeAHQa-AABko4608Zk349.jpg](https://file.elecfans.com//web2/M00/4C/13/pYYBAGKsLLeAHQa-AABko4608Zk349.jpg)
不曾想到,點(diǎn)亮蓬萊時(shí)的一波三折,同樣重現(xiàn)。克服了一些調(diào)試中的意外,在一片歡呼中,騰訊的第三款芯片、同時(shí)也是完全自主研發(fā)的第一款芯片滄海成功點(diǎn)亮。
從蓬萊到紫霄再到滄海,從28納米工藝到12納米工藝,從8個(gè)人發(fā)展到100多人,從仿真工具一無所有到“天箭驗(yàn)證平臺(tái)”正式落成,從努力跟上合作伙伴的節(jié)奏到獨(dú)立做完全SOC。
蓬萊實(shí)驗(yàn)室,完成了一場“芯”路進(jìn)化。
此外,在應(yīng)用方向上不同于蓬萊和紫霄主打AI,滄海是一款視頻轉(zhuǎn)碼芯片。
如果說QQ相冊(cè)圖片的轉(zhuǎn)碼問題是蓬萊實(shí)驗(yàn)室做硬件的最早契機(jī),那滄海問世,正是完成了一次對(duì)初心的呼應(yīng)。
多媒體業(yè)務(wù)從圖片時(shí)代進(jìn)化到音視頻直播時(shí)代,4K/8K超高清的數(shù)字內(nèi)容如潮水一般持續(xù)沖擊著云計(jì)算基礎(chǔ)設(shè)施。每增加一個(gè)比特的數(shù)據(jù),都會(huì)帶來相應(yīng)的轉(zhuǎn)碼算力和CDN帶寬成本。這是一道直觀而嚴(yán)峻的數(shù)學(xué)題。
滄海小分隊(duì)的目標(biāo)非常清晰,那就是要做一款業(yè)界最強(qiáng)的視頻轉(zhuǎn)碼芯片,把壓縮率發(fā)揮到極致。
好在,騰訊豐富的多媒體應(yīng)用場景,以及騰訊云覆蓋的眾多直播互動(dòng)頭部客戶,為滄海的研發(fā)提供了得天獨(dú)厚的分析和驗(yàn)證條件。
![poYBAGKsLLeAVb9wAACxA0Eqd_Y471.jpg](https://file.elecfans.com//web2/M00/4B/78/poYBAGKsLLeAVb9wAACxA0Eqd_Y471.jpg)
團(tuán)隊(duì)先是推出了滄海的核心自研模塊——硬件視頻編碼器“瑤池”,并決定在滄海完成研發(fā)之前給瑤池一次大考。
這個(gè)大考就是2020年的MSU世界編解碼大賽,由莫斯科國立大學(xué)(MSU)主辦,十多年來一直是全球視頻壓縮領(lǐng)域最具影響力的頂級(jí)賽事之一,吸引了包括英特爾、英偉達(dá)、谷歌、華為、阿里和騰訊在內(nèi)的國內(nèi)外知名科技企業(yè)參與。
結(jié)果是,瑤池實(shí)現(xiàn)1080P@60Hz的視頻實(shí)時(shí)編碼,力壓群雄獲得了SSIM (結(jié)構(gòu)相似性)、PSNR(峰值信噪比)和VMAF(視頻多方法評(píng)估融合)等各項(xiàng)客觀指標(biāo)評(píng)測第一名,以及人眼主觀評(píng)價(jià)第一的好成績,相比起第二名領(lǐng)先了一個(gè)身位。
經(jīng)此硬仗,滄海在技術(shù)上得到了充分檢閱。
化滄海為一粟。滄海最終實(shí)現(xiàn)以更小的數(shù)據(jù)量、更小的帶寬提供相同質(zhì)量的視頻,壓縮率相比行業(yè)最佳表現(xiàn)還提高了30%以上。
5
“100G”時(shí)代,雙木參天
在多媒體、AI處理積極求變的同時(shí),底層的云服務(wù)器也面臨著相似的問題:
當(dāng)軟件優(yōu)化帶來的性能提升無法讓產(chǎn)品擁有區(qū)別于競品的明顯競爭力時(shí),如何讓性能突破現(xiàn)有天花板?
騰訊的另一個(gè)部門,將目光投向了軟硬協(xié)同與硬件加速。
2019年,騰訊迎來云計(jì)算業(yè)務(wù)上的里程碑——云服務(wù)器規(guī)模突破了100萬。
騰訊云副總裁、騰訊網(wǎng)絡(luò)平臺(tái)部總經(jīng)理鄒賢能敏銳地觀察到,隨著服務(wù)器接入帶寬不斷提升,服務(wù)器用于網(wǎng)絡(luò)處理的CPU資源也越來越多。
能否以更低成本的方式來實(shí)現(xiàn)服務(wù)器網(wǎng)絡(luò)處理,同時(shí)還提供更高的網(wǎng)絡(luò)性能?
面對(duì)這樣“既要、又要”的挑戰(zhàn),鄒賢能決定給服務(wù)器做個(gè)減法:“把網(wǎng)絡(luò)數(shù)據(jù)處理的負(fù)擔(dān)從CPU卸載出來。”
“智能網(wǎng)卡”的想法就這樣誕生了。
![pYYBAGKsLLeAdmm8AACErebgp18164.jpg](https://file.elecfans.com//web2/M00/4C/13/pYYBAGKsLLeAdmm8AACErebgp18164.jpg)
● 騰訊智能網(wǎng)卡“銀杉”
所謂智能網(wǎng)卡,一方面像普通網(wǎng)卡一樣肩負(fù)起服務(wù)器的對(duì)外網(wǎng)絡(luò)訪問,實(shí)現(xiàn)不同服務(wù)器和數(shù)據(jù)中心之間的網(wǎng)絡(luò)互聯(lián)。另一方面,它額外帶有CPU/FPGA/內(nèi)存等智能單元,能分擔(dān)一部分服務(wù)器的虛擬化計(jì)算任務(wù),實(shí)現(xiàn)服務(wù)器整體網(wǎng)絡(luò)和存儲(chǔ)性能的加速。
換句話說,網(wǎng)絡(luò)平臺(tái)部要做的事,是要在網(wǎng)卡里新裝一個(gè)服務(wù)器。
一開始,團(tuán)隊(duì)希望找到一款現(xiàn)成的商用板卡來減少工作量。
網(wǎng)卡硬件負(fù)責(zé)人Hayden牽頭開展方案論證和調(diào)研,但商用芯片的加速引擎不支持私有協(xié)議成為當(dāng)時(shí)直面的第一大挑戰(zhàn),也是最大的障礙。一些著名的網(wǎng)卡設(shè)備商聽了騰訊的要求就搖頭:
“現(xiàn)在網(wǎng)卡的功能很簡單,你們這個(gè)要求太復(fù)雜了,很難實(shí)現(xiàn)的。”
還有些直白地質(zhì)疑:“網(wǎng)卡數(shù)量這么多,可靠性要求高,你們自己搞得定嗎?”
難道智能網(wǎng)卡項(xiàng)目剛起步就要流產(chǎn)?
鄒賢能給團(tuán)隊(duì)指明了方向:“既然智能網(wǎng)卡是云數(shù)據(jù)中心追求極致性能與成本的關(guān)鍵部件,如果市面上沒有滿足騰訊需求的產(chǎn)品,那我們就自己造一個(gè)。”
方向明確之后,路線也很快清晰起來:先從基于FPGA自研智能網(wǎng)卡起步,再開展智能網(wǎng)卡芯片研發(fā)。
2020年9月,騰訊第一代基于FPGA的自研智能網(wǎng)卡正式上線,命名為“水杉”,寄寓著團(tuán)隊(duì)希望產(chǎn)品可以像這種珍稀喬木一樣適應(yīng)性強(qiáng)、快速生長。
疫情期間各種突發(fā)需求砸來,初生的水杉沒有被挑戰(zhàn)壓彎。
Hayden回憶道,一個(gè)大客戶本身采用了UDP音視頻協(xié)議,在屬性上是“不可靠”、允許丟包的,極大地依賴網(wǎng)絡(luò)吞吐和穩(wěn)定性,卻要求高并發(fā)、高質(zhì)量的音視頻傳輸效果。
水杉智能網(wǎng)卡迎難而上,通過大幅提升服務(wù)器的網(wǎng)絡(luò)性能,幫助該客戶完成了24小時(shí)零丟包的極限壓力測試,穩(wěn)定上線運(yùn)行,交出了一份漂亮的答卷。
水杉投入應(yīng)用后,第二代智能網(wǎng)卡“銀杉”的研發(fā)工作也緊鑼密鼓地啟動(dòng),并于2021年10月正式上線。這一代智能網(wǎng)卡的網(wǎng)絡(luò)端口翻了一番,達(dá)到了2*100G。
在又一棵參天大樹的支撐下,騰訊云對(duì)外推出了業(yè)界首款自研第六代100G云服務(wù)器。
它的計(jì)算性能提升最大220%、存儲(chǔ)性能最大提升100%。單節(jié)點(diǎn)接入網(wǎng)絡(luò)帶寬相比上一代最大提升4倍,延時(shí)下降50%。
![poYBAGKsLLiABnz4AADClz2Z3po482.jpg](https://file.elecfans.com//web2/M00/4B/78/poYBAGKsLLiABnz4AADClz2Z3po482.jpg)
● “銀杉”搭載在自研100G云服務(wù)器上
“兩棵樹”在網(wǎng)絡(luò)硬件卸載上取得的巨大收益,令團(tuán)隊(duì)興奮不已。
當(dāng)FPGA路線逐漸逼近性能和功耗的瓶頸,網(wǎng)絡(luò)平臺(tái)部決定再一次把主動(dòng)權(quán)掌握在自己手里。
6
“玄靈”乍現(xiàn),芯事未完
騰訊的第四款芯片,也是首款智能網(wǎng)卡芯片應(yīng)運(yùn)而生。
它也有一個(gè) “仙氣十足”的名字——“玄靈”, 按照計(jì)劃,這款7納米工藝的芯片將在2022年底流片。
Hayden受命快速組建起了玄靈芯片研發(fā)團(tuán)隊(duì),不斷挑戰(zhàn)多個(gè)“mission impossible”。
從性能指標(biāo)來看,玄靈支持設(shè)備數(shù)量將提升到10K以上,相對(duì)商業(yè)芯片提升6倍。同時(shí),它的性能相對(duì)商業(yè)芯片也可提升4倍,通過將原來運(yùn)行在主機(jī)CPU上的虛擬化、網(wǎng)絡(luò)/存儲(chǔ)IO等功能卸載到芯片,可實(shí)現(xiàn)主機(jī)CPU的0占用。
這顆短小精悍的芯片,充分詮釋了面向未來極致性能的“玄”,與面向各類業(yè)務(wù)需求靈活加速的“靈”。
目前,玄靈項(xiàng)目正在緊鑼密鼓地進(jìn)行智能網(wǎng)卡流片前的驗(yàn)證和測試,打造騰訊云下一代高性能網(wǎng)絡(luò)基礎(chǔ)設(shè)施;
蓬萊實(shí)驗(yàn)室的AI推理芯片紫霄和視頻轉(zhuǎn)碼芯片滄海則將量產(chǎn),與騰訊業(yè)務(wù)深度融合應(yīng)用;
還有一些新的芯片項(xiàng)目也在醞釀成長,繼續(xù)探索有需要的技術(shù)方向,豐富這一本“山海經(jīng)”。
騰訊海量業(yè)務(wù)面臨的全新挑戰(zhàn),以及云計(jì)算高速發(fā)展的必然要求,“倒逼”騰訊走上了這條造芯之路。這些從業(yè)務(wù)需求出發(fā)的芯片,必定會(huì)深入現(xiàn)實(shí)應(yīng)用來證明自身的價(jià)值。
“我們不是無中生有、拍腦袋要去做芯片。我們一開始就知道,騰訊的需求足夠大,足夠我們?nèi)プ鲞@件事。”盧山說道。
從2010年起,騰訊就開始以云服務(wù)的方式對(duì)外開放自身的數(shù)字技術(shù)與連接能力,奔赴這場產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型升級(jí)的時(shí)代大潮。躬身入局,騰訊看到深度的數(shù)實(shí)融合正在引領(lǐng)全真互聯(lián)的技術(shù)趨勢。
騰訊的芯事,最終將在數(shù)實(shí)融合的星辰大海中得到回響。
審核編輯:符乾江
-
芯片
+關(guān)注
關(guān)注
456文章
51192瀏覽量
427301 -
騰訊
+關(guān)注
關(guān)注
7文章
1666瀏覽量
49605
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
蘋芯出席2024中國AI芯片開發(fā)者論壇
![蘋<b class='flag-5'>芯</b>出席2024中國<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>開發(fā)者論壇](https://file1.elecfans.com/web3/M00/02/DE/wKgZPGdibiyAVc-kAAAZpDXZYJQ526.png)
騰訊AI助手“元寶”團(tuán)隊(duì)調(diào)整至CSIG
聚焦AI芯片,角逐芯未來
騰訊申請(qǐng)注冊(cè)“騰訊云AI代碼助手”商標(biāo)
蘋芯科技亮相2024中國AI芯片開發(fā)者論壇
MediaTek天璣移動(dòng)平臺(tái)賦能騰訊會(huì)議端側(cè)AI人像分割模型
賽昉聯(lián)合國芯推出高性能AI MCU芯片,實(shí)現(xiàn)RISC-V+AI新應(yīng)用
![賽昉聯(lián)合國<b class='flag-5'>芯</b>推出高性能<b class='flag-5'>AI</b> MCU<b class='flag-5'>芯片</b>,實(shí)現(xiàn)RISC-V+<b class='flag-5'>AI</b>新應(yīng)用](https://file.elecfans.com/web2/M00/1A/02/poYBAGF47iiANcvqAABSphpOXQU436.jpg)
國芯科技:高性能AI MCU芯片CCR7002內(nèi)部測試成功
炬芯科技發(fā)布全新端側(cè)AI音頻芯片
騰訊申請(qǐng)注冊(cè)多枚“騰訊AI助手”商標(biāo)
騰訊云與芯動(dòng)科技推出聯(lián)合解決方案,推動(dòng)芯片行業(yè)創(chuàng)新發(fā)展
![<b class='flag-5'>騰訊</b>云與<b class='flag-5'>芯</b>動(dòng)科技推出聯(lián)合解決方案,推動(dòng)<b class='flag-5'>芯片</b>行業(yè)創(chuàng)新<b class='flag-5'>發(fā)展</b>](https://file1.elecfans.com//web2/M00/05/BA/wKgZombeYy6AGeF1AAPX2r1Vl-A883.jpg)
獲50家芯片企業(yè)合作!加碼芯片賽道,騰訊云靠什么?
![獲50家<b class='flag-5'>芯片</b>企業(yè)合作!加碼<b class='flag-5'>芯片</b>賽道,<b class='flag-5'>騰訊</b>云靠什么?](https://file1.elecfans.com/web2/M00/05/14/wKgaombL62GAeoDtAAvL6hPzpfg232.png)
“從此芯出發(fā)” 此芯科技發(fā)布AI PC戰(zhàn)略暨首款芯片
![“從此<b class='flag-5'>芯</b>出發(fā)” 此<b class='flag-5'>芯</b>科技發(fā)布<b class='flag-5'>AI</b> PC戰(zhàn)略暨首款<b class='flag-5'>芯片</b>](https://file1.elecfans.com/web2/M00/FF/98/wKgZomapnw2AEYh1AA9eDua79bY614.png)
![](https://file1.elecfans.com/web2/M00/EB/91/wKgaomZZjwCAN_uBAAymuuihSJQ815.png)
![](https://file1.elecfans.com/web2/M00/C0/62/wKgZomXVXYSAHbEsAAX04wEIvxA868.png)
評(píng)論