那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

昆侖芯率先完成Deepseek訓(xùn)練推理全版本適配

昆侖芯科技 ? 來源:昆侖芯科技 ? 2025-02-06 15:13 ? 次閱讀

編者按:本文是昆侖芯適配DeepSeek系列推文第一篇,將于近期分別推出在昆侖芯P800上進(jìn)行DeepSeek-V3/R1推理、訓(xùn)練的深度文章,干貨滿滿、持續(xù)關(guān)注!

短短兩周,DeepSeek成為全球增速最快的AI應(yīng)用。憑借卓越的性能和廣泛的應(yīng)用場(chǎng)景,這匹大模型黑馬已然成為行業(yè)標(biāo)桿,為千行百業(yè)提供了AI解決方案新選擇。 蛇年開工當(dāng)天,昆侖芯新一代產(chǎn)品P800萬(wàn)卡集群點(diǎn)亮的消息引發(fā)關(guān)注,三萬(wàn)卡集群也將于近日點(diǎn)亮,為國(guó)產(chǎn)AI算力注入強(qiáng)大勢(shì)能。

昆侖芯在大模型時(shí)代爆發(fā)出卓越的競(jìng)爭(zhēng)力,而這正是基于十余年真實(shí)業(yè)務(wù)場(chǎng)景歷練以及獨(dú)特的自研優(yōu)勢(shì)。作為國(guó)產(chǎn)AI芯片引領(lǐng)者,昆侖芯已完成Deepseek訓(xùn)練推理全版本適配,且性能卓越、成本效率極致,一鍵部署,為廣大開發(fā)者提供更快、更強(qiáng)、更省的訓(xùn)推體驗(yàn)。

全版本: 率先完成訓(xùn)練推理DeepSeek全版本適配

在模型適配方面,昆侖芯領(lǐng)先業(yè)界。在DeepSeek-V3/R1上線不久,昆侖芯便率先完成全版本模型適配,這其中包括DeepSeek MoE 模型及其蒸餾的Llama/Qwen等小規(guī)模dense模型(詳見下方海報(bào))。

同時(shí),昆侖芯也已全面適配文心系列、Llama、Qwen、ChatGLM、Baichuan等各類大模型的推理和訓(xùn)練任務(wù),性能優(yōu)勢(shì)明顯。在各個(gè)行業(yè)客戶、合作伙伴的業(yè)務(wù)場(chǎng)景中,昆侖芯已實(shí)際上線運(yùn)行各類大模型任務(wù);通過千卡和萬(wàn)卡集群為客戶提供了穩(wěn)定的服務(wù)和優(yōu)秀的性能表現(xiàn)。

性能卓越: 前瞻產(chǎn)品定義、極致成本效率

得益于昆侖芯前瞻的產(chǎn)品定義,昆侖芯產(chǎn)品性能表現(xiàn)卓越,成本優(yōu)勢(shì)領(lǐng)先。 昆侖芯P800可以較好的支撐Deepseek系列MoE模型大規(guī)模訓(xùn)練任務(wù),全面支持MLA、多專家并行等特性,僅需32臺(tái)即可支持模型全參訓(xùn)練,高效完成模型持續(xù)訓(xùn)練和微調(diào)。 P800顯存規(guī)格優(yōu)于同類主流GPU20%-50%,對(duì)MoE架構(gòu)更加友好,且率先支持8bit推理,單機(jī)8卡即可運(yùn)行 671B 模型。正因如此,昆侖芯相較同類產(chǎn)品更加易于部署,同時(shí)可顯著降低運(yùn)行成本,輕松完成DeepSeek-V3/R1全版本推理任務(wù)。

開發(fā)者友好:

一鍵部署、即刻上線

P800生態(tài)完備,易用性強(qiáng),可以實(shí)現(xiàn)對(duì)訓(xùn)練和推理任務(wù)的快速適配。P800快速適配支持了Deepseek-V3/R1的持續(xù)全參數(shù)訓(xùn)練,LoRA等PEFT能力,提供給用戶開箱即用的訓(xùn)練體驗(yàn)。基于昆侖芯完整的軟件生態(tài)棧,兩個(gè)步驟即可輕松實(shí)現(xiàn)在昆侖芯P800上進(jìn)行DeepSeek-V3/R1推理部署,對(duì)廣大開發(fā)者十分友好。

歡迎體驗(yàn): 兩步完成DeepSeek-V3/R1模型推理部署

1 .資源準(zhǔn)備

主要是鏡像和模型,鏡像提供完整的依賴環(huán)境開箱即用。

模型準(zhǔn)備

昆侖芯P800支持8bit推理,下載官方權(quán)重后使用如下命令進(jìn)行量化(后文附有下載方式);其他不同尺寸蒸餾模型則通過huggingface下載即可。

67da842e-e453-11ef-9310-92fbcf53809c.png

鏡像準(zhǔn)備(后文附有下載方式)

2 .啟動(dòng)服務(wù)&請(qǐng)求示例

server和client使用方式和vllm社區(qū)基本一致,零成本上手,如下:

啟動(dòng)服務(wù)

鏡像中一鍵啟動(dòng),采樣和推理參數(shù)可根據(jù)實(shí)際業(yè)務(wù)場(chǎng)景在腳本中配置。

67f03d8c-e453-11ef-9310-92fbcf53809c.jpg

請(qǐng)求示例

下圖為一個(gè)簡(jiǎn)單的請(qǐng)求示例:

680358a4-e453-11ef-9310-92fbcf53809c.jpg

關(guān)于昆侖芯科技

昆侖芯科技前身為百度智能芯片及架構(gòu)部,在實(shí)際業(yè)務(wù)場(chǎng)景中深耕AI加速領(lǐng)域十余年,2021年4月完成獨(dú)立融資。秉承著“讓計(jì)算更智能”的使命,昆侖芯科技專注打造擁有強(qiáng)大通用性、易用性和高性能的通用AI芯片,并已實(shí)現(xiàn)數(shù)代芯片系列產(chǎn)品的量產(chǎn)及規(guī)模部署。新一代產(chǎn)品昆侖芯P800萬(wàn)卡集群已成功點(diǎn)亮,將進(jìn)一步點(diǎn)亮3萬(wàn)卡集群。

大模型時(shí)代,昆侖芯科技已與智能產(chǎn)業(yè)的上下游企業(yè)建立良好的合作生態(tài),通過向不同行業(yè)提供以AI芯片為基礎(chǔ)的智能算力,在互聯(lián)網(wǎng)、交通、金融、工業(yè)、教育等領(lǐng)域中廣泛部署應(yīng)用,促進(jìn)了千行百業(yè)的智能化轉(zhuǎn)型,并創(chuàng)造了巨大的產(chǎn)業(yè)和社會(huì)價(jià)值。

*本文借助DeepSeek生成

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    456

    文章

    51190

    瀏覽量

    427293
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31535

    瀏覽量

    270343
  • 昆侖芯科技
    +關(guān)注

    關(guān)注

    0

    文章

    29

    瀏覽量

    650
  • DeepSeek
    +關(guān)注

    關(guān)注

    0

    文章

    43

    瀏覽量

    11

原文標(biāo)題:首發(fā) | 昆侖芯 | 國(guó)產(chǎn)AI卡Deepseek訓(xùn)練推理全版本適配、性能卓越,一鍵部署等您來(附文檔下載方式)

文章出處:【微信號(hào):昆侖芯科技,微信公眾號(hào):昆侖芯科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    靈汐KA200芯片完成DeepSeek-R1系列模型適配

    節(jié)后開工第一天,靈汐科技團(tuán)隊(duì)聯(lián)合類腦技術(shù)社區(qū)(“腦啟社區(qū)“)的開發(fā)者,僅用半天時(shí)間就完成DeepSeek-R1系列模型在靈汐KA200芯片及相關(guān)智算卡的適配,助力國(guó)產(chǎn)大模型與類腦智能硬件系統(tǒng)的深度
    的頭像 發(fā)表于 02-06 15:40 ?35次閱讀

    首發(fā) | 昆侖 | 國(guó)產(chǎn)AI卡Deepseek訓(xùn)練推理版本適配、性能卓越,一鍵部署等您來(附文檔下載方式)

    編者按:本文是昆侖適配DeepSeek系列推文第一篇,將于近期分別推出在昆侖P800上進(jìn)行
    發(fā)表于 02-06 15:28 ?45次閱讀
    首發(fā) | <b class='flag-5'>昆侖</b><b class='flag-5'>芯</b> | 國(guó)產(chǎn)AI卡<b class='flag-5'>Deepseek</b><b class='flag-5'>訓(xùn)練</b><b class='flag-5'>推理</b><b class='flag-5'>全</b><b class='flag-5'>版本</b><b class='flag-5'>適配</b>、性能卓越,一鍵部署等您來(附文檔下載方式)

    摩爾線程宣布成功部署DeepSeek蒸餾模型推理服務(wù)

    近日,摩爾線程智能科技(北京)有限責(zé)任公司在其官方渠道發(fā)布了一則重要消息,宣布公司已經(jīng)成功實(shí)現(xiàn)了對(duì)DeepSeek蒸餾模型推理服務(wù)的部署。這一技術(shù)突破,標(biāo)志著摩爾線程在人工智能領(lǐng)域邁出了堅(jiān)實(shí)的一步
    的頭像 發(fā)表于 02-06 13:49 ?71次閱讀

    燧原科技完成DeepSeek量模型高效適配

    DeepSeek-R1和V3為代表的開源模型系列在多語(yǔ)言理解和復(fù)雜推理任務(wù)中表現(xiàn)出色,極大優(yōu)化了算力成本,并進(jìn)一步改變了訓(xùn)練和部署的算法結(jié)構(gòu),這一技術(shù)創(chuàng)新將快速提升對(duì)于推理算力的需求
    的頭像 發(fā)表于 02-06 10:46 ?99次閱讀

    云天勵(lì)飛上線DeepSeek R1系列模型

    -R1-Distill-Llama-70B大模型、DeepSeek V3/R1 671B MoE大模型也在有序適配中。適配完成后,DeepEdge10芯片平臺(tái)將在端、邊、云全面支持
    的頭像 發(fā)表于 02-06 10:39 ?81次閱讀
    云天勵(lì)飛上線<b class='flag-5'>DeepSeek</b> R1系列模型

    聯(lián)通云與DeepSeek實(shí)現(xiàn)深度對(duì)接

    中國(guó)聯(lián)通近日宣布了一項(xiàng)重要進(jìn)展,其聯(lián)通云已經(jīng)成功基于星羅平臺(tái)實(shí)現(xiàn)了國(guó)產(chǎn)及主流算力對(duì)多規(guī)格DeepSeek-R1模型的適配。這一舉措不僅兼顧了私有化和公有化場(chǎng)景,更為用戶提供了全方位的運(yùn)行服務(wù)保障
    的頭像 發(fā)表于 02-06 09:58 ?118次閱讀

    深度解析deepseek開源是什么意思

    Deepseek開源是指Deepseek項(xiàng)目的源代碼被公開,允許任何人免費(fèi)查看、使用、修改和分發(fā)。
    的頭像 發(fā)表于 02-06 09:29 ?67次閱讀

    昆侖P800萬(wàn)卡集群成功點(diǎn)亮,將進(jìn)一步點(diǎn)亮3萬(wàn)卡集群

    的。而24年9月升級(jí)的百度百舸AI異構(gòu)計(jì)算平臺(tái)4.0,圍繞落地大模型旅程的算力需求,在集群創(chuàng)建、開發(fā)實(shí)驗(yàn)、模型訓(xùn)練、模型推理四大方面,能為企業(yè)提供“多、快、穩(wěn)、省”的AI基礎(chǔ)設(shè)施,在萬(wàn)卡集群的建設(shè)中發(fā)揮了至關(guān)重要的作用。
    發(fā)表于 02-05 17:58 ?60次閱讀
    <b class='flag-5'>昆侖</b><b class='flag-5'>芯</b>P800萬(wàn)卡集群成功點(diǎn)亮,將進(jìn)一步點(diǎn)亮3萬(wàn)卡集群

    對(duì)標(biāo)OpenAI o1,DeepSeek-R1發(fā)布

    DeepSeek-R1 在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,性能比肩 OpenAI o1 正
    的頭像 發(fā)表于 01-22 13:46 ?404次閱讀
    對(duì)標(biāo)OpenAI o1,<b class='flag-5'>DeepSeek</b>-R1發(fā)布

    昆侖科技一行到訪京能集團(tuán)

    近日,昆侖CEO歐陽(yáng)劍、副總裁孫孝思一行到訪京能集團(tuán),與京能集團(tuán)黨委書記、董事長(zhǎng)郭明星,副總經(jīng)理陳國(guó)高、張鳳陽(yáng)會(huì)面并開展座談。圍繞推動(dòng)科技創(chuàng)新、發(fā)展新質(zhì)生產(chǎn)力等領(lǐng)域的業(yè)務(wù)合作,昆侖
    的頭像 發(fā)表于 01-14 10:50 ?261次閱讀

    采用FP8混合精度,DeepSeek V3訓(xùn)練成本僅557.6萬(wàn)美元!

    的模型需要花費(fèi)約4684.8萬(wàn)美元。然而,隨著技術(shù)的進(jìn)步,這一成本正在迅速降低。DeepSeek V3的出現(xiàn),標(biāo)志著訓(xùn)練成本的大幅下降,其訓(xùn)練成本僅為557.6萬(wàn)美元,相較于之前的模型,成本下降了11倍。 二,
    的頭像 發(fā)表于 01-13 11:12 ?357次閱讀

    摩爾線程攜手東華軟件完成AI大模型推理測(cè)試與適配

    近日,摩爾線程與東華軟件云筑AI創(chuàng)新中心宣布,雙方已完成大模型推理測(cè)試與適配。依托摩爾線程的全功能GPU國(guó)產(chǎn)算力,東華軟件打造安全可信的基于私有化大模型的“智多型(A.I.Cogniflex)”AI
    的頭像 發(fā)表于 07-31 10:51 ?834次閱讀

    摩爾線程和滴普科技完成大模型訓(xùn)練推理適配

    近日,摩爾線程與滴普科技宣布了一項(xiàng)重要合作成果。摩爾線程的夸娥(KUAE)千卡智算集群與滴普科技的企業(yè)大模型Deepexi已完成訓(xùn)練推理適配,共同實(shí)現(xiàn)了700億參數(shù)LLaMA2大語(yǔ)言
    的頭像 發(fā)表于 05-30 10:14 ?607次閱讀

    摩爾線程千卡智算集群與滴普企業(yè)大模型已完成訓(xùn)練推理適配

    近日,摩爾線程與國(guó)內(nèi)領(lǐng)先的數(shù)據(jù)智能服務(wù)商滴普科技共同宣布,摩爾線程夸娥(KUAE)千卡智算集群與滴普企業(yè)大模型Deepexi已完成訓(xùn)練推理適配
    的頭像 發(fā)表于 05-29 10:28 ?519次閱讀
    摩爾線程千卡智算集群與滴普企業(yè)大模型已<b class='flag-5'>完成</b><b class='flag-5'>訓(xùn)練</b>及<b class='flag-5'>推理</b><b class='flag-5'>適配</b>

    vivo首批適配Android 15 Beta版本操作系統(tǒng)

    vivo 日前宣布,其智能手機(jī) X100 和 iQOO 12 將作為首批適配 Android 15 Beta 版本操作系統(tǒng)的機(jī)型,于部分國(guó)家和地區(qū)率先推出。
    的頭像 發(fā)表于 05-20 14:27 ?1372次閱讀
    大发888下载| 博彩百家乐软件| 白菜娱乐城| 百家乐论坛博彩拉| 百家乐官网注册送10彩金| 威尼斯人娱乐场积分| 金博士百家乐官网的玩法技巧和规则| 体球网足球即时比分| 百家乐输钱的原因| 银泰百家乐官网龙虎斗| 大发888官方备用网址| 宾利百家乐游戏| 百家乐官网体育直播| 大三元百家乐的玩法技巧和规则 | 全讯网hg7758.com| 百家乐官网合作| 百家乐官网销售视频| 利来百家乐的玩法技巧和规则| 百家乐官网博娱乐网赌百家乐官网的玩法技巧和规则 | 百家乐官网1326投注| 大发888娱乐城大发888大发网| 寅午戌 24山图| 百家乐官网怎么赢9| 老虎机加分器| 百家乐经验博彩正网| ea百家乐官网打水| 赌博游戏网站| 百家乐网上赌有作假吗| 金银岛百家乐官网的玩法技巧和规则 | 大发888zhldu| 百家乐平技巧| 唐朝百家乐官网的玩法技巧和规则| 永清县| 大发888熊之舞怎么玩| 赌博百家乐技巧| 大都会百家乐官网的玩法技巧和规则 | 澳门百家乐庄闲的玩法| 百家乐官网家居 | 澳门百家乐官网娱乐城怎么样| 篮球比分直播| 威尼斯人娱乐平台注册网址|