那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

昆侖芯重磅打造xHuggingface開源推理套件

昆侖芯科技 ? 來源:昆侖芯科技 ? 2023-07-23 09:42 ? 次閱讀

新一輪人工智能熱潮下,國內大模型群雄逐鹿,目前已有超過80個大模型公開測試。而相關數據顯示,ChatGPT自發布以來,全球訪問量環比增幅持續下降,6月首次出現環比下滑9.7%。泡沫退去,如何在大模型時代保持市場競爭力?

針對大模型場景,昆侖芯早已在產品定義上作出布局,相較第一代產品,昆侖芯2代AI芯片可大幅優化算力、互聯和高性能,而在研的下一代產品則將提供更佳的性能體驗。

在近日落幕的XceedCon2023人工智能芯片生態大會上,昆侖芯大模型端到端解決方案正式發布,該解決方案隨即入選2023世界人工智能大會卓越人工智能引領者獎(Super AI Leader,簡稱SAIL獎)TOP30榜單。

昆侖芯副總裁王勇、昆侖芯互聯網行業總經理王志鵬先后在XceedCon2023人工智能芯片生態大會、2023世界人工智能大會對昆侖芯大模型端到端解決方案進行發布與推介。本篇以下內容整理自現場實錄。

軟硬協同、技術創新

打造高性能產品矩陣

集十余年AI加速領域研發積累,昆侖芯核心團隊于2017年在Hot Chips上發布自研、面向通用人工智能計算的芯片核心架構——昆侖芯XPU。目前,已有兩代昆侖芯AI芯片基于該架構實現量產和規模部署。

昆侖芯XPU專為密集型計算而設計,相比GPU可提供更多AI加速單元,同時支持C/C++、類CUDA語法編程,兼具高性能和可編程性,適配幾乎所有主流AI場景,滿足不同行業的大模型訓推需求。

大模型的演進必將伴隨參數量的增加,更加依賴于分布式訓練與推理能力。昆侖芯2代系列產品搭載新一代核心架構XPU-R,性能相較一代提升2-3倍,在分布式場景中優勢明顯。

01.

大顯存

昆侖芯2代產品擁有32GB顯存容量,在同價位產品中內存優勢突出。

02.

高互聯

昆侖芯通過領先技術,可實現單機八卡高速互聯,帶寬達到200GB/s;支持Direct RDMA,可實現跨機間低延時、高速通訊。

昆侖芯推出針對不同參數級別的大模型產品矩陣,兼具顯存和算力成本優勢。

昆侖芯AI加速卡R200-8F面向百億以內參數量級,相比同類型產品性能提升20%;

昆侖芯AI加速器組R480-X8面向百億至千億參數量級,性能達到同類型產品的1.3倍以上;

昆侖芯AI加速器組R480-X8集群針對千億以上參數量級,可實現多機多卡分布式推理。

昆侖芯大模型解決方案軟件棧

軟件生態層面,昆侖芯提供了針對大模型場景的專用加速庫、豐富的云原生插件,支持文心一言、LLaMA、Bloom、ChatGLM、GPT等行業主流大模型。

昆侖芯XFT(XPU Fast Transformer)推理加速庫,較原生框架小算子版本性能提升5倍以上。目前,XFT加速庫已與百度飛槳、PyTorch等主流深度學習框架完成適配;

昆侖芯云原生插件可幫助用戶快速完成和大模型平臺的適配;同時提供昆侖芯SDK,幫助用戶快速完成適配和實時自定義開發。

昆侖芯xHuggingface開源推理套件

此外,昆侖芯全面擁抱開源社區,積極攜手生態伙伴構建軟硬一體的AI芯片生態。

昆侖芯打造了xHuggingface開源推理套件,僅修改1-2行代碼,即可快速搭建基于XPU的智能客服APP。同時,昆侖芯與飛槳PaddlePaddle的AI Studio社區緊密合作,基于xHuggingface開源推理套件向廣大開發者提供更快、更強、更省的算力產品;

昆侖芯與飛槳深入協同適配行業主流大模型,可支持超大規模分布式訓練與推理。針對稠密大模型,昆侖芯支持飛槳的Sharding并行、數據并行、模型并行、流水線并行四種并行方式;針對稀疏大模型,昆侖芯與飛槳共同打造大規模參數服務器架構,實現了萬億參數的大模型訓練。

深入場景、真實歷練

打磨端到端解決方案

昆侖芯深入了解不同應用場景下客戶的真實需求,憑借軟硬協同技術與高性能產品矩陣,為千行百業提供開箱即用的產品和全棧式AI服務。

大語言模型場景

昆侖芯推理加速方案

目前,昆侖芯已與業界主流開源大模型完成適配,向客戶開放開源軟件庫,供客戶進行二次修改、微調,滿足不同推理場景下的個性化定制需求。

GPT百億參數大模型場景:昆侖芯產品的QPS相比主流165W產品提高30%以上,同時首字時延更低。

文心一格:目前已大規模應用昆侖芯產品,成本降低的同時,可實現2秒快速出圖。

昆侖芯訓練產品總覽

針對大語言模型訓練場景,昆侖芯也可提供一整套精調的訓練策略。目前,昆侖芯已適配pretrain、post-pretrain、SFT、LoRA等模型,可根據客戶的數據量與計算資源情況,靈活推薦不同的訓練模式。

能源行業:昆侖芯解決方案通過SFT訓練模式,客戶僅使用少量數據即可2天打造專屬行業大模型。

智源研究院:昆侖芯和智源研究院在大模型方面已有深入合作。昆侖芯已完成和Aquila大語言模型推理任務的適配、精度調試和性能優化,并實現大規模分布式推理上線,訓練任務適配優化中;同時也適配了智源eva視覺大模型,初步驗證了大規模分布式預訓練能力。

稀疏大模型推薦場景

稀疏大模型存在訓練門檻高、算力消耗大等技術挑戰。對于算法和模型持續高頻迭代的推薦場景,昆侖芯始終將“安全可信”、“從GPU零成本無縫遷移”作為目標,實現訓練與推理系統的緊密耦合,為客戶降本增效。目前,昆侖芯已與互聯網頭部客戶完成了訓練場景的端到端聯合開發,并在TB級以上稀疏大模型上完成了“替換主流GPU的全量上線”。

大模型的持續迭代加速了我國AI技術及AI產業的演進,利好政策的相繼出臺同時開啟了我國大模型商用浪潮。面向未來,昆侖芯將始終堅持軟硬協同創新,夯實AI領域綜合優勢,加速大模型產業落地,勇立大模型時代潮頭。

責任編輯:彭菁

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4776

    瀏覽量

    129359
  • 開源
    +關注

    關注

    3

    文章

    3408

    瀏覽量

    42713
  • 昆侖芯科技
    +關注

    關注

    0

    文章

    29

    瀏覽量

    650

原文標題:來了!一文讀懂昆侖芯大模型端到端解決方案

文章出處:【微信號:昆侖芯科技,微信公眾號:昆侖芯科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    首發 | 昆侖 | 國產AI卡Deepseek訓練推理全版本適配、性能卓越,一鍵部署等您來(附文檔下載方式)

    編者按:本文是昆侖適配DeepSeek系列推文第一篇,將于近期分別推出在昆侖P800上進行DeepSeek-V3/R1推理、訓練的深度文
    發表于 02-06 15:28 ?43次閱讀
    首發 | <b class='flag-5'>昆侖</b><b class='flag-5'>芯</b> | 國產AI卡Deepseek訓練<b class='flag-5'>推理</b>全版本適配、性能卓越,一鍵部署等您來(附文檔下載方式)

    昆侖率先完成Deepseek訓練推理全版本適配

    本文是昆侖適配DeepSeek系列推文第一篇,將于近期分別推出在昆侖P800上進行DeepSeek-V3/R1推理、訓練的深度文章,干貨
    的頭像 發表于 02-06 15:13 ?126次閱讀
    <b class='flag-5'>昆侖</b><b class='flag-5'>芯</b>率先完成Deepseek訓練<b class='flag-5'>推理</b>全版本適配

    昆侖P800萬卡集群成功點亮,將進一步點亮3萬卡集群

    ? 近日,百度智能云成功點亮昆侖三代萬卡集群,這也是國內首個正式點亮的自研萬卡集群。百度智能云將進一步點亮3萬卡集群。 國產昆侖萬卡集群以及未來三萬卡集群的建設,從硬件到軟件,技術
    發表于 02-05 17:58 ?60次閱讀
    <b class='flag-5'>昆侖</b><b class='flag-5'>芯</b>P800萬卡集群成功點亮,將進一步點亮3萬卡集群

    新品| LLM630 Compute Kit,AI 大語言模型推理開發平臺

    LLM630LLM推理,視覺識別,可開發,靈活擴展···LLM630ComputeKit是一款AI大語言模型推理開發平臺,專為邊緣計算和智能交互應用而設計。該套件的主板搭載愛AX63
    的頭像 發表于 01-17 18:48 ?139次閱讀
    新品| LLM630 Compute Kit,AI 大語言模型<b class='flag-5'>推理</b>開發平臺

    昆侖科技一行到訪京能集團

    近日,昆侖CEO歐陽劍、副總裁孫孝思一行到訪京能集團,與京能集團黨委書記、董事長郭明星,副總經理陳國高、張鳳陽會面并開展座談。圍繞推動科技創新、發展新質生產力等領域的業務合作,昆侖
    的頭像 發表于 01-14 10:50 ?261次閱讀

    開源鴻蒙應用案例重磅發布

    開源賦能千行百業,有效推動產業創新升級。隨著開放原子開源基金會的開源鴻蒙(OpenHarmony)5.0 Release版本正式發布,項目生態逐步走向成熟,眾多開源應用案例應運而生。近
    的頭像 發表于 12-23 11:32 ?407次閱讀

    阿里云開源推理大模型QwQ

    近日,阿里云通義團隊宣布推出全新AI推理模型QwQ-32B-Preview,并同步實現了開源。這一舉措標志著阿里云在AI推理領域邁出了重要一步。 據評測數據顯示,QwQ預覽版本已具備研究生水平的科學
    的頭像 發表于 11-29 11:30 ?639次閱讀

    李開復:中國擅長打造經濟實惠的AI推理引擎

    10月22日上午,零一萬物公司的創始人兼首席執行官李開復在與外媒的交流中透露,其公司旗下的Yi-Lightning(閃電模型)在推理成本上已實現了顯著優勢,比OpenAI的GPT-4o模型低了31倍。他強調,中國擅長打造經濟實惠的AI
    的頭像 發表于 10-22 16:54 ?414次閱讀

    國產上運行TinyMaxi輕量級的神經網絡推理庫-米爾基于馳D9國產商顯板

    本篇測評由優秀測評者“短笛君”提供。本文將介紹基于米爾電子MYD-YD9360商顯板(米爾基于馳D9360國產開發板)的TinyMaxi輕量級的神經網絡推理庫方案測試。 算力測試TinyMaix
    發表于 08-09 18:26

    國產上運行TinyMaxi輕量級的神經網絡推理庫-米爾基于馳D9國產商顯板

    本帖最后由 blingbling111 于 2024-8-8 09:23 編輯 本篇測評由與非網的優秀測評者“短笛君”提供。本文將介紹基于米爾電子MYD-YD9360商顯板(米爾基于
    發表于 08-07 18:06

    迅為RK3568手冊上新 | RK3568開發板NPU例程測試

    是幫助學習和開發用戶快速上手使用RKNPU。本手冊先介紹梳理瑞開源NPU資料,然后著手搭建環境和工具的使用,最后以瑞開源demo為例,體驗和使用RKNPU。 更新內容●教程更新
    發表于 07-12 14:44

    國產上運行TinyMaxi輕量級的神經網絡推理庫-米爾基于馳D9國產商顯板

    本篇測評由與非網的優秀測評者“短笛君”提供。本文將介紹基于米爾電子MYD-YD9360商顯板(米爾基于馳D9360國產開發板)的TinyMaxi輕量級的神經網絡推理庫方案測試。算力測試
    的頭像 發表于 07-05 08:02 ?1943次閱讀
    國產<b class='flag-5'>芯</b>上運行TinyMaxi輕量級的神經網絡<b class='flag-5'>推理</b>庫-米爾基于<b class='flag-5'>芯</b>馳D9國產商顯板

    JH-7110 RISC-V開發套件正式開源

    近日,賽昉科技在RVspace生態社區正式開源昉·驚鴻-7110(JH-7110)DevKit開發套件,同時提供其原理圖和PCB參考設計源文件,旨在為客戶提供全面的RISC-V芯片平臺
    的頭像 發表于 06-15 08:19 ?646次閱讀
    JH-7110 RISC-V開發<b class='flag-5'>套件</b>正式<b class='flag-5'>開源</b>

    昆侖萬維開源2千億稀疏大模型Skywork-MoE

    近日,昆侖萬維公司宣布開源一款名為Skywork-MoE的稀疏大模型,該模型擁有高達2千億參數,不僅性能強勁,而且推理成本更低,為人工智能領域帶來了新的突破。
    的頭像 發表于 06-04 14:44 ?622次閱讀

    昆侖聯通IPO申請被終止

    北京昆侖聯通科技發展股份有限公司(簡稱“昆侖聯通”)的IPO申請已被終止,這是因為公司及其保薦人撤回了發行上市申請。
    的頭像 發表于 03-04 09:33 ?600次閱讀
    路虎百家乐官网的玩法技巧和规则 | 大发888手机版亚洲城| 诺贝尔百家乐官网的玩法技巧和规则| 大发888免费游戏| 金宝博百家乐游戏| 娱乐城设计| 澳门赌百家乐心法| 香港百家乐官网马书| 澳门赌博经历| 威尼斯人娱乐诚| 百家乐的保单打法| 粤港澳百家乐官网娱乐平台| 贺兰县| 大发888娱乐城 真钱bt| 百家乐怎么样投注| 新世纪百家乐官网娱乐城| 366娱乐城| 大发888游戏攻略| 百家乐网上赌有作假吗| 百家乐赔率技巧| 中国百家乐官网技巧软件| 哪里有百家乐官网代理| 大赢家即时比分| 百家乐游戏机压法| 百家乐官网老是输| 百家乐官网长龙怎么预判| 棋牌室管理制度| 百家乐赌台| 欧洲百家乐的玩法技巧和规则| 碧桂园太阳城户型图| 百家乐返点| 全讯网网站| 百家乐博娱乐平台赌百家乐| 玩百家乐去哪个平台好| 打百家乐的技术| 总玩百家乐官网有赢的吗| 百佬汇百家乐官网的玩法技巧和规则| 百家乐官网高手怎么下注| 百家乐官网在线赌场娱乐网规则 | 六合彩开奖现场| bet365娱乐场150|