那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA NIM助力企業(yè)高效部署生成式AI模型

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2024-10-10 09:49 ? 次閱讀

Canonical、Nutanix 和 Red Hat 等廠商的開源 Kubernetes 平臺集成了 NVIDIA NIM,將允許用戶通過 API 調用來大規(guī)模地部署大語言模型。

在企業(yè)中部署生成式 AI 將變得空前簡單。

NVIDIA NIM是一套生成式 AI 推理微服務,將支持 KServe 開源軟件,可以自動將 AI 模型以云計算應用的規(guī)模運行。

NVIDIA NIM 與 KServe 的組合確保了生成式 AI 可以像任何其他大型企業(yè)級應用一樣進行部署,還讓用戶能夠通過 Canonical、Nutanix 和 Red Hat 等數(shù)十家公司的平臺廣泛使用 NIM。

NIM 在 KServe 上的集成將使 NVIDIA 的技術擴展到開源社區(qū)、生態(tài)系統(tǒng)合作伙伴和客戶。借助 NIM,他們可以通過 API 調用(即現(xiàn)代編程的一鍵式操作)來獲得NVIDIA AI Enterprise軟件平臺的性能、支持和安全性。

在 Kubernetes 上提供 AI

KServe 最初是基于 Kubernetes 的機器學習工具包 Kubeflow 的一部分。Kubernete 是一個開源系統(tǒng),用于部署和管理包含大型分布式應用組件的軟件容器。

隨著 Kubeflow 在 AI 推理方面的不斷擴展,KServe 誕生了,并最終演變成為獨立的開源項目。

許多公司都為 KServe 軟件做出了貢獻并采用了該軟件。目前,運行 KServe 軟件的公司包括亞馬遜科技、彭博、Canonical、思科、慧與、IBM、Red Hat、Zillow 和 NVIDIA 等。

深入解析 KServe

KServe 本質上是 Kubernetes 的擴展,它像一個強大的云應用一樣運行 AI 推理。它使用標準協(xié)議,以經(jīng)過優(yōu)化的性能運行,并支持 PyTorch、Scikit-learn、TensorFlow 和 XGBoost,而用戶無需了解這些 AI 框架的細節(jié)。

在新的大語言模型(LLM)層出不窮的情況下,該軟件尤其有用。

KServe 讓用戶可以輕松地在模型之間來回切換,測試哪一個最符合他們的需求。當模型的新版本發(fā)布時,KServe 的 “金絲雀發(fā)布(canary rollouts)” 功能會自動執(zhí)行詳細驗證,并逐步將其部署到生產(chǎn)系統(tǒng)中。

其另一項功能 “GPU 自動縮放” 可以隨著服務需求的起伏來高效地管理模型的部署方式,從而使客戶和服務提供商獲得最佳體驗。

生成式 AI 的 API 調用

KServe 的優(yōu)勢現(xiàn)在將通過 NVIDIA NIM 的便捷性提供。

使用 NIM ,只需一個簡單的 API 調用即可應對所有的復雜性。企業(yè) IT 管理員能夠獲得確保應用以最佳性能和效率運行所需的指標,無論應用是在他們的數(shù)據(jù)中心還是在遠程云服務上,即使是在更改了 AI 模型的情況下。

NIM 讓 IT 專家成為生成式 AI 專家,變革了公司的運營。這就是為什么 Foxconn 和 ServiceNow 等眾多企業(yè)都正在部署 NIM 微服務的原因。

NIM 支持數(shù)十個 Kubernetes 平臺

由于 NIM 與 KServe 的集成,用戶將能夠在數(shù)十個企業(yè)平臺上訪問 NIM,比如 Canonical 的 Charmed KubeFlow 和 Charmed Kubernetes、Nutanix GPT-in-a-Box 2.0、Red Hat 的 OpenShift AI 等等。

KServe 貢獻者、Red Hat 首席軟件工程師 Yuan Tang 表示:“Red Hat 一直在與 NVIDIA 合作,以便讓企業(yè)更輕松地使用開源技術來部署 AI。通過增強 KServe 并在 Red Hat OpenShift AI 中增加對 NIM 的支持,我們能夠讓 Red Hat 的客戶更方便地訪問 NVIDIA 的生成式 AI 平臺。”

“通過將 NVIDIA NIM 推理微服務與 Nutanix GPT-in-a-Box 2.0 集成,客戶將能夠從云端到邊緣以一致的方式去構建可擴展、安全、高性能的生成式 AI 應用。” Nutanix 工程副總裁 Debojyoti Dutta 表示,其團隊為 KServe 和 Kubeflow 做出了貢獻。

Canonical 的 MLOps 產(chǎn)品經(jīng)理 Andreea Munteanu 表示:“作為一家對 KServe 做出重大貢獻的公司,我們很高興通過 Charmed Kubernetes 和 Charmed Kubeflow 提供 NIM。在我們的共同努力下,用戶將能夠輕松地使用生成式 AI 的全部功能,并使其保持最高的性能和效率。”

數(shù)十家其他軟件提供商都能感受到 NIM 的好處,因為他們的產(chǎn)品中也包含了 KServe。

服務開源社區(qū)

NVIDIA 一直積極地參與 KServe 項目。正如最近的一篇技術博客中所提到的,KServe 的開放推理協(xié)議已經(jīng)被用于NVIDIA Triton 推理服務器,可以幫助用戶跨多個 GPU、框架和操作模式同時運行許多 AI 模型。

基于 KServe,NVIDIA 專注于在多個 GPU 上一次運行一個 AI 模型的用例。

作為 NIM 集成的一部分,NVIDIA 計劃在其開源軟件(包括 Triton 和TensorRT-LLM)的基礎上,成為 KServe 的積極貢獻者。NVIDIA 還是云原生計算基金會(CNCF)的活躍成員,該基金會支持生成式 AI 和其他項目的開源代碼。

立即通過 NVIDIA API 目錄試用 Llama 3 8B 或 Llama 3 70B 大語言模型的 NIM API。全球數(shù)百家 NVIDIA 合作伙伴也正在使用 NIM 來部署生成式 AI。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5076

    瀏覽量

    103723
  • 數(shù)據(jù)中心

    關注

    16

    文章

    4859

    瀏覽量

    72381
  • AI
    AI
    +關注

    關注

    87

    文章

    31520

    瀏覽量

    270339

原文標題:COMPUTEX 2024 | KServe 提供商在云和數(shù)據(jù)中心提供由 NIM 賦能的推理

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    NVIDIA 發(fā)布保障代理式 AI 應用安全的 NIM 微服務

    務是 NVIDIA NeMo Guardrails 軟件工具系列的一部分。這些可移植且經(jīng)過優(yōu)化的推理微服務可幫助企業(yè)提高生成 AI 應用的
    發(fā)表于 01-17 16:29 ?72次閱讀

    全新NVIDIA NIM微服務實現(xiàn)突破性進展

    全新 NVIDIA NIM 微服務實現(xiàn)突破性進展,可助力氣象技術公司開發(fā)和部署 AI 模型,實現(xiàn)
    的頭像 發(fā)表于 11-21 10:07 ?303次閱讀

    NVIDIA助力企業(yè)創(chuàng)建定制AI應用

    NVIDIA 近日宣布與眾多技術領導者一同使用最新NVIDIA NIM Agent Blueprint以及NVIDIA NeMo和NVIDIA
    的頭像 發(fā)表于 11-20 09:12 ?423次閱讀

    NVIDIA助力Amdocs打造生成AI智能體

    正在使用NVIDIA DGX Cloud 與 NVIDIA AI Enterprise軟件開發(fā)和交付基于商用大語言模型(LLM)和領域適配模型
    的頭像 發(fā)表于 11-19 14:48 ?419次閱讀

    NVIDIA 攜手全球合作伙伴推出 NIM Agent Blueprints,助力企業(yè)打造屬于自己的 AI

    可定制工作流目錄加快核心生成 AI 用例的部署速度。首批用例包括客戶服務、藥物研發(fā)和 PDF 數(shù)據(jù)提取,未來將加入更多用例 企業(yè)可以使用
    發(fā)表于 08-28 10:10 ?248次閱讀
    <b class='flag-5'>NVIDIA</b> 攜手全球合作伙伴推出 <b class='flag-5'>NIM</b> Agent Blueprints,<b class='flag-5'>助力</b><b class='flag-5'>企業(yè)</b>打造屬于自己的 <b class='flag-5'>AI</b>

    借助NVIDIA NIM加速AI應用部署

    大語言模型(LLM)在企業(yè)組織中的應用日益廣泛,許多企業(yè)都將其整合到 AI 應用中。雖然從基礎模型著手十分
    的頭像 發(fā)表于 08-23 16:38 ?456次閱讀
    借助<b class='flag-5'>NVIDIA</b> <b class='flag-5'>NIM</b>加速<b class='flag-5'>AI</b>應用<b class='flag-5'>部署</b>

    全新NVIDIA NIM微服務將生成AI引入數(shù)字環(huán)境

    生成物理 AI NIM 微服務以及 NVIDIA Metropolis 參考工作流旨在協(xié)助創(chuàng)建智能的沉浸
    的頭像 發(fā)表于 08-02 15:20 ?618次閱讀

    NVIDIA NIM:打造AI領域的AI-in-a-Box,提高AI開發(fā)與部署高效

    據(jù)7月30日官方發(fā)布的資訊顯示,在全球備受矚目的計算機圖形學盛會——SIGGRAPH 2024上,NVIDIA公司對外展示了其在諸如渲染、仿真及生成AI等前沿領域所取得的卓越成果,而
    的頭像 發(fā)表于 07-30 16:27 ?755次閱讀

    NVIDIA攜手Meta推出AI服務,為企業(yè)提供生成AI服務

    NVIDIA近日宣布了一項重大舉措,正式推出NVIDIA AI Foundry服務與NVIDIA NIM
    的頭像 發(fā)表于 07-25 16:57 ?601次閱讀

    英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理微服務,與同樣剛推出的 Llama 3.1
    的頭像 發(fā)表于 07-25 09:48 ?791次閱讀

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成 AI 模型

    Foundry 提供從數(shù)據(jù)策管、合成數(shù)據(jù)生成、微調、檢索、防護到評估的全方位生成 AI 模型服務,以便
    發(fā)表于 07-24 09:39 ?742次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundry 為全球<b class='flag-5'>企業(yè)</b>打造自定義 Llama 3.1 <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>

    生成AI醫(yī)療嶄露頭角:Meta Llama 3 NIM引數(shù)十公司關注

    NVIDIA NIM推理微服務在ai.nvidia.com網(wǎng)站上供大家下載。這使得醫(yī)療健康開發(fā)者、科研人員及企業(yè)能在各類應用中合理創(chuàng)新,而NIM
    的頭像 發(fā)表于 06-07 15:25 ?1610次閱讀

    英偉達推出AI模型推理服務NVIDIA NIM

    英偉達近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI模型
    的頭像 發(fā)表于 06-04 09:15 ?731次閱讀

    NVIDIA將全球數(shù)百萬開發(fā)者轉變?yōu)?b class='flag-5'>生成 AI 開發(fā)者

    來自 AI 生態(tài)系統(tǒng)各個領域的 150 余家合作伙伴嵌入了 NIM 推理微服務,將企業(yè)AI 應用的部署時間從數(shù)周縮短至幾分鐘
    的頭像 發(fā)表于 06-03 18:21 ?1084次閱讀

    NVIDIA NIM 革命性地改變模型部署,將全球數(shù)百萬開發(fā)者轉變?yōu)?b class='flag-5'>生成 AI 開發(fā)者

    部署在云、數(shù)據(jù)中心或工作站上。借助 NVIDIA NIM,開發(fā)者能夠輕松地為 copilots、聊天機器人等構建生成
    發(fā)表于 06-03 09:12 ?262次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>NIM</b> 革命性地改變<b class='flag-5'>模型</b><b class='flag-5'>部署</b>,將全球數(shù)百萬開發(fā)者轉變?yōu)?b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 開發(fā)者
    百家乐官网视频下栽| 东方太阳城招聘| 澳门百家乐官网海星王娱乐城| 百家乐管家| V博百家乐官网的玩法技巧和规则 中骏百家乐官网的玩法技巧和规则 | 宜城市| 百家乐真人荷官网| 至尊百家乐官网娱乐场开户注册| 棋牌平台| 百家乐闲和庄| 百家乐官网知识技巧玩法| 大发888免费游戏| 百家乐在线投注网| 百家乐官网赌场现金网| 澳门顶级赌场百家乐的玩法技巧和规则| 百家乐投注方法新版| 澳门百家乐官网备用网址| 大发888官方6222| 澳门百家乐实战视频| 百家乐官网的弱点| 岳池县| 新葡京百家乐现金网| 百家乐官网9人桌| 君豪棋牌怎么样| 网络百家乐的玩法技巧和规则| 百家乐官网网上玩法| 桃源县| 大发888网页在线游戏| 游戏百家乐庄闲| 利澳百家乐官网娱乐城| 连平县| 大发888登陆网页游戏| 百家乐高手长胜攻略| 百家乐官网游戏作弊| 萍乡市| 大发888官方6222| 博彩百家乐最新优惠| 风水学24山看水法| 博彩百家乐官网网址| 鄄城县| bet365赞助球队|