借助 TensorRT-LLM,Google 全新開放語言模型可在 NVIDIA AI 平臺(包括本地 RTX AI PC)上加速運行。
2024 年 2 月 21 日,NVIDIA 攜手 Google 在所有 NVIDIA AI 平臺上發(fā)布面向 Gemma 的優(yōu)化功能,Gemma 是 Google 最先進的新型輕量級 2B 和 7B 開放語言模型,可在任何地方運行,從而降低成本并加快特定領(lǐng)域用戶案例的創(chuàng)新工作。
NVIDIA 和 Google 的團隊緊密合作,利用 NVIDIA TensorRT-LLM(用于優(yōu)化大語言模型推理性能的開源庫),在數(shù)據(jù)中心的 NVIDIA GPU、云計算和搭載 NVIDIA RTX GPU 的 PC 上運行時,加速 Gemma 性能(Gemma 由創(chuàng)建 Gemini 模型的相同研究和技術(shù)構(gòu)建)。
這使開發(fā)者能將全球高性能 AI PC 中超過 1 億臺搭載 NVIDIA RTX GPU 的用戶作為潛在用戶進行開發(fā)。
開發(fā)者還可在搭載 NVIDIA GPU 的云端運行 Gemma,該實例擁有 141GB HBM3e 顯存,速度為 4.8TB/秒,Google 將于今年部署該實例。
此外,企業(yè)級開發(fā)者還可利用 NVIDIA 豐富的工具生態(tài)系統(tǒng)(包括依托 NeMo 框架的 NVIDIA AI Enterprise 和 TensorRT-LLM),對 Gemma 進行微調(diào),并將優(yōu)化后的模型部署到生產(chǎn)應(yīng)用中。
審核編輯:劉清
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5076瀏覽量
103722 -
云計算
+關(guān)注
關(guān)注
39文章
7860瀏覽量
137871 -
gpu
+關(guān)注
關(guān)注
28文章
4775瀏覽量
129357
原文標(biāo)題:共耀光芒:Google Gemma 優(yōu)化后可在 NVIDIA GPU 上運行
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
《CST Studio Suite 2024 GPU加速計算指南》
NVIDIA NIM微服務(wù)登陸亞馬遜云科技
如何構(gòu)建及優(yōu)化GPU云網(wǎng)絡(luò)
![如何構(gòu)建及<b class='flag-5'>優(yōu)化</b><b class='flag-5'>GPU</b>云網(wǎng)絡(luò)](https://file1.elecfans.com/web1/M00/F4/6F/wKgaoWcrIy6AZRndAAAJTzfdk34444.png)
AMD與NVIDIA GPU優(yōu)缺點
TI TDA2x SoC上基于GPU的環(huán)視優(yōu)化
![TI TDA2x SoC<b class='flag-5'>上</b>基于<b class='flag-5'>GPU</b>的環(huán)視<b class='flag-5'>優(yōu)化</b>](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
Google Gemma 2模型的部署和Fine-Tune演示
![<b class='flag-5'>Google</b> <b class='flag-5'>Gemma</b> 2模型的部署和Fine-Tune演示](https://file1.elecfans.com/web2/M00/02/75/wKgaoma13CaAOEJXAAAqK_phE20610.png)
![](https://file1.elecfans.com/web2/M00/FE/9C/wKgZomai_rmAC1MZAAcG8-ZGlao305.png)
英國公司實現(xiàn)英偉達(dá)CUDA軟件在AMD GPU上的無縫運行
使用google-translate和wwe合并后無法使用google-tts怎么解決?
NVIDIA加速微軟最新的Phi-3 Mini開源語言模型
NVIDIA全面加快Meta Llama 3的推理速度
利用NVIDIA組件提升GPU推理的吞吐
NVIDIA 發(fā)布全新交換機,全面優(yōu)化萬億參數(shù)級 GPU 計算和 AI 基礎(chǔ)設(shè)施
![<b class='flag-5'>NVIDIA</b> 發(fā)布全新交換機,全面<b class='flag-5'>優(yōu)化</b>萬億參數(shù)級 <b class='flag-5'>GPU</b> 計算和 AI 基礎(chǔ)設(shè)施](https://file1.elecfans.com/web2/M00/C4/EC/wKgZomX48yOAARKHAAFsIO99Xwk611.png)
TensorRT LLM加速Gemma!NVIDIA與谷歌牽手,RTX助推AI聊天
![TensorRT LLM加速<b class='flag-5'>Gemma</b>!<b class='flag-5'>NVIDIA</b>與谷歌牽手,RTX助推AI聊天](https://file1.elecfans.com/web2/M00/C0/B0/wKgZomXX-GGAMvdPAAAPTHf0Hco223.png)
評論