那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Meta推出Llama 2 免費(fèi)開放商業(yè)和研究機(jī)構(gòu)使用

IEEE電氣電子工程師 ? 來(lái)源:IEEE電氣電子工程師 ? 2023-08-02 16:17 ? 次閱讀

近日,Meta推出了Llama 2,這是一個(gè)新的大型語(yǔ)言模型,參數(shù)高達(dá)700億。新的生成型人工智能系統(tǒng)代表了OpenAI的變化,但是幾乎沒有分享包括GPT-3/3.5和GPT-4在內(nèi)的大多數(shù)人工智能模型的細(xì)節(jié)。根據(jù)維基百科的數(shù)據(jù),Llama 2的發(fā)布包含了ChatGPT 3.5的40%的參數(shù),其中包括與微軟的重要合作。Redmond也不僅僅是一個(gè)名義上的合作伙伴,他最近宣布支持Azure和Windows中的Llama 2。與此同時(shí),高通公司現(xiàn)在表示,它將與Llama 2一起加入LLM競(jìng)爭(zhēng),并公布了將Llama 2帶入智能手機(jī)中的計(jì)劃。

Meta方面在微軟的Inspire合作伙伴大會(huì)上宣布,將與包括微軟在內(nèi)的主要云計(jì)算服務(wù)提供商合作,推出新一代開源大模型Llama 2,并將該模型免費(fèi)開放給商業(yè)和研究機(jī)構(gòu)使用。

這樣的發(fā)展意味著,無(wú)論來(lái)源如何,開源人工智能模型的能力和覆蓋范圍都將大幅擴(kuò)大。

Llama 2: Fine-tuned and Ready to Chat

Perplexity.ai提供了一個(gè)令人印象深刻的多個(gè)Llama 2模型的免費(fèi)在線演示。它的結(jié)果與包括ChatGPT和谷歌Bard在內(nèi)的當(dāng)今頂級(jí)聊天機(jī)器人具有競(jìng)爭(zhēng)力。Llama 2快速生成干凈、自然的文本,盡管不太可能非常出彩,但易于閱讀和理解。Llama 2還可以生成通常理解的事實(shí)、生成代碼和求解數(shù)學(xué)方程。

與所有LLM一樣,Llama 2偶爾會(huì)產(chǎn)生不正確或不可用的答案,但Meta介紹Llama的論文聲稱,它在學(xué)術(shù)基準(zhǔn)方面與OpenAI的GPT 3.5不相上下,如MMLU(衡量LLM在57門STEM科目中的知識(shí))和GSM8K(衡量LLM對(duì)數(shù)學(xué)的理解)。

Meta的研究人員部分是通過純粹的模型大小實(shí)現(xiàn)的 —— 但這只是故事的一半。根據(jù)Meta的論文,Llama 2使用了有監(jiān)督的微調(diào)、帶有人類反饋的強(qiáng)化學(xué)習(xí)和一種名為Ghost Attention(GAtt)的新技術(shù),該技術(shù)“能夠在多個(gè)回合中進(jìn)行對(duì)話控制”。更簡(jiǎn)單地說,GAtt幫助Llama在被要求在特定約束下工作時(shí)產(chǎn)生所需的結(jié)果,就像被要求“扮演”歷史人物時(shí)可能發(fā)生的那樣,或者在諸如架構(gòu)之類的特定主題的上下文中產(chǎn)生響應(yīng)。

25266d8c-3108-11ee-9e74-dac502259ad0.png

META

這些技術(shù)有助于Llama 2提供各種型號(hào),相對(duì)于其尺寸,具有可靠的基準(zhǔn)性能。最大的模型Llama 2 70B(有700億個(gè)參數(shù))在所有基準(zhǔn)測(cè)試中表現(xiàn)最好,但Meta也提供Llama 27 B和Llama 13 B。

參數(shù)較少的變體性能不如Llama 2 70B,但它們足夠緊湊,可以在功能較弱的設(shè)備(如智能手機(jī))上本地運(yùn)行。領(lǐng)先的智能手機(jī)片上系統(tǒng)(SoC)生產(chǎn)商高通公司宣布與Meta合作,“從2024年開始”讓Llama 2在高通公司支持的智能手機(jī)上本地運(yùn)行”。

高通公司營(yíng)銷傳播專家Rodrigo Caruso Neves do Amaral表示:“我們能夠使用我們的軟件工具來(lái)編譯和優(yōu)化模型,特別是在我們的Hexagon處理器上運(yùn)行。無(wú)論是對(duì)運(yùn)行這些型號(hào)的公司,還是對(duì)有時(shí)必須為訪問這些應(yīng)用程序付費(fèi)的消費(fèi)者,在設(shè)備上運(yùn)行所節(jié)省的能量都會(huì)產(chǎn)生巨大影響?!?/p>

Open Source Fits Where Closed Models Can’t

在智能手機(jī)上離線運(yùn)行大型語(yǔ)言模型是封閉的人工智能模型(如OpenAI的GPT 3.5和谷歌的PaLM2)無(wú)法處理的。這不一定是由于技術(shù)限制(據(jù)推測(cè),OpenAI和谷歌可以提供一種適合智能手機(jī)的模型),而是哲學(xué)上的分歧。OpenAI和谷歌提供LLM作為API。訪問API需要互聯(lián)網(wǎng)連接,客戶將根據(jù)使用情況收費(fèi)。

相比之下,Llama 2的發(fā)布表示允許無(wú)限、免費(fèi)的商業(yè)和學(xué)術(shù)使用。該許可并不符合開源計(jì)劃制定的所有標(biāo)準(zhǔn),因?yàn)樵撛S可包括一項(xiàng)條款,要求允許將Llama 2用于“月活躍用戶超過7億”的“產(chǎn)品或服務(wù)”。然而,該條款僅適用于Meta最大的競(jìng)爭(zhēng)對(duì)手,如OpenAI和谷歌。Meta的Llama 2模型已經(jīng)出現(xiàn)在HuggingFace的Open LLM排行榜上,截至7月24日星期一收盤,“Llama-2-70b-chat-hf”的延遲和吞吐量基準(zhǔn)排名第三。(截至發(fā)稿時(shí),目前的頂級(jí)模型Stability AI的FreeWilly2實(shí)際上已經(jīng)基于Llama 2,但FreeWilly22使用不同的數(shù)據(jù)集對(duì)模型進(jìn)行了微調(diào)。)

Srinivas認(rèn)為L(zhǎng)lama 2的開源許可證是一個(gè)力量倍增器,為開發(fā)者和研究人員提供了一個(gè)根據(jù)他們的特定需求調(diào)整模型的機(jī)會(huì)?!耙粋€(gè)人可以啟動(dòng)Llama 2的分支,專注于量化,另一個(gè)人可以開啟另一個(gè)Llama的分支關(guān)注于低階微調(diào),……其他人則可以將更大的模型提煉成更小的模型,從而加速進(jìn)展?!?/p>

事實(shí)證明,這對(duì)瞄準(zhǔn)邊緣設(shè)備(如智能手機(jī))的開發(fā)人員來(lái)說尤其重要??紤]到型號(hào)的大小,Llama 2 70B表現(xiàn)出色并不令人驚訝。但Llama 2的較小型號(hào)相對(duì)于其型號(hào)大小也排名良好。在Open LLM排行榜上,大多數(shù)表現(xiàn)優(yōu)于Llama 2的小型模型本身都是基于Meta之前的模型Llama。這表明,隨著開源社區(qū)的開發(fā)人員將他們的才能應(yīng)用到Llama 2中,Llama 2將在排行榜上名列前茅。

Srinivas說:“我認(rèn)為L(zhǎng)lama 2 7B和Llama 2 13B已經(jīng)很令人興奮了……這只是一個(gè)開始。Meta推出了它,現(xiàn)在人們可以改進(jìn)它??梢詷?gòu)建其他框架和其他工程層,這賦予了每個(gè)人更多的權(quán)力。”

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1796

    文章

    47683

    瀏覽量

    240307
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3313

    瀏覽量

    49231
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1140

    瀏覽量

    6707

原文標(biāo)題:Meta推出Llama 2 免費(fèi)開放商業(yè)和研究機(jī)構(gòu)使用

文章出處:【微信號(hào):IEEE_China,微信公眾號(hào):IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Meta推出Llama 3.3 70B,AI大模型競(jìng)爭(zhēng)白熱化

    在今年的AI領(lǐng)域,Meta也不甘落后,推出了其壓軸之作——Llama 3.3 70B大模型。與此同時(shí),馬斯克的xAI也宣布其Grok模型從今天起全球免費(fèi)
    的頭像 發(fā)表于 12-09 14:50 ?468次閱讀

    Meta發(fā)布Llama 3.2量化版模型

    近日,Meta在開源Llama 3.2的1B與3B模型后,再次為人工智能領(lǐng)域帶來(lái)了新進(jìn)展。10月24日,Meta正式推出了這兩個(gè)模型的量化版本,旨在進(jìn)一步優(yōu)化模型性能,拓寬其應(yīng)用場(chǎng)景。
    的頭像 發(fā)表于 10-29 11:05 ?472次閱讀

    亞馬遜云科技上線Meta Llama 3.2模型

    亞馬遜云科技近日宣布,Meta公司的新一代模型Llama 3.2已在其平臺(tái)上正式上線。該模型包括Meta首款多模態(tài)模型,現(xiàn)已在Amazon Bedrock和Amazon SageMaker中全面可用。
    的頭像 發(fā)表于 10-11 18:08 ?509次閱讀

    亞馬遜云科技正式上線Meta Llama 3.2模型

    亞馬遜云科技宣布,Meta的新一代模型Llama 3.2,包括其首款多模態(tài)模型,現(xiàn)已在Amazon Bedrock和Amazon SageMaker中正式可用。
    的頭像 發(fā)表于 10-11 09:20 ?556次閱讀

    Meta Llama 3.1系列模型可在Google Cloud上使用

    我們很高興宣布,Llama 3.1 系列模型已添加到 Vertex AI Model Garden,這包括全新的 405B,即 Meta 迄今為止功能最強(qiáng)大、用途最廣泛的模型。這些模型的添加,表明
    的頭像 發(fā)表于 08-02 15:42 ?441次閱讀

    PerfXCloud平臺(tái)成功接入Meta Llama3.1

    近日,Meta對(duì)外宣布推出迄今為止最強(qiáng)大的開源模型——Llama3.1 405B,同時(shí)還發(fā)布了全新優(yōu)化升級(jí)的70B和8B版本,技術(shù)革新的浪潮再次洶涌來(lái)襲!在此,我們滿懷欣喜地向您宣告,PerfXCloud平臺(tái)現(xiàn)已成功接入
    的頭像 發(fā)表于 07-25 10:26 ?700次閱讀

    Meta發(fā)布全新開源大模型Llama 3.1

    科技巨頭Meta近期震撼發(fā)布了其最新的開源人工智能(AI)模型——Llama 3.1,這一舉措標(biāo)志著Meta在AI領(lǐng)域的又一重大突破。Meta創(chuàng)始人馬克·扎克伯格親自站臺(tái),盛贊
    的頭像 發(fā)表于 07-24 18:25 ?1500次閱讀

    Meta發(fā)布基于Code Llama的LLM編譯器

    近日,科技巨頭Meta在其X平臺(tái)上正式宣布推出了一款革命性的LLM編譯器,這一模型家族基于Meta Code Llama構(gòu)建,并融合了先進(jìn)的代碼優(yōu)化和編譯器功能。LLM編譯器的
    的頭像 發(fā)表于 06-29 17:54 ?1567次閱讀

    Meta Llama 3基礎(chǔ)模型現(xiàn)已在亞馬遜云科技正式可用

    亞馬遜云科技近日宣布,Meta公司最新發(fā)布的兩款Llama 3基礎(chǔ)模型——Llama 3 8B和Llama 3 70B,現(xiàn)已正式上線并集成至Amazon SageMaker JumpS
    的頭像 發(fā)表于 05-09 10:39 ?454次閱讀

    高通支持Meta Llama 3在驍龍終端上運(yùn)行

    高通與Meta攜手合作,共同推動(dòng)MetaLlama 3大語(yǔ)言模型(LLM)在驍龍驅(qū)動(dòng)的各類終端設(shè)備上實(shí)現(xiàn)高效運(yùn)行。此次合作致力于優(yōu)化Llama 3在智能手機(jī)、個(gè)人電腦、VR/AR頭顯
    的頭像 發(fā)表于 05-09 10:37 ?473次閱讀

    英特爾AI產(chǎn)品助力其運(yùn)行Meta新一代大語(yǔ)言模型Meta Llama 3

    英特爾豐富的AI產(chǎn)品——面向數(shù)據(jù)中心的至強(qiáng)處理器,邊緣處理器及AI PC等產(chǎn)品為開發(fā)者提供最新的優(yōu)化,助力其運(yùn)行Meta新一代大語(yǔ)言模型Meta Llama 3
    的頭像 發(fā)表于 04-28 11:16 ?703次閱讀

    高通與Meta合作優(yōu)化Meta Llama 3,實(shí)現(xiàn)終端側(cè)運(yùn)行

    高通技術(shù)公司高級(jí)副總裁兼技術(shù)規(guī)劃和邊緣解決方案業(yè)務(wù)總經(jīng)理馬德嘉表示:“我們對(duì)Meta開放Meta Llama 3的策略表示贊賞,高通與Meta
    的頭像 發(fā)表于 04-22 09:51 ?523次閱讀

    Meta推出最強(qiáng)開源模型Llama 3 要挑戰(zhàn)GPT

    公司這次開源了Llama 3 8B與70B兩款不同規(guī)模的模型,開發(fā)者可以免費(fèi)使用,而Meta公司還將陸續(xù)推出一系列具備多模態(tài)、多語(yǔ)言對(duì)話、更長(zhǎng)上下文窗口等能力的新模型。 據(jù)悉
    的頭像 發(fā)表于 04-19 17:00 ?896次閱讀

    Meta推出新一代語(yǔ)言模型LLAMA 3,性能優(yōu)于GPT-3.5

    Meta決定將Llama 3的80億參數(shù)版開源,以期讓更多人能夠接觸到尖端的AI技術(shù)。全球范圍內(nèi)的開發(fā)者、研究員以及對(duì)AI充滿好奇的人士均可參與其中,進(jìn)行游戲開發(fā)、模型構(gòu)建與實(shí)驗(yàn)探索。
    的頭像 發(fā)表于 04-19 10:21 ?913次閱讀

    LLaMA 2是什么?LLaMA 2背后的研究工作

    Meta 發(fā)布的 LLaMA 2,是新的 sota 開源大型語(yǔ)言模型 (LLM)。LLaMA 2 代表著
    的頭像 發(fā)表于 02-21 16:00 ?1232次閱讀
    皇冠网络| 百家乐真人游戏娱乐| 崇礼县| 澳门百家乐玩| 百家乐官网稳赢玩法| 百家乐五湖四海娱乐平台 | 百家乐伴侣破解版| 百家乐官网直杀| 大发888网页版下载| 罗浮宫百家乐官网的玩法技巧和规则| 大发8880634| 网上百家乐可靠| 百家乐官网冯式打法| 大发百家乐的玩法技巧和规则| 百家乐官网赢多少该止赢| 澳门博彩8345cc| 澳门百家乐职业赌客| 百家乐官网顶路| 波克棋牌游戏大厅| 澳门百家乐娱乐注册| 赌场百家乐官网规则| 3d棋牌游戏| 百家乐群html| 百家乐官网设备电子路| 永胜博娱乐| 百家乐群bet20| 百樂坊百家乐官网的玩法技巧和规则 | 金沙百家乐官网的玩法技巧和规则 | 百家乐官网必学技巧| 亚洲顶级赌场的微博| 百家乐小音箱| 职业赌百家乐官网技巧 | 做生意什么花招财| 百家乐官网投注哪个信誉好| 皇冠现金网哪个最好| 娱乐城百家乐送白菜| 百家乐官网高手的心得| 在线博彩| 大发888扑克官方下载| 百家乐直杀| 博E百百家乐官网的玩法技巧和规则|