谷歌首席執(zhí)行官Sundar Pichai表示,這是人工智能新時代的開始:Gemini時代。Gemini是谷歌最新的大型語言模型,Pichai在6月份的I/O開發(fā)者大會上首次提出,現(xiàn)在向公眾發(fā)布。聽Pichai和谷歌DeepMind首席執(zhí)行官Demis Hassabis描述,這是人工智能模型的一個巨大飛躍,最終將影響谷歌幾乎所有的產(chǎn)品。Pichai說:“這一時刻的一個強大之處是,你可以研究一種底層技術(shù),并使其變得更好,并且它會立即衍生到我們的產(chǎn)品中。”
Gemini不僅僅是一個單一的人工智能模型。有一個簡單版本叫Gemini Nano,旨在在安卓設(shè)備上離線運行。有一個更強大的版本叫Gemini Pro,很快將為谷歌的許多人工智能服務提供動力,從今天開始,它是Bard的支柱。還有一個功能更強大的模型叫Gemini Ultra,這是谷歌迄今為止創(chuàng)建的最強大的LLM,似乎主要是為數(shù)據(jù)中心和企業(yè)應用程序設(shè)計的。
從12月13日開始,開發(fā)者和企業(yè)客戶將能夠通過谷歌Generative AI Studio或谷歌云中的Vertex AI訪問Gemini Pro。Gemini目前只提供英語版本,其他語言顯然很快就會出現(xiàn)。但Pichai表示,該模式最終將在全球范圍內(nèi)集成到谷歌的搜索引擎、廣告產(chǎn)品、Chrome瀏覽器等中。這是谷歌的未來,它馬上就要到來了。
OpenAI在一年多前推出了ChatGPT,該公司和產(chǎn)品立即成為人工智能領(lǐng)域最火爆的內(nèi)容。現(xiàn)在,谷歌——這家創(chuàng)造了當前人工智能繁榮背后大部分基礎(chǔ)技術(shù)的公司,近十年來一直稱自己為“人工智能第一”組織,終于準備好反擊了。
Hassabis表示:“我們已經(jīng)對系統(tǒng)進行了非常徹底的并排分析和基準測試。” 谷歌運行了32個完善的基準測試來比較這兩個模型,從廣泛的整體測試(如多任務語言理解基準測試)到比較兩個模型生成Python代碼的能力的測試。Hassabis面帶微笑地說:“我認為我們在32個基準中有30個基本領(lǐng)先。”
在這些基準(實際上大多非常接近)中,Gemini最明顯的優(yōu)勢來自于它理解視頻和音頻并與之互動的能力。這在很大程度上是有意為之:多模式從一開始就是Gemini計劃的一部分。谷歌沒有像OpenAI創(chuàng)建DALL-E和Whisper那樣,為圖像和語音訓練單獨的模型;它從一開始就建立了一個多感官模型。“我們一直對非常、非常通用的系統(tǒng)感興趣,”Hassabis說。他特別感興趣的是如何混合所有這些模式——從任何數(shù)量的輸入和感覺中收集盡可能多的數(shù)據(jù),然后給出盡可能多種類的響應。
目前,Gemini最基本的模型是文本輸入和文本輸出,但像Gemini Ultra這樣功能更強大的模型可以處理圖像、視頻和音頻。Hassabis說:“這將變得更加普遍。還有一些東西,比如動作和觸摸,更像機器人類型的東西。” 他說,隨著時間的推移,Gemini會有更多的感覺,在這個過程中變得更準確、更接地氣。Hassabis表示,這些模型知道的越多,他們就會得到更好的結(jié)果。
不過,基準測試只是基準測試,最終,對Gemini能力的真正考驗將來自那些想用它集思廣益、查找信息、編寫代碼等的日常用戶。谷歌似乎特別將編碼視為Gemini的殺手級應用;它使用了一種名為AlphaCode 2的新代碼生成系統(tǒng),稱其性能優(yōu)于85%的編碼比賽參與者,高于原始AlphaCode的50%。但Pichai表示,用戶會注意到該模型所涉及的幾乎所有方面都有所改進。
對谷歌來說同樣重要的是,Gemini顯然是一個效率高得多的模式。它是在谷歌自己的張量處理單元上訓練的,運行起來比谷歌以前的模型(如PaLM)更快、更便宜。除了新模型,谷歌還推出了其TPU系統(tǒng)的新版本TPU v5p,這是一種設(shè)計用于數(shù)據(jù)中心的計算系統(tǒng),用于訓練和運行大型模型。
與Pichai和Hassabis交談發(fā)現(xiàn),很明顯,他們認為Gemini的發(fā)布既是一個更大項目的開始,也是其本身的一個階段性變化。Gemini是谷歌一直在等待的模式,也是它多年來一直在努力打造的模式,甚至可能是它在OpenAI和ChatGPT“接管”世界之前就應該準備好的模式。
谷歌在ChatGPT發(fā)布后宣布進入“code red”,此后一直被認為在迎頭趕上,似乎仍在努力堅持其“大膽而負責任”的口號。Hassabis和Pichai都表示,他們不愿意為了跟上而走得太快,尤其是在我們離終極人工智能夢想通用人工智能越來越近的時候。通用人工智能是一種自我塑造、比人類更聰明并準備改變世界的人工智能。“隨著我們接近AGI,情況將有所不同,”Hassabis說,“這是一種積極的技術(shù),所以我認為我們必須謹慎、謹慎但樂觀地對待它。”谷歌表示,它通過內(nèi)部和外部測試以及紅隊合作,努力確保Gemini的安全和責任。Pichai指出,確保數(shù)據(jù)安全性和可靠性對于企業(yè)優(yōu)先的產(chǎn)品尤為重要,而這正是最具生成性的人工智能賺錢的地方。
-
谷歌
+關(guān)注
關(guān)注
27文章
6195瀏覽量
106016 -
Gemini
+關(guān)注
關(guān)注
0文章
56瀏覽量
7616 -
人工智能
+關(guān)注
關(guān)注
1796文章
47679瀏覽量
240297
原文標題:谷歌推出Gemini 希望擊敗GPT-4
文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
谷歌發(fā)布Gemini 2.0 AI模型
Llama 3 與 GPT-4 比較
OpenAI推出新模型CriticGPT,用GPT-4自我糾錯
OpenAI API Key獲取:開發(fā)人員申請GPT-4 API Key教程
![OpenAI API Key獲取:開發(fā)人員申請<b class='flag-5'>GPT-4</b> API Key教程](https://file1.elecfans.com/web2/M00/B1/D3/wKgZomVddfqAVkq0AABxTmjVfN0431.png)
開發(fā)者如何調(diào)用OpenAI的GPT-4o API以及價格詳情指南
![開發(fā)者如何調(diào)用OpenAI的<b class='flag-5'>GPT-4</b>o API以及價格詳情指南](https://file1.elecfans.com/web2/M00/EA/20/wKgZomZW4A2AUr3OAAD6aRXRTyQ948.png)
評論