土豪娱乐场官网信誉怎么样,竞彩足球彩票,德国老虎机厂家网址(中国)·官方网站

我們知道，大模型會(huì)編造不正確的答案，產(chǎn)生“幻覺”。

其實(shí)，在應(yīng)用層面，還存在一個(gè)更隱蔽的“幻覺”，就是創(chuàng)業(yè)公司忽略了大模型落地所需要的長(zhǎng)周期、重基建和工程化難度，帶來的“速成幻覺”。

隨著“百模大戰(zhàn)”拉開序幕，大模型過剩帶來的市場(chǎng)擠壓，也給整個(gè)大模型生態(tài)帶來了行業(yè)洗牌的風(fēng)險(xiǎn)。

越來越多的人有了共識(shí)，基礎(chǔ)通用大模型競(jìng)爭(zhēng)激烈，注定是少數(shù)人的游戲。創(chuàng)業(yè)公司隨時(shí)可能倒掉，造成項(xiàng)目爛尾。

具備技術(shù)、產(chǎn)品和行業(yè)優(yōu)勢(shì)的“第一梯隊(duì)”大廠，比如百度的文心大模型3.5，已經(jīng)跟國(guó)內(nèi)其他模型拉開了差距，具有了一定的先發(fā)優(yōu)勢(shì)和市場(chǎng)打開度，更容易在這場(chǎng)白熱化競(jìng)爭(zhēng)中生存下來。

既然大模型很難“速成”，那么創(chuàng)業(yè)公司的“幻覺”，又是從何而來的呢？

第一種“幻覺”：開源干翻閉源

創(chuàng)業(yè)公司紛紛入局大模型，給它們勇氣的，不是梁靜茹，而是開源。

以Meta的Llama 2、智譜AI的ChatGLM為代表的開源大模型，陸續(xù)免費(fèi)并支持授權(quán)商用，這無疑是一件好事，讓創(chuàng)業(yè)公司不用重復(fù)造輪子，可以用開源大模型作為基座模型，快速開發(fā)出相應(yīng)的商用版本大模型或大模型應(yīng)用。

開源的低門檻、低成本，帶來了“開源干翻閉源”的幻覺。

為什么說是幻覺？我們可以從企業(yè)視角為出發(fā)點(diǎn)——即使有了開源模型，想要落地應(yīng)用大模型，還有哪些必要條件？

一是云基礎(chǔ)設(shè)施。

大模型落地需要進(jìn)一步微調(diào)、訓(xùn)練、運(yùn)行，要在云平臺(tái)上運(yùn)行。而創(chuàng)業(yè)公司跟OpenAI 、百度等閉源頭部公司的一大差距，就在于缺少跟云平臺(tái)的“緊耦合”。

眾所周知，OpenAI有微軟的大力支持，百度文心大模型背后是百度智能云，這些大廠自研大模型，都對(duì)云基礎(chǔ)設(shè)施的計(jì)算硬件集群、資源調(diào)度等，進(jìn)行針對(duì)性的協(xié)調(diào)優(yōu)化，大模型+AI云的緊密配合，可以更高效地利用計(jì)算資源，降低大模型的邊際成本。

海外大模型開源社區(qū)的“明星”如Together會(huì)為企業(yè)客戶提供開源模型及配套的云平臺(tái)，MosaicML也提供Mosaic Cloud 和多云混合服務(wù)，國(guó)內(nèi)的開源項(xiàng)目如ChatGLM，也選擇與多家云廠商合作。

可以看到，開源項(xiàng)目跟云平臺(tái)的“松耦合”，會(huì)受到云平臺(tái)的配合度、商業(yè)政策等的影響，一旦后期出現(xiàn)資源漲價(jià)、利益分成、研發(fā)意向變化，都會(huì)給基于開源的大模型項(xiàng)目帶來商業(yè)化風(fēng)險(xiǎn)。

其次，是二次開發(fā)。

基于開源模型的創(chuàng)業(yè)公司，往往是在底座模型的基礎(chǔ)上做一些微調(diào)，靈活有余，但開源模型的分支多、變異快、創(chuàng)新迭代速度快，不承諾任何確定性，一般由程序員自組織來完成開發(fā)，這就導(dǎo)致基于開源的大模型穩(wěn)定性不足，對(duì)客戶技術(shù)團(tuán)隊(duì)二次開發(fā)能力要求很高，選型難度也很大。

目前看，第一梯隊(duì)的大廠推出的基礎(chǔ)大模型，更能滿足企業(yè)對(duì)大模型穩(wěn)定性、可靠性的需求。

因?yàn)殚]源大模型，遵循的不是開源范式，而是工程范式，所以，會(huì)以保證開發(fā)質(zhì)量為前提，對(duì)用戶需求進(jìn)行明確的描述，組織工程師按照規(guī)范的開發(fā)流程和周期，以確定的時(shí)間和預(yù)算，更好的控制開發(fā)質(zhì)量，保證開發(fā)效率。

開源是一件好事，但開源并不是一把萬能鑰匙。如果不解決基礎(chǔ)設(shè)施、二次開發(fā)等瓶頸，創(chuàng)業(yè)公司也無法靠開源，快速取得成功。

第二個(gè)“幻覺”：三五個(gè)人干翻大廠

因?yàn)殚_源，創(chuàng)業(yè)公司和互聯(lián)網(wǎng)企業(yè)都可以叫賣大模型，這就產(chǎn)生了第二個(gè)“幻覺”：三五個(gè)人的創(chuàng)業(yè)團(tuán)隊(duì)，就能干翻AI大廠。

需要注意的是，“百模大戰(zhàn)”帶來了白熱化的淘汰賽，同時(shí)，大模型還在以周為單位進(jìn)行迭代。

在激蕩的市場(chǎng)競(jìng)爭(zhēng)中，具有長(zhǎng)期研發(fā)能力和投入意愿的大廠，更容易保持動(dòng)態(tài)的生長(zhǎng)力和持久的話語(yǔ)權(quán)，體現(xiàn)在幾個(gè)方面：

一是模型本身的技術(shù)城池。

谷歌研發(fā)人員此前曾發(fā)文稱，因?yàn)殚_源，谷歌和OpenAI都沒有護(hù)城河。這在長(zhǎng)期看是對(duì)的，但大廠在大模型技術(shù)上的領(lǐng)先性，也是現(xiàn)實(shí)存在的優(yōu)勢(shì)，這個(gè)技術(shù)代差，足以在大模型的商用周期中，為大廠帶來顯著的競(jìng)爭(zhēng)優(yōu)勢(shì)。

而且，大模型具有數(shù)據(jù)上的“飛輪效應(yīng)”，更早應(yīng)用、更多用戶的大廠大模型，會(huì)不斷拉大效果差距。比如國(guó)內(nèi)最早推向大眾的文心大模型，其3.5版本已經(jīng)在一些基準(zhǔn)測(cè)試中，超過了GPT3.5的表現(xiàn)，而宣稱達(dá)到GPT-3.5的Llama 2剛開源不久，因此目前國(guó)產(chǎn)開源大模型最多也就達(dá)到GPT-3的水平。

二是持續(xù)迭代的成長(zhǎng)能力。

大模型落地不是一蹴而就的，企業(yè)應(yīng)用大模型也不能上馬后很快不了了之，后續(xù)的算力成本、數(shù)據(jù)工程負(fù)擔(dān)、每一次迭代的資金壓力，很快就成為困擾很多大模型公司的頭疼問題。

目前，已經(jīng)有不少曾經(jīng)想走商業(yè)閉源路線的大模型創(chuàng)業(yè)公司，直接宣布退出競(jìng)爭(zhēng)。光年之外中途離場(chǎng)，被美團(tuán)接手；Hugging Face專注賣算力資源和咨詢業(yè)務(wù)，做大模型更多是“面子工程”。部分企業(yè)的表現(xiàn)，也會(huì)直接影響到市場(chǎng)對(duì)其“是否有錢繼續(xù)做大模型”的信心。

從成長(zhǎng)性看，有資金實(shí)力、基礎(chǔ)設(shè)施完整、商業(yè)表現(xiàn)良好的大廠，才能陪企業(yè)用戶走得更遠(yuǎn)。

比如“文心一言”3月16日推出以來，在一個(gè)月內(nèi)完成4次迭代，將推理成本降為原來的十分之一，離不開百度在大模型上的長(zhǎng)期投入，以及人、錢、卡、基建等多種方面的儲(chǔ)備，才讓文心一言可以持續(xù)進(jìn)化，在高速迭代的大模型競(jìng)爭(zhēng)中保持領(lǐng)先。

三是完善的工具鏈。

沒有人會(huì)否認(rèn)，大模型是拿來用的，不是為了當(dāng)擺設(shè)或“公關(guān)效應(yīng)”的。

要用，就要考慮到技術(shù)和場(chǎng)景的適配。不同行業(yè)和企業(yè)對(duì)于大模型落地的需求，可能是完全不同的，這種差異化，需要更完善、全面的配套工具，來降低應(yīng)用門檻。舉個(gè)例子，行業(yè)+大模型需要進(jìn)行專有數(shù)據(jù)的清洗、標(biāo)注、向量化等工作，這個(gè)過程是非常復(fù)雜的。

三五人的創(chuàng)業(yè)團(tuán)隊(duì)，很難將主要研發(fā)力量，放在開發(fā)這些看上去技術(shù)含量不高、但對(duì)用戶十分重要的工具上。

這時(shí)候，百度等大廠長(zhǎng)期押注AI的優(yōu)勢(shì)就凸顯出來了，已經(jīng)沉淀了從數(shù)據(jù)集、模型訓(xùn)練、開發(fā)部署等整套流程的工具，并且開箱即用，把大模型到產(chǎn)業(yè)落地的門檻不斷降低，從而開啟增長(zhǎng)飛輪。

四是長(zhǎng)期積累的行業(yè)Knowhow。

大模型產(chǎn)業(yè)化，走向ToB和ToG是大勢(shì)所趨，要求對(duì)行業(yè)Knowhow有深層次的理解。因此，政企客戶在大模型選型時(shí)，非常看重廠商的成功案例和行業(yè)服務(wù)經(jīng)驗(yàn)。

AI大廠在產(chǎn)業(yè)已經(jīng)深耕多年，因此大模型的商業(yè)開發(fā)度更高。目前，百度“文心大模型+飛槳深度學(xué)習(xí)框架”的組合已與300多家客戶合作，在400多個(gè)企業(yè)場(chǎng)景中取得良好測(cè)試效果，并打造了10多個(gè)行業(yè)大模型。

與之相比，還沒有走通產(chǎn)業(yè)場(chǎng)景的創(chuàng)業(yè)公司，在技術(shù)體驗(yàn)、功能創(chuàng)新、工程能力等細(xì)節(jié)上，可能還需要花費(fèi)更多時(shí)間去摸索。

從這些角度看，頭部大模型已經(jīng)建立起了較為明顯的優(yōu)勢(shì)，并且還在持續(xù)進(jìn)化。三五人的創(chuàng)業(yè)公司，想要在高速迭代的大模型競(jìng)爭(zhēng)中干翻大廠，需要補(bǔ)的課有點(diǎn)多。

第三個(gè)“幻覺”：大模型能“賺快錢”

創(chuàng)業(yè)公司通過“資金換規(guī)模”的短平快戰(zhàn)略，上市融資再套現(xiàn)離場(chǎng)，來兌現(xiàn)投資回報(bào)，已經(jīng)越來越難了，在大模型領(lǐng)域并不現(xiàn)實(shí)。那么，另一條路就是通過ToB客戶付費(fèi)，來完成大模型的商業(yè)化。

眾所周知，ToB行業(yè)要干苦活累活。

企業(yè)客戶在業(yè)務(wù)場(chǎng)景中接入大模型，可能帶來一系列復(fù)雜的整合動(dòng)作，是一個(gè)體系化工程，這就要求大模型廠商不能單一快節(jié)奏地交付，而要提供解決方案式的整體能力，以及長(zhǎng)時(shí)間的更新運(yùn)維服務(wù)。

一個(gè)項(xiàng)目的交付、運(yùn)維、迭代、回款等，可能以年計(jì)，是無法快進(jìn)快出的。所以，大模型下沉到行業(yè)，必須打消“賺快錢”的念頭，以長(zhǎng)期主義的心態(tài)來做生意。

構(gòu)建服務(wù)團(tuán)隊(duì)、形成服務(wù)基因，對(duì)創(chuàng)業(yè)公司及其背后的投資機(jī)構(gòu)的耐心和定力來說，是不小的考驗(yàn)。

與之相比，大廠在長(zhǎng)期走向ToB/ToG市場(chǎng)的過程中，已經(jīng)經(jīng)歷了客戶的捶打，鍛煉出了更加成熟的服務(wù)鐵軍，也證明了自身的定力。

以百度為例，對(duì)于不同行業(yè)，有深入了解客戶的交付、運(yùn)維和保障專屬團(tuán)隊(duì)，在大模型落地應(yīng)用時(shí)，能夠給予更具針對(duì)性的方案，從而減少無效支出，讓大模型更好地幫助企業(yè)提質(zhì)增效。

大模型廠商不能一心只想“賺快錢”，要沉下心來走向產(chǎn)業(yè)深處。同樣的，企業(yè)引入大模型也不能一心只“圖便宜”，要從智能化轉(zhuǎn)型升級(jí)的這個(gè)生命周期出發(fā)算總賬，綜合考慮改造、交付、運(yùn)維等多項(xiàng)成本。

大模型強(qiáng)大的理解能力和泛化能力，會(huì)加速產(chǎn)業(yè)智能化的進(jìn)程，也讓AI企業(yè)和創(chuàng)業(yè)公司發(fā)現(xiàn)了新的機(jī)會(huì)。

就像啤酒總是伴隨著泡沫，在一擁而上的大模型創(chuàng)投熱潮中，創(chuàng)業(yè)公司和企業(yè)客戶也很容易陷入“速成幻覺”。

大模型走向產(chǎn)業(yè)的長(zhǎng)路，更需保持冷靜和理性，警惕“爛尾”風(fēng)險(xiǎn)。希望大家真正飲下的，是用時(shí)間和技術(shù)沉淀的精釀，而非隨時(shí)可能消失的“泡沫”。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
31521

瀏覽量
270339
ChatGPT

ChatGPT

+關(guān)注

關(guān)注
29

文章
1568

瀏覽量
8061
文心一言

文心一言

+關(guān)注

關(guān)注
0

文章
125

瀏覽量
1328
大模型

大模型

+關(guān)注

關(guān)注
2

文章
2548

瀏覽量
3169

評(píng)論

相關(guān)推薦

穿過幻覺荒野，大模型RAG越野賽

檢索與AI，整合出廣闊未來

發(fā)表于 01-28 14:18 ?2307次閱讀

穿過<b class='flag-5'>幻覺</b>荒野，大<b class='flag-5'>模型</b>RAG越野賽

名單公布！【書籍評(píng)測(cè)活動(dòng)NO.52】基于大模型的RAG應(yīng)用開發(fā)與優(yōu)化

（Retrieval-Augmented Agenerated，檢索增強(qiáng)生成）與Agent（AI智能體）。本篇小棗君首先嘗試用通俗易懂的語(yǔ)言幫助大家認(rèn)識(shí)RAG這一重要應(yīng)用形式。 01 了解大模型的“幻覺” 在了解為什么出現(xiàn)RAG之前

發(fā)表于 12-04 10:50

李彥宏：大模型行業(yè)消除幻覺，iRAG技術(shù)引領(lǐng)文生圖新紀(jì)元

在近日舉辦的百度世界大會(huì)上，百度創(chuàng)始人李彥宏分享了關(guān)于大模型行業(yè)的最新觀察。他指出，過去24個(gè)月里，大模型行業(yè)經(jīng)歷了顯著的變化，其中最引人注目的是大模型已基本消除了幻覺現(xiàn)象。這一進(jìn)步標(biāo)

發(fā)表于 11-14 11:39 ?369次閱讀

TaD+RAG-緩解大模型“幻覺”的組合新療法

TaD：任務(wù)感知解碼技術(shù)（Task-aware Decoding，簡(jiǎn)稱TaD），京東聯(lián)合清華大學(xué)針對(duì)大語(yǔ)言模型幻覺問題提出的一項(xiàng)技術(shù)，成果收錄于IJCAI2024。 RAG：檢索增強(qiáng)生成技術(shù)

發(fā)表于 07-16 15:01 ?2202次閱讀

TaD+RAG-緩解大<b class='flag-5'>模型</b>“<b class='flag-5'>幻覺</b>”的組合新療法

阿里達(dá)摩院提出“知識(shí)鏈”框架，降低大模型幻覺

近日，阿里巴巴達(dá)摩院（湖畔實(shí)驗(yàn)室）攜手新加坡南洋理工大學(xué)等研究機(jī)構(gòu)，共同推出了大模型知識(shí)鏈（CoK）框架。該框架不僅可實(shí)時(shí)檢索異構(gòu)知識(shí)源，還能逐步糾正推理錯(cuò)誤，有效提高了大模型在回答知識(shí)型問題時(shí)的準(zhǔn)確率，并顯著降低了所謂的“幻覺

發(fā)表于 05-10 11:46 ?750次閱讀

【大語(yǔ)言模型：原理與工程實(shí)踐】大語(yǔ)言模型的應(yīng)用

“幻覺”。此外，大語(yǔ)言模型僅限于生成文字，無法獨(dú)立調(diào)用API以滿足多樣化需求。例如，當(dāng)詢問“查詢今天的天氣”時(shí)，它會(huì)拒絕請(qǐng)求，缺乏根據(jù)環(huán)境反饋調(diào)整行為的能力。動(dòng)態(tài)調(diào)整行為及克服“幻覺”現(xiàn)象是大語(yǔ)言

發(fā)表于 05-07 17:21

【大語(yǔ)言模型：原理與工程實(shí)踐】大語(yǔ)言模型的評(píng)測(cè)

大語(yǔ)言模型的評(píng)測(cè)是確保模型性能和應(yīng)用適應(yīng)性的關(guān)鍵環(huán)節(jié)。從基座模型到微調(diào)模型，再到行業(yè)模型和整體能力，每個(gè)階段都需要精確的評(píng)測(cè)來指導(dǎo)

發(fā)表于 05-07 17:12

【大語(yǔ)言模型：原理與工程實(shí)踐】大語(yǔ)言模型的預(yù)訓(xùn)練

進(jìn)行損失計(jì)算，得到下一個(gè)目標(biāo)的預(yù)測(cè)。也會(huì)設(shè)計(jì)一些其他輔助訓(xùn)練任務(wù)，與主任務(wù)共同訓(xùn)練。選擇合適的預(yù)訓(xùn)練數(shù)據(jù)是確保模型性能和泛化能力的關(guān)鍵，通過對(duì)預(yù)訓(xùn)練數(shù)據(jù)進(jìn)行混合配比，以確保能夠獲得全面均衡的訓(xùn)練。預(yù)訓(xùn)練遇到的主要問題涉及訓(xùn)練穩(wěn)定性的問題，思維練如何出現(xiàn)幻覺現(xiàn)象，處理更

發(fā)表于 05-07 17:10