9月12日,由工業(yè)和信息化新聞宣傳中心承辦的“算力服務(wù)高質(zhì)量發(fā)展論壇”在2024中國(guó)國(guó)際服務(wù)貿(mào)易交易會(huì)期間召開(kāi),九章云極DataCanvas公司AI首席科學(xué)家繆旭受邀出席論壇,并發(fā)表“大模型后訓(xùn)練時(shí)代的算力服務(wù)思考”主旨演講。
本次論壇以“以算凝力,融創(chuàng)未來(lái)”為主題,匯聚來(lái)自政、產(chǎn)、學(xué)、研界多位重量嘉賓,剖析算力產(chǎn)業(yè)最發(fā)展新趨勢(shì),分享算力基礎(chǔ)設(shè)施建設(shè)實(shí)踐經(jīng)驗(yàn),共同探討算力服務(wù)高質(zhì)量發(fā)展之道。
論壇上,繆旭先生在演講中表示,隨著基礎(chǔ)模型面臨的挑戰(zhàn)不斷升級(jí)與復(fù)雜化,大模型后訓(xùn)練模式正在崛起,成為應(yīng)對(duì)上述挑戰(zhàn)的關(guān)鍵路徑。然而后訓(xùn)練模式的復(fù)雜性與高度定制化需求,對(duì)算力資源的精準(zhǔn)調(diào)度、靈活配置和高效利用提出了前所未有的高標(biāo)準(zhǔn)挑戰(zhàn),企業(yè)亟需高質(zhì)量、高效能、更經(jīng)濟(jì)、更好用的算力服務(wù)新范式。
九章云極DataCanvas公司AI首席科學(xué)家繆旭發(fā)表演講
更自動(dòng)、更高效、更精準(zhǔn),大模型后訓(xùn)練模式崛起
繆旭指出,當(dāng)前基礎(chǔ)模型發(fā)展迅猛,擁有廣泛的行業(yè)應(yīng)用潛力,但也面臨著提示詞工程復(fù)雜度高、難以規(guī)避的幻覺(jué)問(wèn)題、規(guī)劃能力不足以及高昂的成本負(fù)擔(dān)等核心挑戰(zhàn)??娦癖硎荆ㄟ^(guò)大模型后訓(xùn)練策略的補(bǔ)足,可以有效應(yīng)對(duì)上述瓶頸。
大模型后訓(xùn)練的核心策略為,在大模型基礎(chǔ)訓(xùn)練完成后,通過(guò)使用新的數(shù)據(jù)集或任務(wù)對(duì)模型進(jìn)行再次訓(xùn)練,以提高模型的適應(yīng)性和性能。這個(gè)過(guò)程通常包含提示詞設(shè)計(jì)、模型微調(diào)、embedding優(yōu)化及調(diào)度優(yōu)化等多個(gè)環(huán)節(jié)。
具體而言,大模型后訓(xùn)練的過(guò)程如下:將復(fù)雜的業(yè)務(wù)邏輯梳理并封裝成獨(dú)立的、可管理的任務(wù)模塊;隨后針對(duì)每個(gè)單一任務(wù)模塊實(shí)施精準(zhǔn)的后訓(xùn)練微調(diào),以增強(qiáng)其針對(duì)特定任務(wù)的適應(yīng)性和性能。在完成模塊集成重組后,結(jié)合業(yè)務(wù)系統(tǒng)及用戶(hù)的互動(dòng)反饋,持續(xù)進(jìn)行自我學(xué)習(xí)和自我增強(qiáng),最終實(shí)現(xiàn)模型性能自動(dòng)、高效的持續(xù)提升。
大模型后訓(xùn)練方法的補(bǔ)足
新標(biāo)準(zhǔn)、新需求、新模式,普惠算力開(kāi)啟AI新時(shí)代
在大模型后訓(xùn)練的過(guò)程中,算力調(diào)度尤為關(guān)鍵,包括訓(xùn)練期的數(shù)據(jù)準(zhǔn)備調(diào)度、微調(diào)任務(wù)編排,以及推理階段的動(dòng)態(tài)加載和異構(gòu)算力管理。通過(guò)在調(diào)度過(guò)程中引入可訓(xùn)練的調(diào)度模型,在優(yōu)化目標(biāo)時(shí)增加效率和成本計(jì)算,結(jié)合線(xiàn)上、線(xiàn)下收集的數(shù)據(jù)持續(xù)優(yōu)化調(diào)度模型,可以從軟件層面有效提升算力調(diào)度能力,并降低計(jì)算成本,使算力應(yīng)用更加貼近實(shí)際應(yīng)用場(chǎng)景。
不同任務(wù)工作流的安排調(diào)度
在數(shù)據(jù)存儲(chǔ)與處理的關(guān)鍵環(huán)節(jié),大模型后訓(xùn)練模式對(duì)系統(tǒng)的安全性提出了更高要求,以確保算力資源能夠無(wú)縫且安全地融入各類(lèi)業(yè)務(wù)系統(tǒng)。依托業(yè)務(wù)系統(tǒng)與互聯(lián)網(wǎng)的海量數(shù)據(jù)資源,以任務(wù)為驅(qū)動(dòng),大模型可以智能識(shí)別任務(wù)需求,自動(dòng)收集并處理所需數(shù)據(jù),生成高質(zhì)量的微調(diào)數(shù)據(jù)集。此外,應(yīng)用存算一體架以構(gòu)可以有效降低數(shù)據(jù)傳輸?shù)膸捪模嵘龜?shù)據(jù)處理的整體效率與安全性。
面對(duì)不同行業(yè)、不同場(chǎng)景的多樣化大模型后訓(xùn)練需求,基于Alaya NeW高效的算力管理內(nèi)核,九章云極DataCanvas公司提出國(guó)際首創(chuàng)的算力服務(wù)新范式,憑借統(tǒng)一性能基準(zhǔn)、資源管理優(yōu)化、方便估算成本收益、算力一體化等優(yōu)勢(shì),提出了統(tǒng)一的算力服務(wù)計(jì)量單位“度”(DCU),并用其實(shí)現(xiàn)標(biāo)準(zhǔn)化的算力計(jì)量計(jì)費(fèi),讓算力消費(fèi)者輕松獲得好用、經(jīng)濟(jì)、普惠的算力服務(wù),實(shí)現(xiàn)算力資源0浪費(fèi)。此外,通過(guò)提供完整的大模型+Agent開(kāi)發(fā)工具鏈,Alaya NeW為各行業(yè)用戶(hù)提供靈活的大模型和AI Agent定制能力,加速人工智能技術(shù)在各領(lǐng)域的深度融合與廣泛應(yīng)用。
作為國(guó)內(nèi)領(lǐng)先的人工智能基礎(chǔ)設(shè)施提供商,九章云極DataCanvas公司將繼續(xù)堅(jiān)持AI技術(shù)的自主創(chuàng)新,以領(lǐng)先的AI智算產(chǎn)品推動(dòng)算力服務(wù)向更高質(zhì)量、更高水平邁進(jìn),深度賦能千行百業(yè)的數(shù)智化轉(zhuǎn)型。
-
AI
+關(guān)注
關(guān)注
87文章
31536瀏覽量
270344 -
算力
+關(guān)注
關(guān)注
1文章
1016瀏覽量
14959 -
大模型
+關(guān)注
關(guān)注
2文章
2551瀏覽量
3172
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論