“通用能力突出,專(zhuān)用場(chǎng)景全面,應(yīng)用成熟度優(yōu)秀”。
近日,商湯小浣熊代碼大模型在中國(guó)信通院“可信AI代碼大模型評(píng)估”中,榮獲4+級(jí)最高評(píng)級(jí),成為國(guó)內(nèi)首批通過(guò)該項(xiàng)評(píng)估的企業(yè)之一。
商湯小浣熊在代碼通用能力、專(zhuān)用場(chǎng)景和應(yīng)用成熟度等多個(gè)評(píng)估維度中表現(xiàn)優(yōu)秀。
依據(jù)中國(guó)信通院《智能化軟件工程技術(shù)和應(yīng)用要求 第1部分:代碼大模型》,此次評(píng)估聚焦大模型的通用能力、專(zhuān)用場(chǎng)景能力和應(yīng)用成熟度三大部分,包括16個(gè)能力項(xiàng)、100多個(gè)能力要求,從輸入多樣性、任務(wù)多樣性、語(yǔ)言完備度、結(jié)果可接收性、結(jié)果準(zhǔn)確度等維度,考核代碼大模型的全棧技術(shù)能力。
圖片來(lái)源:中國(guó)信通院
商湯小浣熊作為首批參評(píng)企業(yè)獲得4+級(jí)評(píng)級(jí),是本次評(píng)分最高的代碼大模型之一。中國(guó)信通院測(cè)評(píng)結(jié)果顯示:
通用能力方面,小浣熊在代碼解釋、代碼轉(zhuǎn)換等方面表現(xiàn)突出;
專(zhuān)用場(chǎng)景方面,小浣熊支持網(wǎng)站開(kāi)發(fā)、桌面應(yīng)用開(kāi)發(fā)、移動(dòng)應(yīng)用開(kāi)發(fā)、數(shù)據(jù)庫(kù)開(kāi)發(fā)等多個(gè)場(chǎng)景的開(kāi)發(fā)能力;
應(yīng)用成熟度方面,小浣熊在數(shù)據(jù)分類(lèi)分級(jí)、模型性能、模型服務(wù)可維護(hù)性、風(fēng)險(xiǎn)可控性等方面均表現(xiàn)優(yōu)秀。
「小浣熊家族」是基于商湯“日日新SenseNova”大模型體系打造的 AI Native 生產(chǎn)力系列工具,覆蓋軟件開(kāi)發(fā)、數(shù)據(jù)分析、編程教育等多個(gè)場(chǎng)景,旨在通過(guò)先進(jìn)的人工智能技術(shù)優(yōu)化和提升工作效率。現(xiàn)已推出代碼小浣熊和辦公小浣熊兩位產(chǎn)品成員。
代碼小浣熊是基于大模型的軟件智能研發(fā)助手,覆蓋軟件需求分析、架構(gòu)設(shè)計(jì)、代碼編寫(xiě)、軟件測(cè)試等環(huán)節(jié),滿足用戶代碼編寫(xiě)、編程學(xué)習(xí)等各類(lèi)需求,現(xiàn)已支持Python、Java、JavaScript、C++、Go、SQL等90+主流編程語(yǔ)言和VS Code、JetBrains全家桶、Android Studio等主流IDE。
辦公小浣熊是基于大模型的大模型原生數(shù)據(jù)分析產(chǎn)品,可以通過(guò)用戶的自然語(yǔ)言輸入,自動(dòng)將數(shù)據(jù)轉(zhuǎn)化為有意義的分析和可視化結(jié)果。
小浣熊家族背后的「小浣熊代碼大模型」,在權(quán)威測(cè)試集HumanEval Coding測(cè)試中一次通過(guò)率達(dá)到78.1%,在數(shù)據(jù)分析場(chǎng)景下的數(shù)據(jù)測(cè)試集(1000+題目)中以85.71%的正確率超過(guò)GPT-4。
自上線以來(lái),小浣熊代碼大模型累計(jì)為10萬(wàn)+個(gè)人用戶提供服務(wù),單日代碼生成數(shù)量達(dá)到10億+Tokens,總體平均代碼采納率超過(guò)30%,用戶編碼能效提升達(dá)到20%~78%。
目前,商湯小浣熊代碼大模型已經(jīng)被包括金融、新能源汽車(chē)等行業(yè)在內(nèi)的200+企業(yè)客戶使用,憑借突出的數(shù)理能力覆蓋多元落地場(chǎng)景。
例如,在與金山辦公的合作中,小浣熊代碼大模型助力WPS 365打造更高效釋放場(chǎng)景能力的智能辦公平臺(tái),為用戶多元、碎片化的辦公需求提供新質(zhì)生產(chǎn)力。
此外,基于小浣熊代碼大模型,商湯科技與海通證券合作打造智能研發(fā)助手,輔助金融企業(yè)研發(fā)人員進(jìn)行代碼編程,為開(kāi)發(fā)者提供代碼智能補(bǔ)全與對(duì)話問(wèn)答服務(wù),可輔助生產(chǎn)約20%代碼,降低開(kāi)發(fā)技術(shù)門(mén)檻,有效提高開(kāi)發(fā)效率。
未來(lái),商湯小浣熊將持續(xù)降低大模型技術(shù)的開(kāi)發(fā)和應(yīng)用門(mén)檻,賦能更多場(chǎng)景創(chuàng)新。
-
代碼
+關(guān)注
關(guān)注
30文章
4825瀏覽量
69043 -
商湯
+關(guān)注
關(guān)注
0文章
57瀏覽量
3966 -
大模型
+關(guān)注
關(guān)注
2文章
2545瀏覽量
3163
原文標(biāo)題:首批通過(guò),最高評(píng)級(jí),商湯小浣熊喜提中國(guó)信通院代碼大模型能力評(píng)估“三好生”
文章出處:【微信號(hào):SenseTime2017,微信公眾號(hào):商湯科技SenseTime】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
中國(guó)信通院栗蔚:云計(jì)算與AI加速融合,如何開(kāi)啟智算時(shí)代新紀(jì)元?
![<b class='flag-5'>中國(guó)信</b>通<b class='flag-5'>院</b>栗蔚:云計(jì)算與AI加速融合,如何開(kāi)啟智算時(shí)代新紀(jì)元?](https://file1.elecfans.com//web3/M00/06/66/wKgZPGeKNXiAFb34AADeyO9AE24274.jpg)
首批首家!DataCanvas Alaya NeW智算操作系統(tǒng)通過(guò)中國(guó)信通院“大模型計(jì)算資源調(diào)度平臺(tái)” 標(biāo)準(zhǔn)評(píng)測(cè)
![首批首家!DataCanvas Alaya NeW智算操作系統(tǒng)通過(guò)<b class='flag-5'>中國(guó)信</b>通<b class='flag-5'>院</b>“大<b class='flag-5'>模型</b>計(jì)算資源調(diào)度平臺(tái)” 標(biāo)準(zhǔn)評(píng)測(cè)](https://file1.elecfans.com/web3/M00/05/7C/wKgZPGeAktqATxX0AADezTIW4ZI193.png)
華為云云原生中間件 DCS?&?DMS?通過(guò)中國(guó)信通院與全球 IPv6 測(cè)試中心雙重能力檢測(cè)
![華為云云原生中間件 DCS?&?DMS?通過(guò)<b class='flag-5'>中國(guó)信</b>通<b class='flag-5'>院</b>與全球 IPv6 測(cè)試中心雙重<b class='flag-5'>能力</b>檢測(cè)](https://file1.elecfans.com//web3/M00/02/BA/wKgZO2dhgHiASuQ2AAC249eongM838.png)
權(quán)威認(rèn)證 “圖撲軟件數(shù)字孿生低代碼平臺(tái)”獲中國(guó)信通院檢測(cè)認(rèn)證
中國(guó)信通院發(fā)布“2024云計(jì)算十大關(guān)鍵詞”
![<b class='flag-5'>中國(guó)信</b>通<b class='flag-5'>院</b>發(fā)布“2024云計(jì)算十大關(guān)鍵詞”](https://file.elecfans.com/web2/M00/4E/DC/poYBAGLCjeiALm_WAAAYmfR7Qec474.png)
商湯日日新大模型中標(biāo)上海電信訂單
中交興路入選中國(guó)信通院“卓信大數(shù)據(jù)計(jì)劃”
![中交興路入選<b class='flag-5'>中國(guó)信</b>通<b class='flag-5'>院</b>“卓信大數(shù)據(jù)計(jì)劃”](https://file1.elecfans.com/web2/M00/FD/D0/wKgZomafB-WAXMnDAAAekn39U0A740.png)
商湯科技與泰國(guó)DTGO集團(tuán)聯(lián)合發(fā)布泰語(yǔ)大模型
![<b class='flag-5'>商湯</b>科技與泰國(guó)DTGO集團(tuán)聯(lián)合發(fā)布泰語(yǔ)大<b class='flag-5'>模型</b>](https://file1.elecfans.com/web2/M00/FB/37/wKgZomaPyROAGWE1AAAXGOA2rIs380.jpg)
華為云盤(pán)古研發(fā)大模型榮獲最高評(píng)級(jí),引領(lǐng)行業(yè)創(chuàng)新
首批!數(shù)勢(shì)科技SwiftAgent完成中國(guó)信通院大模型驅(qū)動(dòng)的智能數(shù)據(jù)分析工具專(zhuān)項(xiàng)測(cè)試
![首批!數(shù)勢(shì)科技SwiftAgent完成<b class='flag-5'>中國(guó)信</b>通<b class='flag-5'>院</b>大<b class='flag-5'>模型</b>驅(qū)動(dòng)的智能數(shù)據(jù)分析工具專(zhuān)項(xiàng)測(cè)試](https://file1.elecfans.com//web2/M00/E9/C0/wKgaomZQdCWANMtzAADu8-2pyp8985.png)
中國(guó)信通院主導(dǎo)制定首個(gè)代碼大模型國(guó)際標(biāo)準(zhǔn)
業(yè)界首個(gè)一云多芯遷移標(biāo)準(zhǔn) 中國(guó)信通院聯(lián)合浪潮云海發(fā)布
![業(yè)界首個(gè)一云多芯遷移標(biāo)準(zhǔn) <b class='flag-5'>中國(guó)信</b>通<b class='flag-5'>院</b>聯(lián)合浪潮云海發(fā)布](https://file1.elecfans.com//web2/M00/E4/62/wKgZomY_aSWAL03sAADyub0QpCM961.jpg)
IBM助力客戶贏得中國(guó)信通院“可信AI案例”獎(jiǎng)
商湯科技發(fā)布5.0多模態(tài)大模型,綜合能力全面對(duì)標(biāo)GPT-4 Turbo
加速布局智能制造 三菱電機(jī)與中國(guó)信通院共建重慶智能制造科創(chuàng)中心
![加速布局智能制造 <b class='flag-5'>三</b>菱電機(jī)與<b class='flag-5'>中國(guó)信</b>通<b class='flag-5'>院</b>共建重慶智能制造科創(chuàng)中心](https://file1.elecfans.com//web2/M00/C5/D7/wKgaomX4-MCAIAemAALuWftmyCw645.jpg)
評(píng)論