那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

OpenAI開啟推理算力新Scaling Law,AI PC和CPU的機會來了

愛云資訊 ? 2024-09-27 16:20 ? 次閱讀

OpenAI的新模型o1,可謂是開啟了Scaling Law的新篇章——

隨著更多的強化學習(訓練時計算)和更多的思考時間(測試時計算),o1在邏輯推理能力上已經達到了目前天花板級別。

尤其是在北大給出的一項評測中,**o1-mini**模型的跑分比o1-preview還要高:

wKgZomb2ar-AHVUKAAFwv-IFH54843.png

這就展示一種新的思路和可能性——

**小模型專門加強推理能力,放棄在參數中存儲大量世界知識。**

OpenAI科學家趙盛佳給出的解釋是:

>o1-mini是高度專業化的模型,只關注少部分能力可以更深入。

wKgaomb2ar-AceyIAADWKpJKZ4g63.jpeg

但與此同時,也出現了另一個問題:

若是想讓AI同時掌握高階推理能力和大量知識的任務應該怎么辦?

于是乎,技術的聚光燈再次對焦到了**大模型和RAG的組合**。

具體而言,向量數據庫讓大模型能夠快速有效地檢索和處理大量的向量數據,為大模型提供了更豐富和準確的信息,從而增強了模型的整體性能和應用范圍。

可以說是讓大模型有了“好記憶”,減少出現答非所問的情況。

而且這一次,小模型專業化的新趨勢還對RAG中的向量數據庫提出了更高的要求:

一方面是小模型存儲的知識少了,對于外部知識存儲和檢索的質量要求就更高。

另一方面是AI應用落地的腳步加快,面對多用戶、高并發的場景,對整個系統的性能也更高。

在此背景下,業界先進企業正將目光投向更強大的**分布式向量數據庫**。

向量數據庫代表玩家**星環科技**就和**英特爾**強強聯手,對此提出了一種新解法:

用更強性能的數據中心CPU與酷睿? Ultra支持的AI PC組合,加上專門優化過的分布式向量數據庫,提供更經濟、更通用的方案,有效解決企業部署大模型的瓶頸問題。

分布式向量數據庫推動大模型應用落地

正如我們剛才提到的,RAG的重要組成部分就是外掛的專業知識庫,因此這個知識庫中需得涵蓋能夠精準回答問題所需要的專業知識和規則。

而要構建這個外掛知識庫,常見的方法包括向量數據庫、知識圖譜,甚至也可以直接把ElasticSearch數據接入。

但由于向量數據庫具備對高維向量的檢索能力,能夠跟大模型很好地匹配,效果也較好,所以成為了目前主流的形式。

向量數據庫可以對向量化后的數據進行高效的存儲、處理與管理。

如下圖展示的那樣,數據向量化過程利用了諸如詞向量模型和卷積神經網絡人工智能技術。

wKgZomb2ar-AEPZ8AAIRQVLXz68752.png

通過Embedding過程,這些技術能夠將文本、圖像、音視頻等多種形式的數據轉換成向量形式,并將其存儲在向量數據庫中。

至于向量數據庫的查詢功能,則是通過計算向量間的相似度來實現的。

星環科技所提出的創新成果,便是**無涯·問知Infinity Intelligence**。

這是一款基于星環大模型底座,結合個人知識庫、企業知識庫、法律法規、財經等多種知識源的企業級垂直領域問答產品,可以實現企業級智能問答。

例如面對“國家大基金三期會投向哪些領域”這樣非常專業的問題,無涯·問知不僅可以輕松作答,還能提供相關圖譜、關鍵信息等

而且還能圖文并茂地展示作答:

wKgZomb2ar-AX9cUAAFhxpqqfyM132.png

上傳本地的視頻文件等,無涯·問知“唰唰唰”地就可以做總結:

wKgZomb2asCAJDU-AA9kgavX6zU364.gif

整體來看,無涯·問知在**個人知識庫**上,支持用戶一鍵上傳文檔、表格、圖片、音視頻等多模態數據,快速實現海量多模知識的檢索與智能問答。

在**企業知識庫**方面,則是通過管理端構建企業知識庫后,員工可以基于企業知識庫進行問答,知識庫作為企業內部的知識共享平臺,促進不同團隊和部門之間的協作和信息交流。

除此之外,無涯·問知內置了各大交易所的交易規則、監管要求等常見的**法律法規知識**,用戶可針對法律法規的具體條款、監管規則、試行辦法等提出問題,無涯·問知將提供法律風險預警以及應對建議。

它還內置了豐富的上市公司財報和產業鏈圖譜數據,能夠為金融機構提供全面深入的**投資研究分析工具**。

即便是面對金融、法律等眾多既要求時效性、又要求數據隱私的行業,星環也有無需上云聯網的無涯問知AI PC版,它可以在配備英特爾? 酷睿? Ultra的主流個人電腦上,基于集成顯卡和NPU流暢運行。

它不僅具備強大的本地化向量庫,支持多格式、不限長度的文件資料入庫,還支持影、音、圖、文等多模態數據的“知識化”處理,以及“語義化”查詢和應用能力,極大地豐富了知識獲取和應用場景。

wKgaomb2asCABa6DAACSwl4s5tg786.png

無涯·問知可以算是星環知識平臺Transwarp Knowledge Hub中重要的組成部分,其為用戶打通了從人工智能基礎設施建設到大數據、人工智能等研發應用的完整鏈條。

值得一提的是,TKH同樣提供了AI PC版本,基于本地大模型技術,能夠回答用戶各類問題,為用戶帶來文檔總結、知識問答等全新體驗,同時保障用戶隱私數據安全。

AI PC版本星環大模型知識庫提供本地大模型和遠程大模型供選擇,簡單問題可以由本地模型快速處理,而復雜疑難問題則可以提交給云端大模型進行深入分析。

這種彈性擴展的能力,確保了企業在面對不同挑戰時,都能夠獲得足夠的計算支持。

wKgaomb2ar-Afq8vAADo6DpCDQo617.png

而這一系列產品之所以能夠做到在云端和本地都能提供高效的知識管理和智能化工具,離不開星環科技自研的幾個關鍵技術。

首先就是基于星環自研**向量數據庫Hippo的向量索引技術**,能夠在龐大的數據集中快速精準地召回相關信息,提升了信息檢索的速度和準確性,使模型在處理查詢時更加高效。

wKgZomb2asCAAy2GAAB8kJAG6mk139.png

其次是利用了**圖計算框架**,讓大模型能夠識別實體間的多層次關系,從而進行深度的關聯分析,提供了更為深入和準確的洞察結論。

在**數據**方面,覆蓋官方資訊、門戶類網站、自媒體財經等1600多個信息源,涵蓋了全市場的各類宏觀、價格指數以及大部分新聞數據。

不僅包括通常渠道可獲取的數據,還包含高可信度、擁有第一手資料的新聞合作商數據,同時也對所有官方政策數據進行實時全覆蓋。

但隨著大模型的發展,數據規模可謂是極速暴增,這就對數據庫和智能問答的性能提出更高要求。

因此,數據壓縮、算力提升也成為了各個大模型玩家發力的關鍵點。

在這方面,星環科技與英特爾深度合作,從端側的AIPC到后端的數據中心和云,通過軟硬協同優化為大模型的應用落地打造了可行的方案。

CPU助力向量數據庫應用性能大幅提升

向量數據庫搭配CPU,其實本來就已經是行業內現階段的主流共識。

究其原因,向量相似度檢索、高密度向量聚類等都屬于CPU密集型負載。因此,CPU的性能至關重要。

第五代英特爾? 至強? 可擴展處理器,正是帶來了一系列面向AI時代的關鍵特性更新。

首先,它搭載了更大容量的高帶寬內存,有效緩解了向量數據庫中數據密集型工作負載的內存墻問題。

此外,它還集成了英特爾? AMX(高級矩陣擴展)加速引擎,能高效地處理向量數據庫查詢所需的矩陣乘法運算,并在單次運算中處理更大矩陣。

對于云端部署的版本來說,搭載第五代至強? 處理器后,星環Transwarp Hippo的整體性能較第三代提升高達2.07倍。

那么本地AI算力,是否能支撐在AI PC上使用大模型來支持企業應用呢?

星環嘗試后給出了答案:完全夠用。

從AI PC誕生到現在近一年時間,整體AI算力提升了200%多,能耗又降低了50%。

這背后就要歸功于英特爾? 酷睿? Ultra系列CPU的升級改進了。

最新的英特爾? 酷睿? Ultra 處理器 (第二代)200V系列處理器支持下,整個AI PC平臺算力最高能達到120 TOPS。

特別是其中搭載的第四代NPU,性能比上一代強大4倍,非常適合在節能的同時運行持續的AI工作負載。

wKgZomb2asCAENZ1AAF6Gnt0y40529.png

在軟件層面,英特爾和星環合作,還對數據庫底層做了性能優化。

通過水平擴展架構、基于CPU的向量化指令優化、多元芯片加速等技術,有助于分布式向量數據庫發揮并行檢索能力,為海量、多維向量處理提供強大算力支持。

經過優化后的Transwarp Hippo實現了海量、高維度向量數據處理,并具備低時延、高精確度等優勢。

同時提升了Transwarp Hippo了服務器節點的性能密度,在性能提升的同時,具備更高的每瓦性能,有助于節省單位性能的能耗支出,最終體現為降低總體擁有成本 (TCO)。

存算融合趨勢明顯,CPU大有可為

隨著OpenAI o1系列為代表的大模型不斷革新算法,大模型推理時的算力消耗正在飛速攀升,對支撐大模型運轉的基礎設施平臺提出了更高的要求。

特別是對于需要頻繁訪問外部知識庫的大模型應用,存儲與計算深度融合儼然成為當務之急。

在這一技術變革大潮中,CPU成為其中關鍵角色之一。

此外,英特爾基于CPU的解決方案還為用戶帶來了更具成本優勢的選擇。由于通用CPU擁有成熟、完善的供應鏈體系和生態支持,企業用戶可以獲得穩定可靠的算力供給。

同時,英特爾? 至強? 和酷睿? 處理器能同時覆蓋端側和云側的算力需求,為不同的應用場景提供強大的支持。

展望未來,存算一體化的趨勢將愈發明顯。

從大模型應用的角度看,知識檢索和AI推理將不再涇渭分明,而是深度交織、彼此強化。

在這樣一個智能融合的未來圖景中,CPU作為連接存儲、網絡和各類加速器的紐帶,其地位將變得舉足輕重。

(文章來源:量子位,作者:夢晨 金磊”)

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10902

    瀏覽量

    212996
  • OpenAI
    +關注

    關注

    9

    文章

    1131

    瀏覽量

    6694
  • 大模型
    +關注

    關注

    2

    文章

    2545

    瀏覽量

    3161
收藏 人收藏

    評論

    相關推薦

    CPU\GPU引領,國產AI PC進階

    電子發燒友網報道(文/黃晶晶)當前AI PC已經成為PC產業的下一個浪潮,國產CPU、GPU廠商在PC市場一直處于追趕態勢,
    的頭像 發表于 09-01 02:15 ?5197次閱讀
    <b class='flag-5'>CPU</b>\GPU引領,國產<b class='flag-5'>AI</b> <b class='flag-5'>PC</b>進階

    OpenAI或將推出o3 mini推理AI模型

    近日,據最新消息,OpenAI即將在幾周內推出一款全新的推理AI模型——o3 mini。這一消息由OpenAI的首席執行官Sam Altman在1月17日通過社交媒體平臺X發布的一篇文
    的頭像 發表于 01-21 10:06 ?301次閱讀

    生成式AI推理技術、市場與未來

    OpenAI o1、QwQ-32B-Preview、DeepSeek R1-Lite-Preview的相繼發布,預示著生成式AI研究正從預訓練轉向推理(Inference),以提升AI
    的頭像 發表于 01-20 11:16 ?418次閱讀
    生成式<b class='flag-5'>AI</b><b class='flag-5'>推理</b>技術、市場與未來

    OpenAI即將推出o3 mini推理AI模型

    近日,OpenAI首席執行官Sam Altman在社交媒體平臺X上發表了一篇引人關注的文章。在文章中,他透露了一個重要信息:OpenAI已經成功完成了全新推理AI模型o3 mini版本
    的頭像 發表于 01-20 10:54 ?239次閱讀

    2025年:大模型Scaling Law還能繼續嗎

    ? OpenAI 最近推出了其新的推理模型 o3,該模型在 ARC 數據集上大幅超越了之前的最佳性能(SOTA),并在具有挑戰性的 FrontierMath 數據集上取得了令人驚嘆的結果。很明顯,該
    的頭像 發表于 01-15 14:32 ?121次閱讀
    2025年:大模型<b class='flag-5'>Scaling</b> <b class='flag-5'>Law</b>還能繼續嗎

    中信建投建議關注端側AI模組機會

    中信建投近日發布的研報指出,隨著OpenAI的ChatGPT功能全面接入蘋果設備,包括iPhone、iPad和Mac,端側AI產業的發展正在加速。這一趨勢為AI模組市場帶來了新的機遇。
    的頭像 發表于 12-17 14:05 ?353次閱讀

    蘇茨克維預測:推理AI將帶來不可預測性

    未來的人工智能將展現出類似人類的推理能力。 蘇茨克維強調,隨著AI推理能力的提升,事情將變得更加難以預測。他解釋說,推理能力的增強意味著AI
    的頭像 發表于 12-17 09:55 ?277次閱讀

    如何開啟Stable Diffusion WebUI模型推理部署

    如何開啟Stable Diffusion WebUI模型推理部署
    的頭像 發表于 12-11 20:13 ?166次閱讀
    如何<b class='flag-5'>開啟</b>Stable Diffusion WebUI模型<b class='flag-5'>推理</b>部署

    復旦提出大模型推理新思路:Two-Player架構打破自我反思瓶頸

    AI 領域,近期的新聞焦點無疑是關于「Scaling Law 是否撞墻?」的辯論。這一曾經被視作大模型發展的第一性原理,如今卻遭遇了挑戰。 ? 在這樣的背景下,研究人員開始意識到,與其單純堆砌
    的頭像 發表于 12-06 11:24 ?286次閱讀
    復旦提出大模型<b class='flag-5'>推理</b>新思路:Two-Player架構打破自我反思瓶頸

    CPU推理AI配置新范式

    在當前的人工智能領域,尤其是涉及到深度學習的推理階段,行業普遍認為GPU是唯一的選擇。然而,GPU的成本相對較高,且對于某些特定的應用場景,其高昂的價格和較高的能耗成為了一大負擔。相比之下,CPU
    的頭像 發表于 11-21 01:03 ?376次閱讀
    <b class='flag-5'>CPU</b><b class='flag-5'>推理</b>:<b class='flag-5'>AI</b>算<b class='flag-5'>力</b>配置新范式

    AI推理CPU當道,Arm驅動高效引擎

    AI的訓練和推理共同鑄就了其無與倫比的處理能力。在AI訓練方面,GPU因其出色的并行計算能力贏得了業界的青睞,成為了當前AI大模型最熱門的芯片;而在
    的頭像 發表于 11-13 14:34 ?2637次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b><b class='flag-5'>CPU</b>當道,Arm驅動高效引擎

    OpenAI即將發布“草莓”推理大模型

    科技界迎來新動態,據可靠消息透露,OpenAI正緊鑼密鼓地籌備著一項重大發布——預計在兩周內,將正式推出名為“草莓”的新型AI推理模型,并將其無縫融入ChatGPT服務中。這款以卓越推理
    的頭像 發表于 09-11 16:53 ?586次閱讀

    浪潮信息趙帥:開放計算創新 應對Scaling Law挑戰

    Scaling Law帶來的AI基礎設施Scale up和Scale out的挑戰,數據中心需要以開放創新加速算力系統、管理和基礎設施的全向Scale進程,推動AI產業的創新發展。 ?
    的頭像 發表于 08-15 16:02 ?345次閱讀
    浪潮信息趙帥:開放計算創新 應對<b class='flag-5'>Scaling</b> <b class='flag-5'>Law</b>挑戰

    英特爾助力京東云用CPU加速AI推理,以大模型構建數智化供應鏈

    英特爾助力京東云用CPU加速AI推理,以大模型構建數智化供應鏈
    的頭像 發表于 05-27 11:50 ?588次閱讀
    英特爾助力京東云用<b class='flag-5'>CPU</b>加速<b class='flag-5'>AI</b><b class='flag-5'>推理</b>,以大模型構建數智化供應鏈

    OpenAIAI搜索也要來了,但我們需要這么多AI搜索么

    OpenAI要做AI搜索挑戰谷歌這件事已經傳了很久,傳說中的SearchGPT似乎真的要來了。據軟件開發者TiborBlaho爆料,OpenAIA
    的頭像 發表于 05-10 08:05 ?348次閱讀
    <b class='flag-5'>OpenAI</b>的<b class='flag-5'>AI</b>搜索也要<b class='flag-5'>來了</b>,但我們需要這么多<b class='flag-5'>AI</b>搜索么
    九州百家乐的玩法技巧和规则| 德州扑克 比赛| 皇冠网小说微博| 百家乐官网一拖三| 使用的百家乐官网软件| 百家乐博彩开户博彩通| 太阳城巧克力社区| A8百家乐官网游戏| 玩百家乐官网怎么能赢呢| 万龙百家乐的玩法技巧和规则| 太阳城百家乐游戏| 百家乐官网怎么玩能赢钱| 羊和鼠做生意摆件| 大发888在线娱乐二十一点| 百家乐官网三珠连跳打法| 百家乐游戏公司| 大发888支付宝代充| 至尊百家乐官网qvod| 真人百家乐来博| 大发888官方df888gfxzylc8| 百家乐官网天天乐娱乐场| 澳门百家乐牌例| 六合彩走势图| 千亿娱百家乐官网的玩法技巧和规则| 威尼斯人娱乐平台开户| 长葛市| 凯时百家乐技巧| 顶级赌场下载| 百家乐官网赢钱的技巧是什么| 丽景湾百家乐的玩法技巧和规则 | 棋牌游戏开发公司| 澳门百家乐官网的赢钱不倒翁| 百家乐的路图片| 娱乐城送18元体验金| 發中發百家乐官网的玩法技巧和规则| 珠江太阳城广场| 百家乐官网游戏客户端| 百家乐哪条路准| 百家乐官网路单破解器| 百家乐桌游| 百家乐官网怎么赢博彩正网|