KIMI與海內外主流模型對比及應用方向
Q:KIMI模型是使用MOE模型嗎?現在的算力是否已經很缺,如果用戶量增加,會不會更加缺乏算力?以及這對公司的財務狀況有何影響?
A:是的,KIMI模型使用的是MOE模型。日前算力確實已經相對缺乏,主要是因為用戶增長速度超出預期,導致即便有動態(tài)擴容操作也難以應對突增的流量。就目前而言,算力缺乏的情況已經顯現,公司也在緊急擴容中。
對于算力的問題,雖然目前確實面臨挑戰(zhàn),但不是無解的問題。背后有大公司的支持和注資,如字節(jié)跳動和阿里巴巴,因此從長遠來看,算力的問題是可以得到解決的。
“目前算力確實已經相對缺乏”,“背后有大公司的支持和注資”。關于財務狀況,目前公司確實在燒錢,但這是初期投入,目的是先打磨產品。
現階段雖然燒錢,但公司已經有了一些B端的付費用戶,雖然C端還未開始盈利,預計在不久的將來,隨著問題的解決和用戶基數的增加,公司有望逐步實現商業(yè)化并開始回收投資。“目前公司確實在燒錢”,“預計在不久的將來,公司有望逐步實現商業(yè)化”。
Q:如果DAU達到100萬,對公司的成本消耗有何影響?
A:成本消耗可以通過對用戶平均需求的計算得出。一位用戶大約會產生10萬token的需求,按照平均價格計算,每位用戶的成本大約在50到60元人民幣左右。
因此,如果DAU達到100萬,可以按照這個單價進行估算,得出整體的成本消耗。不過,實際的成本會因人而異,取決于每個用戶的具體需求。“每位用戶的成本大約在50到60元人民幣左右”。
Q:目前對內地與海外主流大模型的能力有何評價?KIMI的應用方向和通用能力是否有區(qū)別?
A:在中文領域,目前國內的一些大模型,例如KIMI,已經在多數維度上超越了GPT-3.5。這些模型在處理中文時已經達到了很高的能力,有的在特定場景下甚至超過了GPT-4。但對于其他一些較為困難的任務,包括結構化信息處理和圖像中潦草文字的識別,KIMI等大模型仍顯示出一些短板。
KIMI模型相較于其他模型,在聯(lián)網搜索、文檔處理和長文分析等功能上具有優(yōu)勢。而在生成能力和語音能力上,目前KIMI還未加入這些模態(tài)。戰(zhàn)略上,KIMI似乎專注于解決具有廣泛需求的關鍵問題,以此為基礎,今后可能會向其他領域拓展。
Q:在評價一個模型的綜合能力時,有沒有行之有效的權威標準?
A:在這個領域很容易出現投機取巧的情況,很多模型廠商不會依賴第三方評價機構的測評結果。企業(yè)通常自建數據庫,并根據其內部的測試結果來評估模型的能力。
在文本領域,多輪對話被用作衡量標準之一,而在圖像領域,則傾向于肉眼評估作品的一致性。目前,國際頂級會議要求用戶研究的結果必須附在論文后面,以提供直觀的用戶感受評分,而不是僅依賴于數值分數。這種用戶體驗方式被認為更權威。
Q:KIMI模型在擴大上下文處理能力時,參數量需要如何改變?
A:在模型的上下文處理能力提升時,參數量也需要相應地進行調整。不過,參數量的增長并非主要目的,而是在提升時需要對權重分配進行改變。參數量與上下文長度的增長并不是簡單的正比關系,而是彼此相關但不是強依賴。
例如,月月醬面模型的參數量僅有幾千億,相比之下GPT模型有幾萬億參數,但月月醬面在處理長上下文能力上可以達到GPT即將推出的版本的近十倍。
Q:KIMI與其他大模型在向量數據庫的使用上有什么不同?KIMI內部是否構建了向量數據庫?
A:在文本模型領域,無論是大型企業(yè)還是KIMI,都會使用數據庫來支持模型的功能。這些數據庫可能是商業(yè)版本,也可能是對開源版本進行了修改。
例如,京東開源的一個現代數據庫、騰訊的VectorDB和百度相關的數據庫在國內較為常用,而國外則有Movers和Chroma等。具體到KIMI,我不太清楚使用的是哪種版本,但其內部一定會有向量數據庫的應用,這是不可或缺的。
Q:全球大模型訓練對算力的需求將如何變化?
A:從目前來看,KIMI的參數量還能夠增長數倍,這對發(fā)展來說是必要的。盡管存在一些稀疏化技術,但大模型訓練對算力的需求仍然在不斷增加。我們之前也做過10萬億參數的模型,并證明了大參數模型對訓練算力是一個重要的因素。
根據趨勢圖,模型的參數量增大會導致對訓練算力的需求大幅增長,但未來的算力需求遠未達到瓶頸。預計到明年,盡管可能達不到10的27次方,但也將接近10的5乘以10的26次方。這表明,即使進行了各種優(yōu)化,訓練端消耗不會大幅下降,算力需求仍舊很大。
中科星圖交流紀要
Q:以具體之前做過的一些項目來說明北斗網格碼技術為推動低空經濟的發(fā)展幫地方政府解決了什么樣的痛點?
A:如衢州的項目是去年年底啟動的,總經費2.5個億。今年的1月8號,北斗伏羲正式中標,第一期是4000萬。春節(jié)前后已經開始在做一定的試運行,現在可以參觀和訪問。
上周衢州市的高毅書記視察了這個項目,給予了非常高的評價。同時將這個項目上報了了浙江省有關領導。浙江省的發(fā)改委也專門安排人來考察這個項目,有望發(fā)展成浙江省第一個低空空域基礎設施建設的試點城市。
該項目中比較核心的一點是北斗網格碼技術在這個體系內發(fā)揮了獨特的作用。首先簡單的介紹一下北斗網格碼的基本原理。北斗網格法的基本原理是講地球從地心到地球外圍50萬公里,通過GeoSOT模型將其劃分成了32級網格體。
最大的網格是整個地球,最小的網格在地球赤道是1.5立方厘米。每一立方厘米都有一個網格,而且有一個整型的二進制數。
在低空就利用米級的網格或者是10米級的網格把低空全部網格化建模。并把被樓宇占據的網格、被電線占據的網格、被樹木占據的網格都標識出來。
沒有被占據的網格,就理論上可以為無人機飛提供飛行,因此這個網格又是一個可計算的網格,因此這樣的話就能形成空中高德的體系。
與高德創(chuàng)始人成從武先生合作,主要的目的是將北斗之星打造成空中高德。空中高德的打造呢就依據這樣一套網格圖,而且能在網格圖上進行導航和路徑規(guī)劃。
確定起點和終點后就可以形成一條導航路線,繞開樓宇和樹木、電線。北京大學陳教授發(fā)明的專利,也折成了一定股份入主到北斗之星。所以北斗之星就作為中科星圖的重要部分,在整個低空建設中處于基礎地位。
衢州的項目叫低空基礎設施建設項目,他是中國最早的在建項目。該項目的特色是把空域網格化后,可以讓不同的無人機在同一個空域融合飛行。
人人都能使用無人機,家家都享受無人機服務,這是低空經濟未來的真正的產業(yè)方向。北斗伏羲創(chuàng)造的這套標準和這張圖,就是融合飛行的基礎設施建設,使衢州今后各個公司都可以同時在一個空間進行飛行,形成產業(yè)的基礎。
Q:衢州的項目執(zhí)行期就是十個月左右,這些訂單是不是今年就能落地?
A:這十個月的訂單已經落地,是4000萬,現在正在做從11月份開始的后階段的投資計劃。
Q:展望這些2.5個億的訂單的完成周期?
A:提出的是兩年,爭取在明年的年底前把2.5億的投資完成。
Q:除了衢州外目前潛在可能合作的城市?
A:每一個省現在都有若干市在參與論證或者是參與項目的計劃。最近正式中標了成都的項目,朝陽的項目,中標通知書已經拿到了。其他各省市的陸陸續(xù)續(xù)會在六月前。
中科創(chuàng)達交流紀要
Q:四季度我們的毛利率有所下降是什么原因?
A:季度拆分對于軟件廠商來講并不是那么精確,因為我們在做一個系統(tǒng)開發(fā)里邊一定是長期的,季度拆分它并不是特別反映實際情況,另外我們投入了新的平臺方向,比如說像我們在鴻蒙系統(tǒng)平臺里面也在投入,我們在整車操作系統(tǒng)里也在投入,同時在端側人工智能里面也在投入,那么這些投入里邊,就項目來講它有一定周期,所以剛開始投入的時候對毛利率還是有影響的。
剛開始投入較大,它的規(guī)模效應還沒有顯現出來,短期來講會有一定的毛利率下降,但拉長時間線來看的話毛利率整體還是可以的。
Q:在主營業(yè)務成本中,硬件產品和材料采購成本有增長,具體涉及到的項目?
A:主要是物聯(lián)網的硬件,因為物聯(lián)網硬件也在發(fā)生很多革命性變革,ai發(fā)展推動端側智能不斷更新,比如蘋果推出了vision pro等等,目前在軟件和ai能力更新的大周期里面,所以我們會有一些前期的布局,會有物料采購備貨,這會讓我們在供應鏈中有很多優(yōu)勢。
Q:aipc這方面的布局?
A:可以說物聯(lián)網領域,包括這個端側領域發(fā)生了非常大的變化,從整個產業(yè)周期來看我們在布局混合ai,其中pc產品跟過去發(fā)生了很大的變化,當它有強算力芯片再加上ai的時候,它未來就會變成一個邊緣計算中心,在以前傳統(tǒng)的pc領域我們之前就投入了,現在aipc會把從芯片再到本身的機器里面的ai能力和它的計算能力進步提升,我們有兩方面能力可以提供,一方面是做windows基于arm架構里面的系統(tǒng)優(yōu)化和本身整合,這個在arm架構里還有很多工作需要去做。
第二點,我們會基于pc產品去做形成aipc的模組,所以這些的業(yè)務展開了一個很大空間,當把整個平臺能力具備的時候,隨著場景增加,是能夠不斷快速迭代滲透的。互聯(lián)網領域非常關鍵的一點是一定要進行平臺化思維,軟件核心的思維進行整個布局。
Q:2024年三大收入板塊會有一個什么成效?
A:從趨勢來看,24年就業(yè)績來講我重點想講的還是產業(yè)變化趨勢,現在的產業(yè)趨勢,就計算機產業(yè)而言,幾天就會發(fā)生翻天覆地的變化,現在產業(yè)趨勢大概是這幾點:
第一點,軟件的重要性毋庸置疑,在所有端側智能里軟件會成為核心。
整個芯片架構在走向復雜,需要通過整個計算模式讓軟件來把所有的軟件、所有的庫和所有的算法集成到一個中央框架里面,這就是加速計算的本質,加速計算的本質就意味著軟件是成中心的核心去定義整個產品。手機廠商、芯片廠商、操作系統(tǒng)廠商一定能夠進行下一代產品的定義和開發(fā),這里面軟件的需求就會爆發(fā)。
第二點就是汽車,從座艙再到駕駛到艙駕融合的趨勢,汽車還是有一個非常強的增長動力。物聯(lián)網業(yè)務從去年上半年來講,些特定產品品類包括客戶來講它本身的產品變化,業(yè)務變化導致有些下滑,從下半年就開始恢復了,今年的物聯(lián)網領域趨勢,aipc也好或者端側智能帶來很多產品創(chuàng)新,物聯(lián)網領域也是積極向好的。整體來看向好,24年會比23年好。
Q:從年報上看我們現金流好轉明顯是因為我們采取了哪些具體措施?物聯(lián)網下半年逐漸好轉是來自哪些產品線?
A:管理層面和整個團隊共同努力,客戶的管理、回款管理,包括整個的效能提升,這都會對經營現金流提升這個有很大影響。AR、VR眼鏡等領域有很多新品,hr平臺、會議視頻系統(tǒng)等這里面都能帶來增長的動力。
單體大客戶掃地機這塊有影響,但其他機器人像割草機器人、服務機器人、消費機器人、電動滑板車等都還是在健康增長的。
Q:創(chuàng)達參與了aipc的哪些環(huán)節(jié),能不能看到價值量的提升?在什么時間段?
A:現在高通等平臺推出了aipc產品,大家對這個產業(yè)比較看好,所以在軟件方面我們是有這種能力的,基于高通的平臺我們做參考設計。每家廠商都不一樣,大概今年aipc的一些訂單會逐漸體現出來。
理想分析師交流紀要
Q:下調指引后全年80萬目標是否有變化?最新的Q1指引是最悲觀假設嗎?
A:65-80萬臺的目標確實有改動,全年銷量增長率是50%-70%(對應銷量指引56w-64w);Q1的指引是相對保守的,但是還需觀察訂單情況。
Q:下調指引的原因?Q1后L789穩(wěn)態(tài)銷量的預期?L6和純電上市節(jié)奏變化?
A:主要是高估了自身的能力,其實我們從增長率角度看依然是ok的,但是去年的表現亮眼,高估了遠超市場預期的指引,但是現在回到了腳踏實地能做到的銷量,主要原因是我們對MEGA節(jié)奏的判斷失誤,這個是最大的判斷錯誤,會導致大量的銷售投入分配失誤。
L6不會有計劃變化,穩(wěn)態(tài)依然是2萬+,可能在車展前后。
Q:MEGA是否會定價和配置修改?MEGA是否會影響毛利?
A:MEGA不會有價格上的調整,更多的是階段錯誤,所以現在圍繞第一批用戶運營展開,他們的NPS是MEGA體量提升的核心;整體毛利Q1依然是維持20%+。目前全年的毛利計劃依然是大于20%。
Q:L系列訂單恢復情況?接下來的純電車型展望?
A:L系列隨著最近宣傳和動作已有回暖,目前進一步的促銷尚未計劃,希望今年的經營質量更高,會在財務數據中的有表現。目前純電尚未披露更多信息。
Q:未來是否降價?降價是否影響品牌力?
A:強調哪怕現在訂單情況比預計差,市占率變化也不大,暫時不考慮降價-不同價格段不一樣,對于豪華品牌來說降價可能會有副作用,目前我們的市占率還是不錯的,就如同想哥在公開信中說的我們忘記了用戶的核心需求短期對銷量欲望過度追求。
資本市場對于短期會有壓力,但是對于公司中長期是非常健康的一件事情。如果豪華品牌新車型降價可能是飲鴆止渴,尤其是在目前市占率沒有出現變化的前提下。
Q:如何平衡銷量和利潤?
A:我們已經放棄了一部分銷量,目前我們是合理的預期,目前一致預期也沒有80萬:利潤方面的指引是超越去年全年,所以我們強調經營效率。
AI如何助力新藥研發(fā)
Q:宏博醫(yī)藥在國內AI制藥領域的競爭優(yōu)勢或者領先的地方在哪里?有哪些主要的競爭對手?
A:宏博醫(yī)藥在AI制藥領域的競爭優(yōu)勢主要體現在與藥化團隊的緊密合作上。我們的團隊大部分成員都是藥化背景,這對于我們作為CRO公司來說非常重要,因為我們的目標是將工具應用得當,發(fā)揮其最大價值。
我們的優(yōu)勢在于能夠有效地利用現有軟件工具,將其應用于實際項目中,從而產生價值。至于競爭對手,任何擁有強大藥化團隊并且在實際項目中有所作為的公司都可能成為我們的競爭對手。
Q:今后技術的大幅提升是否可以完全不需要經驗人員的最后監(jiān)督指導?
A:在短期內,經驗豐富的藥化專家仍然非常重要。盡管量子化學的準確性已經很高,但在實際應用中仍需做很多近似處理。
AI的一個挑戰(zhàn)是需要大量的數據,而目前在AI制藥領域,無論是數據的數量還是質量都遠遠不足。因此,在有限的數據條件下訓練出一個非常準確的模型,而不需要人工干預,目前看來還是很有挑戰(zhàn)的。
Q:CADD和AIDD未來的產業(yè)趨勢如何?CADD的優(yōu)勢是否會在AIDD領域展現?
A:CADD和AIDD各有優(yōu)勢。CADD擅長于分子對接等方面,而AIDD在處理超大規(guī)模虛擬篩選和分子動力學方面可能更有優(yōu)勢。
隨著算法和計算能力的提升,我們希望AIDD能夠在分子對接結合模式的高精度預測方面取得進展。同時,AIDD在進行參數校正和加速整個藥物發(fā)現過程方面也顯示出了其潛力。
Q:國內什么時候可以看到AIDD生成的分子進入臨床?
A:根據最新的研究,AIDD生成的分子已經有進入臨床的案例。這表明AIDD在藥物發(fā)現領域的應用已經開始取得實際成果。
Q:AIDD對算力的要求是怎樣的?是否成熟的GPU集群就足夠?
A:AIDD對算力的要求取決于你要達到的研發(fā)深度。對于分子生成這樣的任務,成熟的GPU集群確實可以滿足基本需求。但如果是進行更復雜的計算,比如尋找隱藏的活性口袋或進行大規(guī)模的分子動力學模擬,就需要更大的算力。
我們對算力的追求實際上是無止境的,因為更高的算力可以讓我們的模擬更加準確和快速。此外,算力的提升還能讓我們模擬的時間延長,或者構建更加完善的體系,從而更真實地模擬藥物與生物體系的相互作用。
Q:國內藥企在AI制藥方面的布局情況如何?
A:國內許多藥企已經開始布局AI制藥,有的是通過自建平臺,有的則是通過與AI公司簽訂戰(zhàn)略合作。自建平臺雖然能夠更貼合企業(yè)自身的需求,但其成熟化需要一定的時間,且成本較高,包括人員、硬件和數據集等方面的投入。因此,很多藥企也對外包的AI制藥服務有需求。
Q:AI在臨床后端的應用有哪些?
A:AI在臨床后端主要應用于病人的篩選。很多藥物臨床試驗失敗的原因是沒有找到合適的病人。通過大數據分析,特別是結合大語言模型的A技術,可以從海量的患者數據中挖掘出最可能受益于特定藥物的病人群體,從而提高藥物研發(fā)的成功率。
Q:哪些環(huán)節(jié)是AI難以優(yōu)化的?
A:目前,化學合成是AI難以優(yōu)化的環(huán)節(jié)之一。雖然現有的自動化技術可以執(zhí)行一些常規(guī)的化學反應,但許多化學反應并不標準化,不太適合全自動化處理。因此,合成化合物的實驗室工作仍然是藥物研發(fā)中的一個挑戰(zhàn),短期內可能還難以通過自動化技術完全解決。
審核編輯:黃飛
-
GPT
+關注
關注
0文章
360瀏覽量
15505 -
算力
+關注
關注
1文章
1012瀏覽量
14954 -
大模型
+關注
關注
2文章
2545瀏覽量
3166 -
Kimi
+關注
關注
0文章
10瀏覽量
61
原文標題:專家訪談匯總:KIMI與海外主流大模型對比
文章出處:【微信號:alpworks,微信公眾號:阿爾法工場研究院】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論