文|周鑫雨
編輯|蘇建勛
沉寂許久的大模型競技場,在這個夏天,又硝煙四起。
最近一場戰(zhàn)役,發(fā)生在剛剛落幕的"AI 春晚 "WAIC(世界人工智能大會)期間。貼身對壘的三方,是六小虎中的階躍星辰和智譜,以及大廠中的模型強(qiáng)隊(duì),阿里。
7 月 25 日,階躍計(jì)劃開源最新的多模態(tài)推理模型:Step-3。同一天,阿里又發(fā)布了全新的通義千問 3 推理模型。
28 日,智譜發(fā)布了最新一代基座大模型:GLM-4.5。而阿里的攻勢不斷——再次在同一天,阿里放出了多模態(tài)大禮包,開源了通義萬相 2.2,涵蓋文生視頻、圖生視頻、統(tǒng)一視頻生成三種模態(tài)。
其中頗有火藥味的一幕是:7 月 25 日,最新的通義千問 3,還被阿里冠以 " 全球最強(qiáng) " 之名;三天后,GLM-4.5 就以新王之姿成了全球開源模型的 "SOTA"(最強(qiáng))——在智譜放出的綜合性能榜單中,GLM-4.5 排全球第 3,通義千問 3 排第 9。
一名智譜員工告訴《智能涌現(xiàn)》,算法團(tuán)隊(duì)幾乎所有人都守著通義千問的更新," 太緊張了。" 他說," 萬一差距太大,我們后發(fā)就是個笑話。"直到 GLM-4.5 跑贏 Agentic 能力在內(nèi)的多個測評集,他心中的石頭才落地。
WAIC 上的硝煙,是這兩個月以來六小虎模型混戰(zhàn)的一個縮影。
早在 6 月,在為期 5 天的發(fā)布日中,MiniMax 開源的推理模型 M1,在上下文長度和工具使用場景中領(lǐng)跑了所有開源權(quán)重模型;視頻生成模型 Hailuo 2,在海外創(chuàng)造了 " 小貓?zhí)?" 等爆款視頻。
僅過了一個月,月之暗面的新開源基礎(chǔ)模型 K2,又以橫掃之勢,拿下了 24 項(xiàng)開源模型 SOTA。
轉(zhuǎn)型后的百川智能和零一萬物,既缺席了 WAIC,也缺席了新一輪的模型混戰(zhàn)。
DeepSeek V3、R1 發(fā)布后,六小虎在市場上已經(jīng)沉寂了近半年。
高管離職、人才出走,也已是常態(tài)。脈脈的一份報(bào)告顯示,截至 2025 年 7 月初,六小虎中 41.07% 的員工都把狀態(tài)設(shè)置成了 " 看機(jī)會 "。
后 DeepSeek 時代的戰(zhàn)役,對六小虎能否回歸舞臺中央,甚至存亡,至關(guān)重要。這份成績單,極大程度影響著公司后續(xù)的資本操作和商業(yè)化進(jìn)展。
更重要的是,在市場口碑下滑、內(nèi)部軍心渙散的半年中,六小虎急需一場翻身仗,向內(nèi)外證明自己仍有留在大模型牌桌上的底氣。
但后 DeepSeek 時代的模型戰(zhàn)役依然艱險(xiǎn)。DeepSeek R1 的掀桌,證明了模型要想一鳴驚人,不僅性能要好,還得發(fā)得早。
被搶先的感覺,至今仍讓不少小虎心悸——我們得知,K2 的訓(xùn)練從 2024 年末就開始籌備,也是月之暗面的自信之作,本計(jì)劃在 2025 年中旬發(fā)布。然而,R1 的搶先發(fā)布,搶走了本可能屬于 Kimi 的榮光。
為了防守,R1 發(fā)布的同一天,月之暗面不得不先釋出帶有遺憾的版本 K 1.5。最后的市場聲量,不盡人意。
K2 發(fā)布后的好口碑,某種程度上也撫平了被 DeepSeek 搶先的創(chuàng)傷。發(fā)布當(dāng)晚,月之暗面聯(lián)合創(chuàng)始人張宇韜則在朋友圈寫下:make kimi great again。
只是,K2 的先聲奪人,讓同樣主打 Coding 和 Agentic 能力的智譜,也感受到了不甘。
我們了解到,為了打贏推理模型的 SOTA 之戰(zhàn),GLM-4.5 的訓(xùn)練已經(jīng)花了將近 3 個月的時間。為了在多智能體任務(wù)上獲得更好的表現(xiàn),智譜甚至沒有堅(jiān)持一以貫之的 Dense(稠密)路線,而是改用了 MOE(混合專家模型)架構(gòu)。
" 一開始 GLM-4.5 是想做國內(nèi)第一個對標(biāo) Claude 4 的模型。" 有從業(yè)者告訴《智能涌現(xiàn)》," 可惜月暗的保密工作做得太好了,K2 發(fā)布當(dāng)天才知道技術(shù)細(xì)節(jié)。"
智譜被月之暗面打了個措手不及,最后一個月緊急加訓(xùn),硬是把 GLM-4.5 的 Coding 和 Agentic 能力,在測評集上拔高到了 " 小斷 "K2 的程度,占住了六小虎最高的山頭。
如今賽場上兵刃相接、針鋒相對,也讓這幾家大模型公司像曾經(jīng)的 2023 年一樣,重回了舞臺中心。
不過,與 2023 年行業(yè) " 重參數(shù)、搞閉源 " 的普遍風(fēng)氣不同,如今的中國模型,已經(jīng)把打響技術(shù)口碑給玩明白了。
自 DeepSeek 起勢后,開源和放出技術(shù)報(bào)告,成了六小虎發(fā)模型的標(biāo)配。
" 模型的第一批用戶,肯定是開發(fā)者,如果沒有抓住開發(fā)者,模型的聲量是很難起來的。" 一名在 WAIC 上的 AI 應(yīng)用開發(fā)者告訴我們。
他將開源,比做大模型觸達(dá)開發(fā)者的門:" 現(xiàn)在找到開發(fā)者是很簡單的,大家都聚集在 Hugging Face、GitHub 上,模型廠商要做的就是把開源鏈接發(fā)到上面。"
開源是門道,剩下的,就要交給技術(shù)實(shí)力。
即便經(jīng)過了動蕩的半年,但六小虎依然擁有遠(yuǎn)超普通創(chuàng)業(yè)公司的資金和人才儲備。
可見的是,在這一輪模型混戰(zhàn)中,六小虎都沒有收獲將彼此碾壓的成績,但各有各的亮點(diǎn):
MiniMax 已經(jīng)坐穩(wěn)了視頻生成的頭部;
Kimi K2 和 GLM-4.5 先后狂攬模型 SOTA;
階躍的 Step-3 則領(lǐng)跑了多模態(tài)這一尚且小眾的賽道。
沒有絕對的贏家,但經(jīng)歷這一輪模型混戰(zhàn)后,六小虎在全球模型戰(zhàn)場上,幾乎都擁有了姓名。
模型開放平臺 OpenRouter 的統(tǒng)計(jì)顯示,2025 年 7 月 28 日,Kimi K2 位居全球模型調(diào)用量的第 6,而 GLM-4.5 在發(fā)布當(dāng)天,就沖上了第 20 的位置。
MiniMax 發(fā)布 Hailuo 2 后,Hailuo AI 的下載量猛增——點(diǎn)點(diǎn)數(shù)據(jù)顯示,Hailuo AI 7 月 22 日的單日下載量,達(dá)到了 11 萬。
上岸的四小虎,獲得了繼續(xù)游戲的續(xù)命符。
連續(xù) 5 天發(fā)布包括 M1 在內(nèi)的模型和產(chǎn)品后,MiniMax 傳來了籌備 IPO 的消息。同樣的,在階躍發(fā)布會上,Step-3 發(fā)布后一錘定音的,是一筆來自上海國投等機(jī)構(gòu)的超 5 億美元融資,以及階躍星辰 CEO 姜大昕口中,"10 億元 " 的年?duì)I收目標(biāo)。
不過,模型之戰(zhàn),還遠(yuǎn)未決出勝者。在以 " 中國不需要這么多的基座模型 " 為共識的前提下,六小虎在模型之戰(zhàn)中,尚未走到可以安心的時刻。
角逐不僅發(fā)生在六小虎內(nèi)部。WAIC 期間阿里的接連猛攻,已為六小虎敲響警鐘——多模態(tài)、Coding、Agent,六小虎無法兼顧的幾個模型方向,大廠卻可以輕松 All in。
對剩余的四小虎而言,新一輪的淘汰賽才剛剛開始。