文 | 光錐智能,作者|魏琳華,編輯|王一粟
"90% 的 Agent 會(huì)被大模型吃掉。"
7 月 15 日,金沙江創(chuàng)投主管合伙人朱嘯虎一如既往地語(yǔ)出驚人,這次炮轟的是近一年 AI 圈最炙手可熱的 Agent。
背后有身為美元基金的 BenchMark 領(lǐng)投、底層模型包含 Gemini、Claude 等一系列海外模型,加之曾陷入缺算力資源的傳聞,Manus 的出走,已經(jīng)印證為形勢(shì)所迫的轉(zhuǎn)移和調(diào)整,而非經(jīng)營(yíng)失敗導(dǎo)致的撤退。
但圍繞以 Manus 為首的通用 Agent,它們頭頂?shù)臑踉粕形瓷⑷ィ阂贿吺?Manus、Genspark 們收入變現(xiàn)的下滑,另一邊是用戶(hù)活躍度的下跌。
這種局面,揭示了當(dāng)下通用 Agent 賽道的核心問(wèn)題:在技術(shù)熱潮和資本狂歡過(guò)后,產(chǎn)品尚未找到能讓廣大 C 端用戶(hù)持續(xù) " 忠誠(chéng) " 并為之付費(fèi)的殺手級(jí)應(yīng)用場(chǎng)景,只能被偶爾拿來(lái)做個(gè)半成品 PPT、找?guī)追輬?bào)告。
通用 Agent 市場(chǎng),正在被模型能力的溢出蠶食,也被垂類(lèi) Agent 搶走份額。
轉(zhuǎn)戰(zhàn)海外,Manus 們?cè)趺戳耍?/strong>
通用 Agent,陷入了一個(gè)尷尬的境地。
在幾個(gè)月的時(shí)間里,通用 Agent 誕生時(shí)的驚艷不復(fù)存在:放在企業(yè)里,它無(wú)法和垂類(lèi) Agent 的精準(zhǔn)比肩;拿到個(gè)人手上,它又沒(méi)有找到更戳中用戶(hù)需求的場(chǎng)景。
模型能力的提升,先對(duì) Agent 們 " 砍了一刀 "。
隨著大模型能力的飛速發(fā)展,模型本身正在變得越來(lái)越 "Agent 化 ",隨著模型性能的溢出,用戶(hù)可以直接調(diào)用模型來(lái)完成任務(wù)。
以目前進(jìn)展更快的 AI 代碼為例,Anthropic 的 Claude、谷歌的 Gemini 系列模型,模型本身的編碼能力就在隨著更新提升,其自研的編碼工具(如 Claude Code)不僅能給實(shí)現(xiàn)自主編程,優(yōu)化種種產(chǎn)品體驗(yàn)之外,它的 Max 會(huì)員模式還支持用戶(hù)隨意調(diào)用自家模型,即使是每百萬(wàn)輸出 tokens 收費(fèi) 75 美元的 Opus 4,單月 200 美元同樣支持不限量使用。
制約 Manus 的成本問(wèn)題,轉(zhuǎn)嫁到用戶(hù)身上,就是不可消除的高訂閱價(jià)。
當(dāng)模型本身就能提供接近 Agent 的體驗(yàn)時(shí),用戶(hù)會(huì)自然傾向于直接使用更便宜、更便捷的模型 API 或?qū)υ?huà)界面,而非額外付費(fèi)使用一個(gè)功能重疊的通用 Agent 產(chǎn)品。這導(dǎo)致一部分市場(chǎng)份額被能力日益強(qiáng)大的基礎(chǔ)模型直接 " 吃掉 "。
面向用戶(hù)來(lái)說(shuō),對(duì)比垂類(lèi) Agent,通用 Agent 在企業(yè)端的應(yīng)用效果不佳,從效率 / 成果衡量,都無(wú)法達(dá)到 " 數(shù)字員工 " 的高度。
朱嘯虎說(shuō) "90% 的 Agent 市場(chǎng)會(huì)被吃掉 ",但他所在的金沙江創(chuàng)投也參與了 AI Agent 項(xiàng)目融資,只是相比于通用 Agent,他更看好能真正跑出效率和實(shí)際落地的產(chǎn)品。
金沙江投資的 Head AI(原 Aha Lab),就是一家靠 AI Agent 做自動(dòng)化營(yíng)銷(xiāo)的公司,現(xiàn)在升級(jí)為 AI 營(yíng)銷(xiāo)產(chǎn)品。用創(chuàng)始人的話(huà)來(lái)說(shuō),只需告訴 Head 你的預(yù)算和網(wǎng)站,它就能自動(dòng)搞定達(dá)人營(yíng)銷(xiāo)、聯(lián)盟營(yíng)銷(xiāo)和 Cold Email ——一個(gè)人解決一個(gè)市場(chǎng)部。
對(duì)于企業(yè)用戶(hù)而言,準(zhǔn)確度和成本是核心訴求。但通用 Agent 目前還無(wú)法與針對(duì)特定場(chǎng)景優(yōu)化的垂類(lèi) Agent 相提并論。
如果把一樣的任務(wù)交給通用 Agent 和企業(yè)內(nèi)部的垂類(lèi) Agent 去做,前者只能靠搜索引擎結(jié)合需求給出結(jié)果,而后者則會(huì)連接到企業(yè)內(nèi)部搭建好的知識(shí)庫(kù),根據(jù)內(nèi)部信息貼合需求輸出,相當(dāng)于后者身上 " 綁 " 了個(gè)更充足的資料庫(kù),結(jié)果不言而喻。
企業(yè)在引入新技術(shù)時(shí),對(duì)成本和風(fēng)險(xiǎn)的控制要求極高。通用 Agent 通?;邶嫶蠖鴱?fù)雜的 " 黑盒 " 模型,其決策過(guò)程不透明,且輸出結(jié)果存在一定的隨機(jī)性(即 " 幻覺(jué) " 問(wèn)題)。對(duì)準(zhǔn)確度要求更高的企業(yè),顯然無(wú)法接受通用 Agent 不穩(wěn)定的輸出質(zhì)量。
一位 Agent 開(kāi)發(fā)者告訴光錐智能,企業(yè)通常需要將 Agent 與內(nèi)部知識(shí)庫(kù)、業(yè)務(wù)流程系統(tǒng)深度集成,部分簡(jiǎn)單的工作則會(huì)通過(guò)工作流來(lái)確保任務(wù)準(zhǔn)確執(zhí)行。
夾在大模型和垂類(lèi) Agent 之間,通用 Agent 被兩者各自瓜分走了一大塊蛋糕。
沒(méi)場(chǎng)景、待進(jìn)化,Agent 才走了個(gè)開(kāi)頭
在 " 用不起來(lái) " 的情況下,用戶(hù)對(duì)通用 Agent 熱情也不復(fù)當(dāng)初。
這也導(dǎo)致,以 Manus 們?yōu)榇淼?C 端通用 Agent 正在面臨增長(zhǎng)放緩、甚至倒退的困境。
雖然從商業(yè)化上來(lái)說(shuō),通用 Agent 確實(shí)展現(xiàn)了足夠吸金的一面。以 Manus、Genspark 等通用 Agent 為代表,近幾個(gè)月的變現(xiàn)成績(jī)證明了這個(gè)賽道的潛力:非凡產(chǎn)研數(shù)據(jù)顯示,今年 5 月,Manus 已經(jīng)達(dá)到 936 萬(wàn)美元 ARR(年化收入),Genspark 更是在發(fā)布 45 天的情況下,達(dá)到 3600 萬(wàn)美元 ARR。
6 月,Manus 訪問(wèn)量為 1781 萬(wàn),和 3 月發(fā)布即登頂?shù)脑L問(wèn)量 2376 萬(wàn)相比,已經(jīng)下跌 25%;Genspark 的訪問(wèn)量也處在來(lái)回浮動(dòng)的狀態(tài),6 月訪問(wèn)量為 842 萬(wàn)次,下降 8%,昆侖萬(wàn)維天工超級(jí)智能體下降 3.7%。
同樣是在 6 月,兩個(gè)商業(yè)化表現(xiàn)突出的產(chǎn)品 Manus 和 Genspark 出現(xiàn)不同程度的收入下跌。據(jù)非凡產(chǎn)研數(shù)據(jù),Manus 當(dāng)月 MRR(月度收入)為 254 萬(wàn)美金,環(huán)比下跌超過(guò) 50%;Genspark 當(dāng)月 MRR 為 295 萬(wàn)美金,環(huán)比下跌 13.58%。
上述數(shù)據(jù)說(shuō)明,在一時(shí)的熱度過(guò)后 ,通用 Agent 類(lèi)產(chǎn)品的使用體驗(yàn)并沒(méi)有能讓用戶(hù)持續(xù)付費(fèi)的吸引力。同時(shí),用戶(hù)體驗(yàn)的頻次也在減弱。
究其原因,還是因?yàn)?Manus 們沒(méi)有找到足夠讓用戶(hù)為之持續(xù)付費(fèi)的 Killer(殺手級(jí))場(chǎng)景。
目前,市場(chǎng)上多數(shù)通用 Agent 都在卷幾個(gè)固定的方向:做 PPT、多模態(tài)能力、寫(xiě)報(bào)告(Deep Research),多聚焦于和辦公強(qiáng)相關(guān)的場(chǎng)景。但對(duì)于用戶(hù)來(lái)說(shuō),這些定位還難以讓用戶(hù)持續(xù)付費(fèi)。
在沒(méi)有找到確切的應(yīng)用方向前,通用 Agent 賽道已經(jīng)有一批公司先靠產(chǎn)品下水測(cè)試,意圖先搶占市場(chǎng)。
變現(xiàn)和流量不穩(wěn)定的情況下,大廠對(duì)自研 Agent 的精力投入有限,一般還是采取 " 兩手抓 " 的模式,在開(kāi)發(fā)自家 Agent 產(chǎn)品之外,目前更多地在推廣自家 Agent 開(kāi)發(fā)平臺(tái)。比如阿里、字節(jié)和百度,推廣平臺(tái)的同時(shí)發(fā)福利、組織 Agent 開(kāi)發(fā)比賽,聚焦開(kāi)發(fā)者生態(tài)搭建。
可以看到,在國(guó)內(nèi)市場(chǎng),除去 Manus 和 GensPark 零星幾家創(chuàng)業(yè)公司,多數(shù)通用 Agent 的開(kāi)發(fā)公司都是手握自研大模型的公司:
其中,大廠不僅有模型,背后還有自家云做支援。通用 Agent 既是產(chǎn)品,也是他們作為 B 端平臺(tái),通過(guò) C 端產(chǎn)品展示能力的一面鏡子,以此招徠更多開(kāi)發(fā)者。
大模型創(chuàng)業(yè)公司則本著 " 模型即 Agent" 的思路,更多在模型層就針對(duì) Agent 對(duì) RL(強(qiáng)化學(xué)習(xí))、長(zhǎng)文本等需求鉆研模型,才有了通用 Agent 產(chǎn)品。
國(guó)內(nèi)通用 Agent 玩家的收費(fèi)模式,也比出海的方式更卷。以百度、字節(jié)為代表的大廠有能力公開(kāi)測(cè)試,免費(fèi)提供服務(wù)。如 MiniMax、天工智能體等則以限量使用或是購(gòu)買(mǎi)積分使用的方式開(kāi)放。和大廠免費(fèi)不限量的手段相比,國(guó)內(nèi)通用 Agent 賽道注定會(huì)越來(lái)越卷,商業(yè)化變現(xiàn)是一條看不到收益的路。
從場(chǎng)景來(lái)看,DeepResearch 式的深度研究功能是更多產(chǎn)品選擇主攻的方向,對(duì)于文檔類(lèi) Agent 來(lái)說(shuō),調(diào)用工具的復(fù)雜程度相對(duì)較低,且文本生成的成本更低,算是一個(gè)更有性?xún)r(jià)比的方向。
在開(kāi)發(fā)深度研究功能的基礎(chǔ)上,各家 Agent 開(kāi)始在多模態(tài)能力和應(yīng)用場(chǎng)景上發(fā)力。一方面,在生成的文檔中插入圖片、視頻等多模態(tài)能力,另一方面,把目前和 Agent 契合的場(chǎng)景植入到通用 Agent 中,比如做 PPT,幾乎成了辦公 Agent 的標(biāo)配。
進(jìn)一步的問(wèn)題是輸出的信息價(jià)值不高。一份報(bào)告,零星只有 3-4 個(gè)信源,更多內(nèi)容從網(wǎng)絡(luò)篩選得來(lái),往往只能得到模棱兩可的 " 廢話(huà) "。比如要它介紹大模型公司的生存挑戰(zhàn),它把開(kāi)公司可能存在的問(wèn)題都列個(gè)遍,既沒(méi)有針對(duì)性,也不具備有價(jià)值的增量信息。
于是,企業(yè)開(kāi)始探索更多 Agent 能匹配的場(chǎng)景,試圖吸引更多用戶(hù)參與。Agent 也難免后續(xù)變成自家公司產(chǎn)品的 " 集合入口 ",被公司用各種方式把自家產(chǎn)品能力整合進(jìn)去,比如 MiniMax 融入了海螺生視頻的能力,百度心響在場(chǎng)景中接入了原有的智能體對(duì)話(huà)等。
除了找不到貼合場(chǎng)景,當(dāng)前 Agent 能力有限,效果不一,也難以讓用戶(hù)為之買(mǎi)單。
通用 Agent 執(zhí)行任務(wù)一般是拆解任務(wù),再按照步驟執(zhí)行。越復(fù)雜的任務(wù),就意味著 Agent 執(zhí)行的過(guò)程更多,其中只要有任何一個(gè)步驟跑出的結(jié)果有問(wèn)題,就會(huì)導(dǎo)致整體輸出結(jié)果質(zhì)量不佳。所以,對(duì)于復(fù)雜任務(wù)來(lái)說(shuō),當(dāng)前 Agent 執(zhí)行的穩(wěn)定性不足。
比如,輸出對(duì)一家公司的分析,就要從財(cái)報(bào)信息抓取、公司網(wǎng)頁(yè)介紹到各大信源的分析點(diǎn)評(píng),其中有任何一個(gè)環(huán)節(jié)結(jié)果出錯(cuò),整體報(bào)告的分析質(zhì)量就會(huì)大打折扣。
當(dāng)下,一些 Agent 開(kāi)發(fā)者正試圖通過(guò)技術(shù)創(chuàng)新來(lái)突破這些瓶頸。
比如 MiniMax 把年初發(fā)布的新的線(xiàn)性注意力機(jī)制用到了新模型 M1 中,其智能體產(chǎn)品以 M1 模型為基座模型。這樣的好處是大幅擴(kuò)展了智能體能夠承載的文本量,支持 100 萬(wàn)的上下文輸入,針對(duì)法律文書(shū)這類(lèi)需要大量文本分析的場(chǎng)景效果更好。
多數(shù)業(yè)內(nèi)人曾在和光錐智能交流中肯定 RL 之于 Agent 的重要性。相比傳統(tǒng)的監(jiān)督學(xué)習(xí)或預(yù)訓(xùn)練模型在特定任務(wù)上表現(xiàn)出色,但其泛化能力往往受限于訓(xùn)練數(shù)據(jù)的分布。當(dāng) Agent 需要處理的任務(wù)場(chǎng)景多樣化、環(huán)境動(dòng)態(tài)變化時(shí),預(yù)設(shè)規(guī)則或僅依賴(lài)一次性推理的 Agent 難以適應(yīng)。
比如,在處理一些需要多個(gè)流程完成的任務(wù)中,傳統(tǒng)模式可能在任一個(gè)環(huán)節(jié)中出現(xiàn)推測(cè)問(wèn)題,進(jìn)而影響到最終結(jié)果,但 RL 則是靠大量試錯(cuò)和獎(jiǎng)勵(lì)機(jī)制來(lái)提升泛化能力,對(duì)于需要多個(gè)步驟處理的復(fù)雜任務(wù),表現(xiàn)效果更好。
可以說(shuō),RL 能夠大幅提升 Agent 的能力上限。
Kimi-Researcher 研究員馮一塵分享,在 Humanity's Last Exam(HLE,人類(lèi)的最后一場(chǎng)考試,衡量 AI 在各學(xué)科難題上的測(cè)試)榜單上,=gent 模型得分從最初的 8.6% 躍升至 26.9%,相比 OpenAI Deep Research 團(tuán)隊(duì)在相關(guān)工作上從 20 分左右(o3)提升到 26.6 分的成果,進(jìn)一步證明了強(qiáng)化學(xué)習(xí)在 Agent 訓(xùn)練上的巨大價(jià)值。
在技術(shù)的天花板還夠高的情況下,后來(lái)者正在拔高 Agent 的能力標(biāo)準(zhǔn)。今日(7 月 18 日),OpenAI 發(fā)布的通用 Agent 產(chǎn)品 ChatGPT Agent 跑出了一個(gè)漂亮的效果,在 HLE 測(cè)試表現(xiàn)上,取得了 41.6% 的新 SOTA 成績(jī)。
Agent 的路還很長(zhǎng),只有靠技術(shù)突破和場(chǎng)景深耕,才能成為真正幫得上忙的 AI 助手。