作者|商業(yè)消費主筆 黃青春
頭圖|視覺中國
字節(jié)跳動 CEO 梁汝波首次公開站臺,給了豆包。
6 月 11 日,字節(jié)跳動旗下火山引擎開了一場發(fā)布會,現(xiàn)場數(shù)位拿著號碼牌的媒體硬是因為主會場人數(shù)爆滿被拒之門外 20 分鐘,即便字節(jié)跳動公關竭力與現(xiàn)場安保交涉兩輪,對講機那頭的負責人仍然不為所動,嚴格遵守出一進一的規(guī)則,導致主會場內很多火山員工為了給媒體騰位置都被迫中途出會場協(xié)同辦公。
即便第三次交涉后虎嗅有幸進入內場,一番閃轉騰挪仍被摩肩接踵的人群堵在了會場最后排的攝像臂旁,仿佛擠進了一節(jié)北京早高峰地鐵車廂,上一次如此夸張的陣仗還是年初春運趕高鐵(不由感慨,時代拋棄你的時候,連發(fā)布會都擠不進去)。
為什么一場產品發(fā)布會搞得這么火爆?
一方面,DeepSeek 憑一己之力掀翻了互聯(lián)網(wǎng),從微信到百度,從美團到小紅書,國民級應用紛紛接入 DeepSeek,唯獨豆包至今依然堅持自研,且字節(jié)系大模型雨后春筍般冒出來,還能始終保持超高的市場聲量,自然會牽動著從業(yè)者乃至媒體、客戶的神經。
比如,發(fā)布會上亮相的豆包 1.6-thinking 在復雜推理、競賽級數(shù)學、多輪對話和指令遵循等測試集上均躋身全球前列;再比如,新發(fā)布的豆包視頻生成模型 Seedance 1.0 pro 在國際知名評測榜單 Artificial Analysis 上,文生視頻、圖生視頻兩項任務均躥至榜首,一舉超越 Veo3、可靈 2.0 等優(yōu)秀模型。
另一方面,火山引擎發(fā)布會上,字節(jié)跳動集團高管亮相是最多的,沒有之一——從楊震原到朱駿,從張楠到洪定坤,這次梁汝波也被拉來站臺,細細咂摸其發(fā)言也能窺見端倪。
梁汝波表示:字節(jié)跳動堅定長期投入,追求智能突破,服務產業(yè)應用——后者只能靠火山引擎落地,而做好火山引擎自然關乎整個字節(jié)跳動的生長路徑。
尤其在 Al 時代,要做好一家創(chuàng)新的科技公司,除了堅定的投入外,還應該將技術開放出去,經過市場檢驗;與之對應,外部反饋也能進一步反哺技術進化,精進內部競爭力。
火山引擎總裁譚待解釋," 火山引擎做到一定程度之后,會盡最大可能把技術紅利釋放出來,因為最重要的是通過技術紅利釋放讓業(yè)界所有開發(fā)者和企業(yè)享受到實惠,這樣他們的 AI 應用也會發(fā)展更快。"
以 2024 年豆包 1.0 發(fā)布為節(jié)點,當時火山引擎在模型結構和工程上做了大量優(yōu)化和讓步,率先將價格降低 99% 從而被行業(yè)戲稱為 " 價格屠夫 ",但隨著其他廠商陸續(xù)跟進降價,中國大模型此后一年的發(fā)展速度確實在提速。
值得一提的是,火山引擎并未因此而陷入 " 補貼陷阱 ":
一方面,接近火山引擎人士透露,目前國內公有云牌桌上,火山的毛利率非常健康、成本控制比其他人優(yōu)秀;
另一方面,自 2021 年下半年著手抓商業(yè)化營收超 10 億元到 2022 年超 20 億元,再到 2023 年近 50 億元、2024 年超 110 億元,營收規(guī)模保持著連年翻番的增長態(tài)勢。
若火山引擎 2025 年真能實現(xiàn)超 230 億營收,將會死死咬住占據(jù)先發(fā)優(yōu)勢的百度智能云(其 2024 年營收 218 億元),甚至有望在 2026 年實現(xiàn)超越。
Agent 的時代來了?
可以這么說,如果將一場發(fā)布會視作一家公司戰(zhàn)略意志投射的細小切口,新品發(fā)布不過是業(yè)務發(fā)展主線上一個個節(jié)點;但這次火山引擎發(fā)布了豆包大模型 1.6,加速 Agent 大規(guī)模應用,則多了一層意義。
譚待認為,互聯(lián)網(wǎng)經歷三個時代的變化,從 PC 到移動再到 AI,最重要就是主體,對應的分別是 Web、APP、Agents。
"Agent 能夠自主規(guī)劃、反思、執(zhí)行任務,圍繞著 Agent 的開發(fā)范式正在發(fā)生根本變化——以前各種架構是為幫助程序員更好去設計,但核心是程序員為理解業(yè)務去規(guī)劃;現(xiàn)在 Agents 很多集成步驟是通過模型策略展開,模型要跟工具、環(huán)境產生交互,這必然需要更好的模型和 Agent 平臺。" 譚待說道。
不止于此,虎嗅了解到,包括方舟發(fā)布的新功能,Prompt Pilot 、Coding Agent、TRAE,還有知識庫及多模態(tài)數(shù)據(jù)湖、安全等一系列方案均需要一個安全的 Agent 平臺。
" 這一系列衍生技術嵌套叫做 AI 云原生,也是火山引擎最早在業(yè)界提出來的。我們希望通過這樣一套從開發(fā)范式到基礎設施再到數(shù)據(jù)安全完整的 AI 原生方案服務企業(yè),豆包 1.6 就是基于此落地的高性價比大模型。" 譚待說完頓了頓,旋即又對性價比做了進一步 " 祛魅 ",主要分三個方面:
一是,此前外界認為是否開啟深度思考,是否做圖文、圖像理解會直接影響大模型成本,實際上同尺寸、同參數(shù)模型,是否開啟深度思考,是否做圖文、圖像理解不會影響模型成本,只會影響上下文窗口——基于此,以前模型深度思考貴一些、圖文理解貴一些是不合理的,火山引擎將價格進行了統(tǒng)一。
二是,上下文窗口是一個累加成本的遞增,但大部分輸入有一個分布區(qū)間,如果在調度上能把不同長度的輸入輸出先 PD 分離再集中調度就可以大幅優(yōu)化成本(注:并行計算如果長度不統(tǒng)一會互相思索,如果將這些架構長短分離,實際上每個區(qū)間成本都可以做定向優(yōu)化)。
三是,AI 大模型最多的應用場景是聊天,但隨著 Agent 開始完成工作流任務,Token 消耗迅速爬升,如何降低 Token 消耗便尤為重要,火山引擎集中將企業(yè)用得最多的區(qū)間成本降低了 63%。
具體到實際使用場景,企業(yè)絕大部分請求輸入都在 32K 以內,輸入輸出占比在 3:1。那同樣的請求,基于豆包 1.5 thinking 和 DeepSeek R1 綜合成本是 (4* 3 + 16 * 1)/ 4 = 7 元,而基于豆包 1.6 只需要(0.8 * 3 + 8 * 1)/ 4 = 2.6 元,企業(yè)成本下降 63%,即花費原本三分之一左右的價格就能獲得一個能力更強、原生多模態(tài)的新模型。
比訂酒店為例,傳統(tǒng) APP 需要用戶自己去選,但一些事情無法非常便捷獲取,比如房間鏡子大小、桌子擺放、帶小孩能否加床,網(wǎng)站預訂、電話咨詢起來非常繁瑣,但做成 Agent 之后可以全網(wǎng)搜用戶反饋,甚至 AI 與前臺進行個性化需求溝通。
對此,火山引擎智能算法負責人吳迪認為,AI 就像未來的水和電一樣,提供水、電的公司并不會因為單位利潤高帶動變革,而是要整個行業(yè)通水、通電賺取服務利潤才能長久。
甚至,以后 Agent 和 Agent 之間會互相溝通,互相聯(lián)網(wǎng)。
對此,字節(jié)跳動技術副總裁洪定坤認為,隨著模型能力的持續(xù)進步,AI 有機會通過調用不同 Agent 和工具讓軟件開發(fā) "all in one"。
" 豆包 1.6 模型在編程能力上進步很大,已經接入字節(jié)跳動的 AI 編程產品 TRAE 內測,超過 80% 工程師在使用 TRAE 輔助開發(fā),TRAE 整體月活已經超過 100 萬。" 洪定坤說道。
至此,從字節(jié)跳動 CEO 梁汝波站臺到字節(jié)跳動研發(fā) " 一號位 " 洪定坤鎮(zhèn)場子,整個大會由場景進階輻射至 Agent 野望,更像一次集團意志定調的發(fā)展分水嶺。
字節(jié)搶著當 " 頭牌 "
接近字節(jié)跳動人士表示,火山引擎是明牌,但暗線上是字節(jié)跳動搶 Al 云話語權的決心。
或許會有讀者好奇:阿里云、華為云、騰訊云、百度云憑借自身資源已然占據(jù)先發(fā)優(yōu)勢與人才優(yōu)勢,火山引擎晚了近十年才 " 上桌 ",憑什么后來居上,甚至決心爭第一的底氣是什么?
要回答這個問題,單純進行產品、業(yè)務規(guī)模的對比似乎缺乏說服力,但直擊字節(jié)跳動做云的底層邏輯,從業(yè)務發(fā)展節(jié)奏,集團意志這些層面或許能得到一些解答:
首先,要有業(yè)務支撐起足夠大的規(guī)模(包括用戶規(guī)模與算力、帶寬等資源規(guī)模),(理論上)云才會獲得最優(yōu)成本。
抖音一度被稱作 " 時間熔爐 ",超 10 億人日均超兩小時要被其 " 吞噬 ",與之對應需要一個龐大的算力系統(tǒng)支撐,云計算屬于重資產運營模式,本質上服務器資源租賃比拼性價比,是一門典型的規(guī)模生意,底層邏輯是要通過盡可能多的海量調用去攤薄成本,抖音系產品活躍存在波峰波谷,閑時如果可以通過向 B 端客戶租賃服務器資源無疑會極大提升算力調優(yōu)能力。
不得不感慨,字節(jié)確實通過人才提速極大縮小了與具備先發(fā)優(yōu)勢廠商的差距——以最新數(shù)據(jù)為例,豆包大模型日均 Token 使用量超過 16.4 萬億,較去年 5 月首次發(fā)布時增長 137 倍;另據(jù) IDC 報告,豆包大模型在中國公有云大模型市場份額排名第一,占比高達 46.4%,比二三名加起來調用量都多。
一位 AI 行業(yè)資深人士向虎嗅分析,阿里、騰訊 " 撒網(wǎng)式 " 投資策略,一方面源于資金儲備雄厚且不愿錯失細分機會;另一方面,也說明很多大廠沒有那么篤信大模型時代會呼嘯而至,當下其所具備的顛覆價值還不足以下定決心 All in,所以躬身跳入大模型突圍戰(zhàn)時有所保留。
難道字節(jié)跳動就不怕錯失投中細分賽道獨角獸的機會嗎?
虎嗅與數(shù)位接近字節(jié)跳動人士溝通發(fā)現(xiàn),字節(jié)跳動在大模型浪潮興起之初,就從核心高管到業(yè)務一號位達成共識:堅持自研。
虎嗅認為,這可以從兩方面來理解:
一是,DeepSeek 猶如熱浪席卷而過,市場敘事不再局限于眼花繚亂的 " 新模型 " 以及枯燥的參數(shù)比拼,行業(yè)開始從技術路線、落地場景層面思考大模型競爭格局。
字節(jié)內部認為,客戶需求不會被一家模型公司全部滿足,評價一個模型有幾十個不同維度,OpenAI、Claude、Google 也是某些方面強,某些方面弱一些,豆包的技術路線和 DeepSeek 存在差異,但從 B 端需求來看,很多企業(yè)應用方向主要是數(shù)據(jù)分析、離線抽取、聊天對話、市場信息處理,這些維度豆包強于 DeepSeek RI 模型,堅持自研會讓路 " 越走越寬 "。
二是,大模型浪潮的推動之下,AI 正在為企業(yè)打開新的增長空間,而中國移動互聯(lián)網(wǎng)已到了用戶、流量趨于見頂?shù)某墒炱冢O(jiān)管會更側重產業(yè)互聯(lián)網(wǎng)的推進與建設,這意味著技術走到平臺重構生態(tài)的關鍵時期。
若 AI 必將成為貫穿數(shù)萬家企業(yè)、萬億產值就業(yè)崗位的鏈接管道,字節(jié)能否構建起包括服務器、操作系統(tǒng)、芯片、SaaS 等在內的完整自研體系,很大程度上影響著其生態(tài)重構的進度,以及能否掌控更多互聯(lián)網(wǎng)入口。
有鑒于此,字節(jié)選擇畢功于一役,自然會堅持自研,不再去投資押注,以避免算力、資源和人才的分散——這不僅需要產品或服務領先其他人,還需要管理層的決心,云是非常燒錢的業(yè)務、賺的是辛苦錢,愿不愿意堅持推行差異化的策略既考驗定力也考驗投入的耐心。
當然,只有決心、耐心還不夠,AWS、阿里云都是咬牙熬了多年才盈利,所以還需要一點運氣——畢竟若長期看不到一點機會,再堅定的意志可能也會動搖。
這背后深層次考量還在于,字節(jié)跳動近年來有意強化外界定位:自己是一家科技公司,而不希望被外界視作娛樂平臺——做好大模型、打贏 AI 攻堅戰(zhàn)、搶占更多廣義互聯(lián)網(wǎng)入口,是關乎公司 " 基因重組 " 的關鍵。
此前,昆侖萬維周亞輝有過一個私下分享,大意是國內很多人將字節(jié)跳動視作一家娛樂集團,但其實字節(jié)跳動志在對標亞馬遜——一邊賣廣告,一邊賣云,公司在產品、技術雙輪驅動下野蠻 " 發(fā)育 "。
如此來看,火山引擎還肩負著字節(jié)跳動向一家科技公司蛻變的使命。
# 虎嗅商業(yè)消費主筆黃青春、黃青春頻道出品人,關注文娛社交、游戲影音等多個領域,行業(yè)人士交流加微信:724051399,新聞線亦可郵件至 huangqingchun@huxiu.com