1
火山引擎的名字里沒有云。
這件事在以前是個需要解釋的事情。2020 年底,字節(jié)內(nèi)部的關鍵決策會議上,正式?jīng)Q定讓火山引擎對外提供服務、進入真實的市場,而在這個最初的會議上,字節(jié)希望這個技術(shù)平臺不只是 " 又一個云計算廠商 "。于是干脆從名字就不帶云。
在火山引擎進入這個市場的時刻,云計算正處于焦灼的互卷階段。這是一個需求旺盛的市場,也是一個充滿誘惑的商業(yè)戰(zhàn)場,用高舉高打的方式收割一個增長中的市場,它符合外界對彈藥充足的互聯(lián)網(wǎng)巨頭們決策思路的想象。而這樣的思路之下,一個產(chǎn)品的名字怎么能不帶 " 云 " 呢。
在這些最初的內(nèi)部會議上,字節(jié)對火山引擎的思考呈現(xiàn)出這家公司有些容易被人忽視的一面。據(jù)參加會議的人員回憶,最初的各種內(nèi)部會議上,花最多時間討論的除了認定云市場必須用新方法來找差異化,不去搶那些低垂的果實之外,大家更多在討論兩件事。
一件是,"20 年后回頭看今天,云計算是什么樣?"
答案是省、穩(wěn)定和安全這些基本要求依然必不可少,但同時肯定不能依然只是做 CDN 等資源的 " 售賣 ",技術(shù)棧需要變化。
而更重要的另一件事,是這個從內(nèi)部正式開啟對外服務的基礎技術(shù)平臺,對于字節(jié)這家已不再是 " 后來者 " 的公司自己來說,到底意味著什么?
討論最終的答案是,它要寄托字節(jié)自己真正變成一家科技公司的期待:當時的字節(jié)在推薦算法等技術(shù)上已經(jīng)是領先者,但它的基礎設施是建立在外界服務之上的,想成為一家 " 科技公司 ",字節(jié)不可能不對云和底層技術(shù)也充滿野心,因此它一方面要建設自己的底座,另一方面必須讓它得到最充分的考驗——到最復雜的真實市場里去。
這是很字節(jié)的一套做事風格——這家公司是諸多科技公司中,最喜歡以終為始設計業(yè)務的公司之一,只不過很多時候它被大家津津樂道的是那些方法論,忽略了它對終局的執(zhí)念,多名在字節(jié)關鍵決策節(jié)點參與最核心討論的人士都講述過相似的故事,今日頭條和抖音是從 " 算法如何改造信息分發(fā) " 的靈魂拷問出發(fā)而誕生,而火山引擎的故事同樣由此開始。
對火山引擎的兩個靈魂拷問相結(jié)合,答案就指向了 AI。
2
2025 年 6 月 11 日,火山引擎參與人數(shù)破紀錄的最新一次原動力大會上,展示了一組數(shù)據(jù):
截至今年 5 月底,豆包大模型日均 tokens 使用量超過 16.4 萬億,較去年 5 月首次發(fā)布時增長 137 倍。
Token 使用量這個指標可能不如營收數(shù)據(jù)更能直接體現(xiàn)商業(yè)化情況,但在今天 AI 用量快速爬升階段,它是各家都緊盯著的風向標。前不久 Google 公布其系統(tǒng)每月處理的 token 數(shù)量激增,從去年的 9.7 萬億增加到現(xiàn)在的 480 萬億,這里面包括 Google 系的各種 C 端調(diào)用。
" 據(jù) IDC 報告,豆包大模型在中國公有云大模型市場份額排名第一,占比達 46.4%。" 火山引擎總裁譚待在會上引用數(shù)據(jù)稱。
于是,當 AI 快速成為計算需求的最主要來源,火山引擎的名字里沒有云這事終于也成了不太需要解釋的事情——計算的需求結(jié)構(gòu)都要徹底變了,能支撐它的必須是全新的圍繞 AI 的基礎設施,那么今后能吞下這一切的,自然不是過去那朵 " 云 " 了。
而且,這一切只是開始。Token 瘋漲以及依然會漲下去的根源來自于市場對 AI 的需求模式的變化。
" 我們看到模型的訓練正在從預訓練向后訓練轉(zhuǎn)移,對大部分企業(yè)來說后訓練是一個很重要的事情,而以強化學習為代表的后訓練實際上對基礎設施提出了更高的要求。" 譚待提到。
火山引擎完整經(jīng)歷了這輪 AI 算力需求的輪轉(zhuǎn)。從第一天對外開始,字節(jié)在它身上的 " 私心 " 就是讓全市場來測驗它用來支撐自己最核心技術(shù)的底層能力,而字節(jié)的技術(shù)核心一直是 AI 和算法——火山引擎從誕生就是死磕 AI 的一個新型基礎設施平臺。
ChatGPT 的震撼一度讓行業(yè)有種 " 斷代 " 的意味,似乎在它出現(xiàn)后,此前的一切都不做數(shù)了。但事實上,今天 AI 和算法的進步不是抹掉一切重新開始的,它背后有一整個歷史。此前在推薦算法上的理解和積累,依然會對今天有幫助,它讓火山引擎在關鍵節(jié)點上更加敏銳。
這從火山引擎的變化中也可以直接感受到,在 2020 年底正式對外開放后,它一度更多在給外界提供字節(jié)自己驗證過的、圍繞模型背后的產(chǎn)品,從 A/B 測試到數(shù)據(jù)平臺,這些更多是一些零散的單點產(chǎn)品。
2021 年,火山引擎開始提供更接近通常理解的云的服務,直到 2023 年 6 月火山方舟出現(xiàn),圍繞模型構(gòu)建的系統(tǒng)成型,開始對外提供圍繞 AI 的系統(tǒng)化的服務,之后這樣的思路不斷加強。
也就是,AI 是火山引擎正式變成一個底層設施的根本原因,也是它一切技術(shù)產(chǎn)品設計和改進的出發(fā)點,這使得 2023 年當時,火山引擎甚至在字節(jié)自己的豆包模型亮相之前率先跑了出來?;鹕椒街郯l(fā)布時,集成了國內(nèi)外多家大模型,面向企業(yè)提供精調(diào)、評測、推理等全方位的平臺服務。而同樣的思路在 DeepSeek R1 出現(xiàn)后,呈現(xiàn)的更加明顯,火山引擎迅速成為最先接入和服務最穩(wěn)定的平臺,最終也變成企業(yè)級 DeepSeek 調(diào)用最多的平臺。
DeepSeek 證明了圍繞模型做基礎設施的極致改進,可以突破現(xiàn)有的云的限制,進而發(fā)展成為一個在商業(yè)上也可持續(xù)的新的基礎服務。這正是火山引擎自己在追逐的,于是動作也就迅速。
另一個最直接的體現(xiàn),就是外界熱衷討論的 " 價格戰(zhàn) "。
2024 年 5 月,火山引擎公布了自己在模型調(diào)用上更低的定價,這一度被理解為一種云計算競爭的常見手段的再次上演。但在整個行業(yè)一系列的跟進動作后,人們很快意識到,在新的 token 規(guī)模經(jīng)濟之下,當你圍繞模型和 AI 做工程化的極致改進,隨著模型繼續(xù)進步和軟硬件的一系列優(yōu)化后,這種價格下降是必然結(jié)果。
而在 6 月 11 日的原動力大會上,譚待干脆帶著現(xiàn)場的人們做起了口算題。" 在絕大部分企業(yè)請求輸入落在的 32K 范圍以內(nèi),經(jīng)計算豆包 1.6 成本只需要不到原來的三分之一,就能獲得一個能力更強,原生多模態(tài)的新模型。"
當初用來打入這個市場的能力,變成市場結(jié)構(gòu)突變后決定未來競爭格局的最關鍵能力。而火山引擎的差異化也隨著需求的改變,呈現(xiàn)的更加清晰。
3
云計算永遠是個規(guī)模的生意。
這個判斷在之前被用來解釋新入場的玩家面對的挑戰(zhàn)之大。但事實上,這句話放在今天更重要的意義在于," 規(guī)模 " 的核心是會改變的,這也正是今天正在發(fā)生的最重要的事。
AI 注定會吞掉云的一切需求,成為當仁不讓的主角。
在火山引擎的判斷里,這個變化在三個維度展開:一個是推理能力進入視覺和多模態(tài)模型里,帶來應用爆發(fā);二是視頻生成大規(guī)模進入真實生產(chǎn)環(huán)境;第三就是 AI Agent 走向徹底的普及。
其中最重要的就是 AI Agent 眼看要到來的井噴。
"2025 年是 AI agent 的元年。" 譚待說。他認為,AI agent 背后核心突破在于將大模型的語言理解能力與環(huán)境交互、工具調(diào)用深度融合,形成目標導向的自主執(zhí)行系統(tǒng)。
軟件第一次從被動的工具,變成主動的執(zhí)行者。AI 從交付一個中間過程半成品,到交付結(jié)果。
根據(jù)火山引擎的判斷,隨著大量 Agent 加速進入現(xiàn)實世界,強化學習帶來的整體算力消耗和 IT 支出有可能在 2027 年附近逼近整個行業(yè)在預訓練上的投入。
" 如果我們把時間拉長,把技術(shù)棧展開。我們實際正處于 PC 到移動到 AI 三個時代的變化之中。在這三個時代里,技術(shù)主體在發(fā)生變化,PC 時代的主體是 web,移動時代是 APP,AI 時代是 Agent。" 他說。
它需要一次更徹底的重構(gòu)。在火山引擎的最新更新里,它不再想被過去人為劃分出來的各種分層來束縛,轉(zhuǎn)而根據(jù)需求來源的判斷,設計了對應的核心三件套。
" 我們把這些基礎能力原子化,作為三個方案提供給大家,分別是 AgentKit,TrainingKit 和 ServingKit。" 譚待說。
在火山引擎內(nèi)部,他們把 AI agent 定義成多步驟復雜任務,他們相信這會帶來一個全新的產(chǎn)業(yè)。
AgentKit 就是對圍繞 Agent 打造的工具和平臺進行的一個整體的 SDK 封裝,集成了最新的大模型,開箱即用,強調(diào)高可擴展能力。同時,它已經(jīng)集成了業(yè)界數(shù)十類三方 MCP Server。
另外的 Training Kit 和 Serving Kit 也對 AI agent 的需求提供支持。Training Kit 實現(xiàn)高達 60% 以上的 MFU(算力利用率),在萬卡集群、千億參數(shù)的規(guī)模上對比開源的方案提升了 30%。ServingKit 解決的則是模型在推理過程中的效率問題,它強調(diào)其通過支持對各種開源框架的優(yōu)化、對主流模型的算子優(yōu)化,在性能上比社區(qū)的最新版本提升了 2-3 倍。
觀察這些產(chǎn)品,其中一個最突出特點是,你平常在關于模型訓練和推理上聽到的技術(shù),都直接變成了這個云平臺可以提供的服務。比如后訓練的強化學習、MCP、數(shù)據(jù)蒸餾,都產(chǎn)品化了。與傳統(tǒng)云廠商的產(chǎn)品技術(shù)棧劃分還需要 " 翻譯 " 相比,它們?nèi)缃穸贾卑椎姆旁谟脩裘媲啊?/p>
" 過去幾年傳統(tǒng)云計算在產(chǎn)品層面的創(chuàng)新,其實停滯許久了。" 譚待對硅星人說。" 今天 AI 讓云上的產(chǎn)品可以像最早期那樣,有更多創(chuàng)新和產(chǎn)品出來。"
火山引擎把這些產(chǎn)品和技術(shù)的重構(gòu)稱為 AI 云原生。在大模型帶來各種 fancy 的新名詞里,這顯得沒那么吸引眼球。但它足夠直接—— AI 的原生需求變成云最重要的部分,然后云這件事就此改變。
4
火山引擎的進展速度,有時候讓人們幾乎忘了它是個誕生剛五年的業(yè)務。
6 月 11 日的原動力大會上,你能從每個角落感到它在這場競爭里的轉(zhuǎn)折點已經(jīng)到來。同時在字節(jié)跳動的體系內(nèi)部,它也正在成為新的焦點。梁汝波在大會上以視頻形式亮相,這也是這位 CEO 第一次出現(xiàn)在火山引擎的發(fā)布會。
字節(jié)要成為一家真正的科技公司,但所謂的科技公司也有很多種,它要成為哪一種?
" 優(yōu)秀的科技公司是能夠運用先進技術(shù)的公司,而優(yōu)秀的創(chuàng)新科技公司是能夠探索和發(fā)明新科技的公司。"
而字節(jié)一直以來的技術(shù)創(chuàng)新,其實有一個不變的線,就是對一個系統(tǒng)的整體探索。今日頭條是 " 內(nèi)容生產(chǎn) + 分發(fā) + 反饋 " 系統(tǒng),抖音是 " 興趣識別 + 推薦反饋 + 內(nèi)容供給 " 系統(tǒng),飛書是 " 組織協(xié)作 + 工作流程 + 數(shù)據(jù)驅(qū)動 " 的企業(yè)操作系統(tǒng)。
火山引擎也延續(xù)了這種路線,"AI 云原生 " 這條路也并非孤立的技術(shù)選型,更多是字節(jié)存在在肌肉記憶里的創(chuàng)新方式在 AI 時代的投射。但它比以前更進一步,從對技術(shù)的運用,到需要對整個系統(tǒng)重新發(fā)明——這個系統(tǒng)不再只是 AI 跑在上面的 " 云平臺 ",而需要就變成 AI 本身。
" 就好像原來的后訓練是一個星球,一個地球,一個火星。但是未來大家看到的后訓練將是一個太陽系。" 火山引擎智能算法負責人、火山方舟負責人吳迪在一個小范圍交流里提到。
他形容火山引擎在這飛奔的兩年里,最大的經(jīng)驗之一是把 AI 放在更長的視野里來看。
" 不能只看模型本身,AI 的綜合能力本質(zhì)上還是計算機科學的一部分。整個系統(tǒng)的服務能力要夠強,你要把它當成一個完整的計算機系統(tǒng)來看,這件事情特別重要,而且也才是我們長期能夠把性價比做到最優(yōu)的一個根本性保障。"
除此之外,火山引擎也是字節(jié)這家公司從一個互聯(lián)網(wǎng)行業(yè)后起的挑戰(zhàn)者變成一個在技術(shù)上對全行業(yè)有更廣泛影響力的成熟科技公司的過程的某種濃縮。
對于一家通過 C 端產(chǎn)品獲得巨大商業(yè)化成功而迅速成長的公司,如何在內(nèi)部建立起來一個新的團隊,甚至新的文化,去 " 苦哈哈 " 地拓展 to B 的業(yè)務,是每個有野心變成真正的科技公司的年輕企業(yè)都要面對的問題。
互聯(lián)網(wǎng)產(chǎn)品的成功好處在于讓火山引擎可以有更多選擇空間,但也會帶來 " 挑剔 " 的問題,當一個需要投入大量時間和人力的客戶,換回的收入還不如某個廣告位的售價,這種影響是很微妙的。這背后,如何理順 to C 和 to B 之間的關系,至關重要。
而變化發(fā)生的關鍵依然是 AI。隨著大模型的需求吞噬掉一切,那些中小創(chuàng)業(yè)者成為 token 消耗貢獻者,而更重要的,過往主要在和數(shù)據(jù)中心打交道的云計算服務,今天開始更加直接,更向 C 端靠攏。
字節(jié)的 C 端積累比以前更能服務于火山引擎這樣的 B 端產(chǎn)品的拓展:一個企業(yè)老板很可能用豆包 APP 的視頻通話來分析自己的體檢報告,他自然可以理解用火山引擎建立一個他自己企業(yè)的 " 豆包 ",去識別他生產(chǎn)車間上的關鍵要素。
長期以來,字節(jié)強大的技術(shù)實力被其耀眼的 C 端產(chǎn)品光芒所掩蓋。而現(xiàn)在它寄托了自己成長為一家創(chuàng)新科技公司的愿望的 to B 業(yè)務,與從頭條與抖音等產(chǎn)品延伸下來的 to C 模型產(chǎn)品等,第一次因為 AI 而更緊密的貫穿在了一起。這都讓火山引擎能成為一種對外的統(tǒng)一出口。
" 一直以來,字節(jié)在技術(shù)創(chuàng)新上的投入是非常大的。未來,我們也會秉持此前的理念,通過火山引擎持續(xù)把我們的新模型、新技術(shù)開放給企業(yè)客戶,讓新技術(shù)接受市場的檢驗。" 在當天的開場里梁汝波說。
這是字節(jié)等待許久也努力營造了許久的時刻,火山引擎不只是一個 " 云 ",它有字節(jié)更多的想象,也有機會變成這家公司再往前蛻變的一個支點。
火山引擎讓字節(jié)跳動終于可以干它一直想干的事了。