不靠囤算力,拿下數(shù)家大模型明星公司訂單。
93 年創(chuàng)始人掌舵的清華系計(jì)算創(chuàng)業(yè)公司,有點(diǎn)出其不意。
2023 上半年,百模大戰(zhàn)開(kāi)啟,模型預(yù)訓(xùn)練需求空前爆發(fā),在算力焦慮下,囤積算力成為一種趨同性動(dòng)作,更充裕的算力幾乎就等于金額更高的訂單。
10 億、甚至 50 億,誘惑非常大。
站在暴風(fēng)眼最核心,創(chuàng)始人閆博文沒(méi)有這么做。從技術(shù)角度出發(fā),他知道未來(lái)算力一定會(huì)有閑置,瘋狂囤算力對(duì)于一家技術(shù)公司而言似乎也不夠 make sense。
而且從結(jié)果看,這也不影響他拿大單。百度、Kimi 以及視頻生成賽道頂尖玩家生數(shù)科技等,都選擇與他們合作。
So,why?
3 次獲得戈登 · 貝爾獎(jiǎng)
是石科技創(chuàng)立于 2021 年,團(tuán)隊(duì)從國(guó)家超級(jí)計(jì)算無(wú)錫中心孵化而來(lái),是國(guó)內(nèi)最早將超算智算并行優(yōu)化的技術(shù)進(jìn)行產(chǎn)業(yè)化的團(tuán)隊(duì)之一。
創(chuàng)始人兼董事長(zhǎng)閆博文,出生于 1993 年,畢業(yè)于清華大學(xué),是清華計(jì)算機(jī)系博士后。主要研究方向包括計(jì)算機(jī)應(yīng)用技術(shù)、高性能計(jì)算、并行優(yōu)化等。
博士期間,閆博文參與了國(guó)家超級(jí)計(jì)算無(wú)錫中心項(xiàng)目,主要實(shí)現(xiàn)將 CFD 整體算法移植到國(guó)產(chǎn)超算 " 神威 · 太湖之光 " 上。
" 神威 · 太湖之光 ",在超算領(lǐng)域這個(gè)名字絕不陌生,它是世界上首臺(tái)峰值運(yùn)算性能超過(guò)每秒 10 億億次浮點(diǎn)運(yùn)算能力的超級(jí)計(jì)算機(jī),在 2016 年 -2017 年連續(xù)兩年位居全球 TOP500 超算榜首。
它最大的特點(diǎn)是完全使用國(guó)產(chǎn)芯片(申威 26010)構(gòu)建,高度異構(gòu)、并行度極高(>10,000,000 核心線程)。由于不同于 x86、ARM、CUDA 等國(guó)際主流計(jì)算生態(tài),意味著多數(shù)軟件算法都要重寫(xiě)或者重構(gòu)。
閆博文主要參與的項(xiàng)目,就是廣泛應(yīng)用于工業(yè)仿真、航空航天、氣候氣象領(lǐng)域的計(jì)算流體力學(xué)(CFD)算法移植到 " 神威 · 太湖之光 " 上,需要對(duì)算法的底層數(shù)據(jù)結(jié)構(gòu)、并行任務(wù)調(diào)度、線程級(jí)任務(wù)劃分、內(nèi)存訪問(wèn)策略全部做重新設(shè)計(jì)。
這項(xiàng)工作涉及國(guó)產(chǎn)芯片、國(guó)產(chǎn)算法、國(guó)產(chǎn)應(yīng)用的全流程打通,驗(yàn)證了國(guó)產(chǎn)超算不僅 " 快 ",而且 " 好用 "。
也是這次經(jīng)歷,讓閆博文看到了國(guó)產(chǎn)算力軟硬件適配的需求強(qiáng)烈,產(chǎn)業(yè)界對(duì)高性能計(jì)算、國(guó)產(chǎn)可替代的呼聲越來(lái)越高,由此成立是石科技。
團(tuán)隊(duì)的核心成員大多來(lái)自國(guó)家超算無(wú)錫中心并行優(yōu)化團(tuán)隊(duì),擁有深厚的高性能計(jì)算和并行優(yōu)化背景,曾 3 次獲得全球高性能計(jì)算領(lǐng)域最高獎(jiǎng)項(xiàng)—— " 戈登 · 貝爾獎(jiǎng) ",是國(guó)內(nèi)首個(gè)拿下該獎(jiǎng)項(xiàng)、也是唯一一個(gè) 3 次獲得該獎(jiǎng)項(xiàng)的團(tuán)隊(duì)。
戈登 · 貝爾獎(jiǎng)(Gordon Bell Prize)是高性能計(jì)算(HPC)領(lǐng)域的國(guó)際最高獎(jiǎng)項(xiàng),被譽(yù)為高性能計(jì)算應(yīng)用領(lǐng)域的 " 諾貝爾獎(jiǎng) ",由全球最大的計(jì)算機(jī)學(xué)術(shù)組織 ACM(國(guó)際計(jì)算機(jī)協(xié)會(huì))頒發(fā)。
此外,團(tuán)隊(duì)也多次獲得由中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)頒發(fā)的" 中國(guó)版戈登 · 貝爾獎(jiǎng) "—— CCF 年度最佳應(yīng)用獎(jiǎng)。
如此技術(shù)積累下,是石科技在 2021 年正式成立。
這時(shí),距離 ChatGPT 誕生不到 2 年。從時(shí)間維度看,是石科技似乎是提前搶占風(fēng)口,在 AI 計(jì)算需求爆發(fā)前完成了底層計(jì)算能力構(gòu)建。
但在當(dāng)時(shí),業(yè)內(nèi)對(duì)于大模型是否應(yīng)該繼續(xù)卷參數(shù)規(guī)模都還有諸多爭(zhēng)議,沒(méi)什么人能預(yù)料到后來(lái) ChatGPT 引爆的趨勢(shì),更別提背后的 AI 大規(guī)模計(jì)算需求,熱度遠(yuǎn)不及當(dāng)下。
說(shuō)是石預(yù)判了 AI 趨勢(shì),確實(shí)不合理……但如果不是對(duì)趨勢(shì)有預(yù)估,為何它能穩(wěn)穩(wěn)承接突然爆發(fā)的 AI 計(jì)算需求,并不斷拿大單?
創(chuàng)始人閆博文似乎并不覺(jué)得這應(yīng)該是個(gè)問(wèn)題,因?yàn)椋?/p>
無(wú)論大模型爆不爆發(fā),我們都一定會(huì)長(zhǎng)期從事高性能計(jì)算這一行。
不是什么火就做什么,始終從計(jì)算維度做判斷
如此判斷,有來(lái)自實(shí)際需求、國(guó)家戰(zhàn)略的影響,當(dāng)然也有源自技術(shù)公司長(zhǎng)期主義的思考。
時(shí)間回到 2021 年,高性能計(jì)算產(chǎn)業(yè)本身的風(fēng)口更早浮現(xiàn)。
國(guó)家戰(zhàn)略方面,2020 年 " 新基建 " 被首次寫(xiě)入政府工作報(bào)告,算力與 AI 被明確列為重點(diǎn)方向。2021 年《" 十四五 " 數(shù)字經(jīng)濟(jì)發(fā)展規(guī)劃》中,算力建設(shè)作為數(shù)字經(jīng)濟(jì)發(fā)展的核心基礎(chǔ)設(shè)施,被明確納入國(guó)家戰(zhàn)略。中國(guó)高端算力也被列入 " 戰(zhàn)略資源 "。
這個(gè)時(shí)間節(jié)點(diǎn)很像互聯(lián)網(wǎng)爆發(fā)前期。2000 年左右,寬帶、服務(wù)器、CDN 的基礎(chǔ)設(shè)施鋪好后,才有了新浪、百度、阿里、騰訊的起飛。2021 年的高性能計(jì)算,正處于同樣的拐點(diǎn)。
更何況產(chǎn)業(yè)側(cè)本身的需求也很明顯。閆博文提到,當(dāng)時(shí)已經(jīng)在科研、工業(yè)等領(lǐng)域看到了對(duì)大規(guī)模數(shù)值模擬的強(qiáng)烈需求。同時(shí)也觀察到國(guó)內(nèi)在算力平臺(tái)建設(shè)方面還處于早期,企業(yè)缺乏算力供應(yīng),也缺乏專(zhuān)業(yè)團(tuán)隊(duì)維護(hù)——供需不平衡的問(wèn)題亟需解決,需要有專(zhuān)業(yè)團(tuán)隊(duì)來(lái)調(diào)節(jié)這一問(wèn)題。
由此,是石科技成立。要做的事就兩件:
提高計(jì)算效率
降低計(jì)算成本
核心業(yè)務(wù)是 IaaS 和模型專(zhuān)家模型服務(wù)。
核心技術(shù)是并行計(jì)算,這其中包括對(duì)計(jì)算系統(tǒng)中計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)等方面的一系列優(yōu)化,CPU、GPU 異構(gòu)計(jì)算的調(diào)配;本質(zhì)上是通過(guò)軟硬結(jié)合讓用戶(hù)的算法以最適配的方式規(guī)?;渴鹪谟布稀?/p>
在創(chuàng)立早期,是石就構(gòu)建了包括超算和智算在內(nèi)的底層算力,并向上搭建算力調(diào)度平臺(tái)、Infra 優(yōu)化框架以及應(yīng)用服務(wù)在內(nèi)的全棧能力。目前已構(gòu)建起 HAI 統(tǒng)一計(jì)算平臺(tái)。
算力層:管理約10 余個(gè)智算中心和2 個(gè)國(guó)家級(jí)超算中心 / 訓(xùn)練場(chǎng),總算力規(guī)模超過(guò) 10000PFlops。其中:鹽城超級(jí)計(jì)算中心獲批 " 國(guó)家新一代人工智能公共算力創(chuàng)新平臺(tái) ";是石科技總部落戶(hù)浙江平湖市,并建成超智融合計(jì)算平臺(tái);北京經(jīng)開(kāi)區(qū)模數(shù)世界成立是石科技模型調(diào)優(yōu)工廠。
HAI 框架層:提供支持多種型號(hào) CPU 和 GPU 的算力調(diào)度、納管,訓(xùn)練 + 推理的一體化平臺(tái),以及 AI 算子庫(kù)和行業(yè)算子庫(kù)的深度優(yōu)化庫(kù)環(huán)境。服務(wù)超過(guò) 20 余個(gè)應(yīng)用領(lǐng)域,200 多項(xiàng)應(yīng)用課題,200 萬(wàn)個(gè)作業(yè)任務(wù),HAI 框架經(jīng)多場(chǎng)景落地驗(yàn)證的部署、調(diào)度與優(yōu)化能力得到眾多用戶(hù)認(rèn)可。
模型層:提供基礎(chǔ)模型優(yōu)化和行業(yè)專(zhuān)家模型優(yōu)化訓(xùn)練推理服務(wù),專(zhuān)家模型覆蓋高端制造、生物醫(yī)藥、醫(yī)療健康等領(lǐng)域。
在此技術(shù)?;A(chǔ)上,大模型趨勢(shì)爆發(fā),把是石更進(jìn)一步推向臺(tái)前。
從 2023 年到現(xiàn)在,AI 計(jì)算需求大、而且變化快。無(wú)論是基礎(chǔ)模型廠商,還是有 AI 模型訓(xùn)推的企業(yè),都需要有更專(zhuān)業(yè)的團(tuán)隊(duì)為其優(yōu)化算法與算力配置。
在這之中,是石科技為月之暗面、生數(shù)科技、瑞萊智慧、愛(ài)詩(shī)科技、云道智造等頭部企業(yè),以及清華大學(xué)、北京大學(xué)、香港科技大學(xué)等頭部高校,均提供了算力及優(yōu)化服務(wù),且不同領(lǐng)域客戶(hù)面對(duì)的挑戰(zhàn)不盡相同。
比如視頻生成方面,文生視頻、圖生視頻…不同任務(wù)的計(jì)算需求不同,在底層算力上也要做好劃分,這就更考驗(yàn)對(duì)計(jì)算本身的理解,使用 CPU、GPU 還是異構(gòu)計(jì)算?不同類(lèi)型計(jì)算配比如何?怎樣能盡可能降低通道擁堵?越是細(xì)節(jié)的問(wèn)題,就越考驗(yàn)運(yùn)維團(tuán)隊(duì)的功力。
以及視頻任務(wù)本身就更 " 燒卡 ",對(duì)成本考驗(yàn)更大。如何為客戶(hù)優(yōu)化算力構(gòu)成,讓同一任務(wù)以相同的完成度跑在更低配置的卡上,也是對(duì)團(tuán)隊(duì)優(yōu)化能力的考驗(yàn)。
據(jù)閆博文透露,是石科技在過(guò)去 2 年陪伴多家基礎(chǔ)模型公司走完模型訓(xùn)練、推理等階段,推動(dòng)其基礎(chǔ)模型快速上線、以及對(duì)外提供穩(wěn)定優(yōu)質(zhì)服務(wù)。
另外在大模型垂直領(lǐng)域研發(fā)上,是石科技也為高校科研團(tuán)隊(duì)、企業(yè)提供底層計(jì)算優(yōu)化服務(wù)。是石科技攜手深圳大學(xué)大數(shù)據(jù)國(guó)家工程實(shí)驗(yàn)室、南方科技大學(xué)風(fēng)險(xiǎn)分析預(yù)測(cè)與管控研究院、深圳市淵維科技有限公司發(fā)布財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警推理一體機(jī),基于推理大模型與財(cái)務(wù)專(zhuān)家經(jīng)驗(yàn),為投資機(jī)構(gòu)與個(gè)人客戶(hù)提供高效的風(fēng)險(xiǎn)預(yù)警解決方案。
目前,是石科技的業(yè)務(wù)占比中,AI 計(jì)算帶來(lái)的營(yíng)收占比超過(guò) 50%,特點(diǎn)是大單多。與之對(duì)應(yīng),科學(xué)計(jì)算領(lǐng)域的訂單則呈現(xiàn)出" 客戶(hù)多 "的特點(diǎn),當(dāng)下也依舊是是石科技業(yè)務(wù)的主要構(gòu)成部分。
在閆博文看來(lái),雖然科學(xué)計(jì)算不是新風(fēng)口,但是它的算力需求更剛性、更結(jié)構(gòu)化,比如工業(yè)模擬仿真、氣象預(yù)測(cè)等領(lǐng)域。
有時(shí)候一個(gè)仿真系統(tǒng)的物理時(shí)間要求是幾秒鐘,它背后的模型計(jì)算量是數(shù)十倍于普通 AI 推理的。
如今隨著 AI 大火,科學(xué)計(jì)算也與 AI 進(jìn)一步融合。比如在航空航天領(lǐng)域,既需要上千核并行的仿真程序,也需要跑神經(jīng)網(wǎng)絡(luò)的 AI 模型。
總之,作為計(jì)算優(yōu)化領(lǐng)域的資深玩家,是石判斷做什么、不做什么,更多是從計(jì)算本身的需要出發(fā),而不是簡(jiǎn)單跟隨趨勢(shì)。
但這其實(shí)要求自身對(duì)行業(yè)有深刻理解,要知道這兩年算力行業(yè)的變化瞬息萬(wàn)變,趨勢(shì)預(yù)估變得更加困難,甚至充滿誘惑。
比如開(kāi)頭提到的,閆博文從算力供需平衡的角度出發(fā),認(rèn)為公司已經(jīng)沒(méi)必要囤算力,后續(xù)可以依靠調(diào)度閑置算力服務(wù)客戶(hù)。但這就意味著,他們不僅要頂住巨大算力焦慮,也要頂住數(shù)十家算力中心的前置簽約誘惑。
從一個(gè)創(chuàng)業(yè)公司角度,擺過(guò)來(lái)一個(gè) 10 億、甚至 50 億的訂單,誘惑力非常大,但它也可能是個(gè)糖衣炮彈。
那么閆博文的判斷邏輯是什么?
2023 年國(guó)家新一代人工智能公共算力平臺(tái)建成、上千家算力中心或建成或在規(guī)劃中,這意味著算力緊張只是暫時(shí)的,未來(lái)一定存在大量閑置算力。如果參與了這場(chǎng) " 囤積算力 " 的豪賭,一旦沒(méi)有把握時(shí)機(jī),很可能在供需快速變化中面臨虧本。
因?yàn)?strong>算力的折舊是非??斓?/strong>,一旦事先囤積、發(fā)生空置,就有成本損耗,而且是白白浪費(fèi)。如果一年之中空置了一個(gè)月,相當(dāng)于這一年都白干了。
如今在 2025 年回看,這種判斷正確且理性。雖然摩爾定律開(kāi)始失效,但是 " 老黃定律 " 出現(xiàn),底層芯片的供應(yīng)并沒(méi)有預(yù)料中如此嚴(yán)峻。同時(shí)國(guó)產(chǎn)算力再進(jìn)一步跟上,為市場(chǎng)提供更豐富選擇。
當(dāng)然,這種判斷也一定不只依賴(lài)于技術(shù)認(rèn)知,還有個(gè)人風(fēng)格影響。
畢竟大模型趨勢(shì)如火如荼,不是誰(shuí)都能克制且不焦慮的。
93 年創(chuàng)始人帶隊(duì),松弛感十足
由 93 年創(chuàng)始人掌舵的是石,整體團(tuán)隊(duì)都相當(dāng)年輕,團(tuán)隊(duì)成員中 60% 的 90 后,20% 的 00 后。
年輕的好處,就是不容易內(nèi)耗。上億的訂單做不做,一天內(nèi)即可決策出來(lái)。
這種不內(nèi)耗,在閆博文身上更明顯。
技術(shù)趨勢(shì)演進(jìn)如此快,獨(dú)角獸林立、入場(chǎng)玩家越來(lái)越多,大家都擔(dān)心自己掉隊(duì)或者沒(méi)能乘上時(shí)代的東風(fēng)。
我們問(wèn),介意行業(yè)出現(xiàn)更多競(jìng)爭(zhēng)玩家嗎?
閆博文:不介意,玩家越多市場(chǎng)越大。
也不焦慮?
閆博文:不焦慮。我們目前就是在有限范圍內(nèi)擴(kuò)張和投入,不寄希望于投入 10 個(gè)億下去,做個(gè)標(biāo)準(zhǔn)化產(chǎn)品出來(lái),然后大家就都用起來(lái)了。這事和我們預(yù)判到的技術(shù)路線相違背。
那是石科技看到的技術(shù)趨勢(shì)是什么?
越優(yōu)化的東西,通用性越差。
看似悖論,實(shí)則道出計(jì)算領(lǐng)域長(zhǎng)期存在的一個(gè)結(jié)構(gòu)性張力:性能 vs 通用性。
比如針對(duì)某個(gè)任務(wù) / 芯片 / 模型深度定制,如 CUDA kernel 手寫(xiě)、硬件深度綁定、數(shù)據(jù)布局精調(diào),性能爆炸性提升,但很難遷移到其他任務(wù)或平臺(tái);如果是 PyTorch 這類(lèi)通用接口,適配范圍廣,開(kāi)發(fā)效率高,但犧牲性能、調(diào)度、資源利用率。
對(duì)于正在爆發(fā)的算力領(lǐng)域,也將遵循這一規(guī)律,逐漸從通用計(jì)算走向場(chǎng)景計(jì)算。
閆博文認(rèn)為,未來(lái)的計(jì)算中心將不再以地區(qū)作為劃分依據(jù),而更應(yīng)該是某個(gè)計(jì)算中心集中處理某一類(lèi)計(jì)算任務(wù),類(lèi)似于專(zhuān)攻某一場(chǎng)景。這樣能集中做優(yōu)化,也能進(jìn)一步提高算力資源利用率。
這種思想在是石的產(chǎn)品中亦有體現(xiàn),在模型服務(wù)劃分上,團(tuán)隊(duì)也遵循以場(chǎng)景作為分類(lèi)標(biāo)準(zhǔn)。
而對(duì)于行業(yè)來(lái)說(shuō),真正的挑戰(zhàn)是:如何在通用與優(yōu)化之間找到 " 高效、可復(fù)制、快速定制 " 的平衡點(diǎn)。行業(yè)距離抵達(dá)這樣的終點(diǎn),還有很長(zhǎng)的路要走。
換言之,在算力領(lǐng)域,貪圖一時(shí)的快速擴(kuò)張可能會(huì)違背行業(yè)發(fā)展規(guī)律。選擇以慢打快,焦慮自然也不存在。
長(zhǎng)遠(yuǎn)來(lái)看,是石科技則希望未來(lái)作為用算力賦能各行各業(yè)的代表,也能打出類(lèi)似 "Made in China" 的影響力—— Powered by METASONE 是石,這是對(duì)未來(lái)愿景的終極暢想。
回歸當(dāng)下,是石科技要做的就是為客戶(hù)提供好算力與模型優(yōu)化服務(wù),進(jìn)一步提高效率優(yōu)化成本。
今年,一直沉于水面之下的是石科技開(kāi)始更多對(duì)外亮相。在剛剛落幕的 WAIC 2025 大會(huì)上,是石科技團(tuán)隊(duì)也做了進(jìn)一步分享;同時(shí),新的標(biāo)準(zhǔn)化產(chǎn)品即將發(fā)布、新一輪融資也正在籌備中,可以說(shuō)是技術(shù)儲(chǔ)備的一次大釋放。
所以,在 AI 爆發(fā)的趨勢(shì)里,哪有什么 " 小荷才露尖尖角 ",更多都是 " 早有蜻蜓立上頭 "。
你覺(jué)得呢?
One More Thing
最后,如果一定要問(wèn),當(dāng) boss 有什么焦慮點(diǎn)。
閆博文也相當(dāng)坦誠(chéng):
焦慮客戶(hù)滿不滿意、擔(dān)心成員吵不吵架、錢(qián)夠不夠用…
嗯,果然是 90、00 后為主的團(tuán)隊(duì),就是有啥都不掖著。
一鍵三連「點(diǎn)贊」「轉(zhuǎn)發(fā)」「小心心」
歡迎在評(píng)論區(qū)留下你的想法!
— 完 —
點(diǎn)亮星標(biāo)
科技前沿進(jìn)展每日見(jiàn)