究其原因,一方面是企業(yè)內(nèi)部訓(xùn)練、微調(diào)大模型的數(shù)據(jù)量遠(yuǎn)遠(yuǎn)不夠;另一方面,在算力利用率、異構(gòu)多元算力融合方面,行業(yè)仍有一段路要走。
智算行業(yè)興起
自從 ChatGPT 問世之后,生成式 AI 成為了全球科技圈熱議的焦點(diǎn),而作為生成式 AI 底層支撐的智能算力,也迎來了快速增長的時代。據(jù)工信部數(shù)據(jù)顯示,截至 2025 年一季度,中國智算規(guī)模已達(dá)到 748EFlops,占整體算力規(guī)模的 35%,智算已經(jīng)成為算力增長的核心驅(qū)動力。
無獨(dú)有偶,IDC 也十分看好中國智算產(chǎn)業(yè)發(fā)展,IDC 數(shù)據(jù)顯示,2025 年,中國智能算力規(guī)模將達(dá)到 1037.3EFLOPS,預(yù)計 2028 年將達(dá)到 2781.9EFLOPS;中國通用算力規(guī)模將達(dá)到 85.8EFLOPS,預(yù)計 2028 年將達(dá)到 140.1EFLOPS,對此,IDC 中國副總裁周震剛曾告訴筆者,從增加趨勢上分析,2023-2028 年,中國智能算力五年年復(fù)合增長率預(yù)計將達(dá)到 46.2%,通用算力預(yù)計將達(dá)到 18.8%,預(yù)計到 2028 年,中國智能算力規(guī)模將達(dá)到 2781.9EFLOPS,是 2024 年的近四倍。
從數(shù)據(jù)上不難看出,目前,用戶對于算力的需求,絕大部分的增量將產(chǎn)生在智能算力方面。
從服務(wù)器出貨量角度,也可以看出目前智算已經(jīng)成為算力產(chǎn)業(yè)發(fā)展的主流趨勢。據(jù) IDC 數(shù)據(jù)顯示,2024 年全球人工智能服務(wù)器市場規(guī)模為 1251 億美元,2025 年將增至 1587 億美元,2028 年有望達(dá)到 2227 億美元,其中生成式人工智能服務(wù)器占比將從 2025 年的 29.6% 提升至 2028 年的 37.7%。
而龐大的需求主要來自生成式 AI 技術(shù)和應(yīng)用的爆發(fā),僅 2024 上半年,中國 GenAI IaaS 市場同比增長 203.6%,市場規(guī)模達(dá) 52 億元人民幣,占比整體智算服務(wù)市場 35.6%。
當(dāng)生成式 AI 的技術(shù)逐漸成熟,業(yè)內(nèi)也在逐漸從 " 卷 " 模型技術(shù),向著 " 卷 "AI 應(yīng)用的方向出發(fā)。在此趨勢下,大模型技術(shù)的演進(jìn)也隨之從預(yù)訓(xùn)練側(cè),向著推理側(cè)、后訓(xùn)練側(cè)發(fā)展。對此,聯(lián)想中國基礎(chǔ)設(shè)施業(yè)務(wù)群戰(zhàn)略管理總監(jiān)黃山表示,行業(yè)的算力需求從預(yù)訓(xùn)練主導(dǎo)轉(zhuǎn)向了后訓(xùn)練和推理主導(dǎo)。
此外,在應(yīng)用層面,AI 已經(jīng)開始對企業(yè)流程進(jìn)行智能化改造,尤其是在 DeepSeek 問世之后,諸如醫(yī)療、生物科學(xué)、交通等領(lǐng)域的垂類應(yīng)用不斷涌現(xiàn),在應(yīng)用側(cè)對于后訓(xùn)練、推理的要求會更高," 對于算力產(chǎn)業(yè)而言,從應(yīng)用層到算力層都發(fā)生了很大的變化," 黃山進(jìn)一步指出," 在變化的過程中,應(yīng)用層、模型層、算力層軟件之間的相互影響很大。"
這種相互作用的影響也推動了智算產(chǎn)業(yè)的變革,一方面,智算在自己的 " 賽道 " 內(nèi)不斷向前發(fā)展;另一方面,智算的發(fā)展并非孤立存在,智算與超算、通算之間實(shí)現(xiàn) " 超智融合 " 也成為當(dāng)前算力產(chǎn)業(yè)發(fā)展的關(guān)鍵。
超智融合是關(guān)鍵
從宏觀維度看,超智融合不僅能夠充分發(fā)揮各類算力的優(yōu)勢,實(shí)現(xiàn)資源的高效利用,更能為解決復(fù)雜的科學(xué)問題、推動產(chǎn)業(yè)升級提供強(qiáng)大支撐。
超算與智算、傳統(tǒng)數(shù)據(jù)中心之間最大的差別是應(yīng)用場景不同。超算主要應(yīng)用于大規(guī)模科學(xué)計算、工程仿真、氣象預(yù)報、生物信息等領(lǐng)域,這些應(yīng)用需要處理海量數(shù)據(jù)和高復(fù)雜度計算,對計算性能要求極高。
智算則主要應(yīng)用于人工智能、機(jī)器學(xué)習(xí)、圖像處理、語音識別等領(lǐng)域,這些應(yīng)用需要快速迭代和優(yōu)化模型,對計算效率要求較高。而相較于超算、智算而言,傳統(tǒng)數(shù)據(jù)中心的應(yīng)用則更加廣泛,包括云計算、大數(shù)據(jù)分析、企業(yè)級應(yīng)用等。
而超算、智算、通算的融合,也成為了整個算力產(chǎn)業(yè)接下來很長一段時間發(fā)展的重點(diǎn)方向。具體來看,在算力方面,超智融合可以提升算力效率,降低能耗成本。通過實(shí)現(xiàn)超智融合,可根據(jù)具體任務(wù)需求靈活調(diào)度算力資源,避免資源浪費(fèi)。例如,在氣象預(yù)測中,超算提供高性能計算支持復(fù)雜模型的模擬,智算進(jìn)行數(shù)據(jù)分析和結(jié)果優(yōu)化,通算處理日常業(yè)務(wù)數(shù)據(jù),三者協(xié)同提升效率。
在應(yīng)用方面,超智融合可以推動科學(xué)研究與產(chǎn)業(yè)創(chuàng)新,為解決復(fù)雜的科學(xué)問題提供了強(qiáng)大工具。例如,國家超級計算無錫中心的超智融合算力平臺系統(tǒng),為新藥研發(fā)、企業(yè)級智能增強(qiáng)系統(tǒng)等提供全棧智能應(yīng)用計算解決方案。在產(chǎn)業(yè)領(lǐng)域,超智融合助力制造業(yè)智能化升級。三一重工通過整合通算、智算和超算資源,實(shí)現(xiàn)了生產(chǎn)流程的數(shù)字化和智能化,產(chǎn)能提升 123%,人員效率提升 98%,單位制造成本降低 29%。
對此,黃山也向筆者介紹了一些聯(lián)想在超智融合方面的經(jīng)驗(yàn)和案例,他表示,在聯(lián)想與北京大學(xué)的合作中,雙方共同建設(shè)了高性能計算平臺,平臺以聯(lián)想開發(fā)的模型為底座,采用聯(lián)想深騰 X8810 系統(tǒng),并配置聯(lián)想數(shù)據(jù)中心采用的英特爾至強(qiáng)鉑金處理器,為各學(xué)科領(lǐng)域提供大規(guī)模數(shù)據(jù)處理和大規(guī)??茖W(xué)計算的支持。
" 以生命科學(xué)研究場景為例,原先需要 15 分鐘才能完成的核磁共振影像結(jié)果,通過該平臺的加持,現(xiàn)在僅需 20 秒左右就能完成。" 黃山介紹道。
此外,在與吉利汽車的合作中,聯(lián)想和英特爾共同為吉利打造了一套 HPC 集群化解決方案。該方案通過聯(lián)想萬全異構(gòu)智算平臺 HPC 版和英特爾五代至強(qiáng)可擴(kuò)展處理器,對 " 星睿智算 HPC 集群 " 進(jìn)行升級,提升了研發(fā)效率,縮短了產(chǎn)品迭代周期。" 在多達(dá) 5000 個 CPU 的仿真集群中,通過異構(gòu)算力平臺,融合 HPC 與智算的能力," 黃山進(jìn)一步指出," 目前,該方案已經(jīng)落地了超過 19 種仿真應(yīng)用。"
異構(gòu)算力融合仍面臨挑戰(zhàn)
超算與智算的融合首先體現(xiàn)在硬件架構(gòu)的深度重構(gòu)。傳統(tǒng)超算以 CPU 為核心,側(cè)重雙精度浮點(diǎn)運(yùn)算(FP64),而智算依賴 GPU/TPU 等加速芯片,聚焦半精度(FP16)和整數(shù)運(yùn)算(INT8)。兩者的硬件架構(gòu)和計算范式存在本質(zhì)差異。這種架構(gòu)差異在 AI for Science 場景中形成瓶頸,比如,蛋白質(zhì)結(jié)構(gòu)預(yù)測需要同時處理高精度分子模擬與數(shù)據(jù)驅(qū)動的模型優(yōu)化。
除此之外,超算的 " 時間復(fù)雜度 " 與智算的 " 空間復(fù)雜度 " 難以兼容。融合需從芯片設(shè)計、存儲網(wǎng)絡(luò)到算法層面實(shí)現(xiàn)軟硬協(xié)同創(chuàng)新,例如通過動態(tài)異構(gòu)資源池化技術(shù)解決算力調(diào)度問題。所以超智融合目前來看仍是一個比較棘手的問題。
對此,黃山指出,超算與智算的融合,目前還存在一些難點(diǎn),主要是因?yàn)閮煞N計算模式下,算力調(diào)度機(jī)制不同,融合調(diào)度機(jī)制將成為接下來實(shí)現(xiàn)超智融合過程中,最需要首先解決的問題。
除此之外,黃山告訴筆者,算法也是實(shí)現(xiàn)超算與智算融合發(fā)展的一大掣肘," 因?yàn)槌闩c智算的算法也完全不同,在計算過程中,如何將雙方的計算結(jié)果結(jié)合在一起,進(jìn)而進(jìn)行融合計算,也是實(shí)現(xiàn)超智融合的難點(diǎn)之一。" 黃山強(qiáng)調(diào)道。
而面對超算、智算、通算融合難題,平臺化的解決方案似乎成為了當(dāng)前狀態(tài)下的最優(yōu)解。以聯(lián)想為例,其通過 " 一橫五縱 " 戰(zhàn)略框架構(gòu)建了覆蓋通用、科學(xué)、AI 算力的異構(gòu)智算平臺——萬全異構(gòu)智算平臺。黃山表示,萬全異構(gòu)智算平臺是聯(lián)想 AI 方案的整體抓手,通過智算與 HPC 計算硬件方面多年的積累,再加上對于軟硬協(xié)同方面的行業(yè) Know-How,提高了算力的利用率,并優(yōu)化了軟硬件之間的適配度,向上支持模型應(yīng)用,向下融合異構(gòu)算力。
在軟件層面,聯(lián)想通過萬全異構(gòu)智算平臺 3.0 實(shí)現(xiàn) HPC 與 AI 框架的無縫銜接。其 AI 編譯優(yōu)化器采用算子融合與路徑優(yōu)化技術(shù),降低訓(xùn)練與推理成本各 15% 以上;專家并行通信算法針對 MoE 架構(gòu)通信瓶頸,通過計算通信協(xié)同優(yōu)化將推理時延降低三倍,網(wǎng)絡(luò)帶寬利用率達(dá) 90%。
在硬件層面,聯(lián)想通過萬全異構(gòu)智算平臺持續(xù)拓展與國內(nèi)外知名合作伙伴的長期合作。資料顯示,萬全異構(gòu)智算平臺 3.0 已實(shí)現(xiàn)了對大多數(shù)國內(nèi)芯片實(shí)現(xiàn)了兼容,兼容后較傳統(tǒng) CPU 集群提速 15 倍。
在模型層面,萬全異構(gòu)智算平臺已經(jīng)接入了包括 DeepSeek 在內(nèi)的,目前市面上主流的開源大模型,并且可以針對 MoE、LLM 等不同架構(gòu)的模型,提供想對應(yīng)的適配與優(yōu)化。正如黃山前文所述——萬全異構(gòu)智算平臺已經(jīng)成為聯(lián)想集團(tuán)在企業(yè)級 AI 落地方面的核心抓手。
而在異構(gòu)算力平臺及整合大模型能力平臺方面布局不僅是聯(lián)想獨(dú)有的布局,從市面上常見的軟硬件服務(wù)商的布局可以看出,平臺化的軟件產(chǎn)品的與硬件的結(jié)合,是當(dāng)下提升硬件易用性的最優(yōu)解,圍繞此,神州數(shù)碼推出了神州文學(xué)平臺、浪潮信息推出了 EPAI 平臺、青云科技推出了 AI 智算平臺 .......
綜合來看,通過平臺化的產(chǎn)品和生態(tài)的構(gòu)建,推進(jìn)超算、智算,以及通算融合已經(jīng)是大勢所趨,而超算、智算、通算的融合不僅是技術(shù)路徑的選擇,更是 AI 時代的必經(jīng)之路。通過硬件異構(gòu)化、軟件協(xié)同化、網(wǎng)絡(luò)泛在化的技術(shù)突破,以及科研、工業(yè)、醫(yī)療等領(lǐng)域的深度應(yīng)用,超智融合正在重構(gòu)計算范式,推動生產(chǎn)力躍升。
未來,隨著內(nèi)生智能計算系統(tǒng)的成熟,超算與智算的界限將徹底模糊,形成 " 超級智能計算 " 新形態(tài),開啟人類認(rèn)知與創(chuàng)新的新紀(jì)元。
(本文首發(fā)于鈦媒體 APP,作者|張申宇,編輯丨蓋虹達(dá))