招股書顯示,云天勵飛是中國首家實現(xiàn)國產(chǎn)高算力 AI 推理芯片商業(yè)化的公司;同時,也是全球范圍內(nèi)第一批推出 NPU 驅(qū)動的 AI 推理芯片,并實現(xiàn)市場化落地的企業(yè)。
根據(jù)灼識咨詢報告,按 2024 年中國市場相關(guān)收入統(tǒng)計,云天勵飛是中國排名前三的行業(yè)領(lǐng)先全場景 AI 推理芯片產(chǎn)品及服務(wù)提供商;在 NPU 驅(qū)動的 AI 推理芯片產(chǎn)品及服務(wù)提供商中,公司排名中國第二。
雷峰網(wǎng)在 2014 年云天勵飛成立之初就開始關(guān)注這家企業(yè),自主創(chuàng)新和與時俱進(jìn)一直是它的代名詞。
" 全自研、國產(chǎn)化 ",在 2025 WAIC 云天勵飛的展臺上,擺放著采用國產(chǎn)工藝及首創(chuàng) " 算力積木 " 架構(gòu)打造的深界 DeepEdge10 系列芯片。
作為最早將并行計算處理器帶回國內(nèi)的一批人,云天勵飛始終深耕 NPU 研發(fā),從架構(gòu)設(shè)計到場景適配持續(xù)突破技術(shù)限制。
2020 年,在被美國限制之后,云天勵飛率先將芯片生產(chǎn)切換至國產(chǎn)工藝,至此," 全自研、國產(chǎn)化 " 的體系正式形成。
深界 DeepEdge10 系列產(chǎn)品的打造,代表陳寧此前的選擇都對了。大模型進(jìn)入大規(guī)模應(yīng)用落地的浪潮之下,云天勵飛進(jìn)一步聚焦業(yè)務(wù),押注 AI 推理芯片。
" 云天勵飛將進(jìn)一步加大在 AI 推理芯片領(lǐng)域的研發(fā)和投入,推動中國搶占第四次工業(yè)革命的第一張入場券。" 陳寧在 2025 WAIC 期間演講時說道。
陳寧的表態(tài)絕非空言,云天勵飛已通過戰(zhàn)略調(diào)整將公司業(yè)務(wù)聚焦于 AI 推理芯片,構(gòu)建 "1+N" 業(yè)務(wù)架構(gòu),"1" 即整體定位為 AI 芯片公司,"N" 則是公司 11 年來積累的 N 個獨立業(yè)務(wù)板塊(內(nèi)部稱 BU),包括 AI 硬件品牌嚕咔博士、智能穿戴、智算 BU、政企 BU 等,這些 BU 共同為 AI 推理芯片平臺提供上下游支撐。
自研 AI 芯片,刻在云天勵飛的基因里。這家 11 歲的企業(yè),為何選擇這條 " 最有挑戰(zhàn)性 " 的道路?在巨頭林立、創(chuàng)業(yè)公司扎堆的 AI 芯片賽道中,云天勵飛優(yōu)勢何在?
01 最早把并行計算處理器帶回國的一批人
三獲吳文俊人工智能科學(xué)技術(shù)獎
成為百億市值的 " 科創(chuàng)板 AI 芯片第一股 "
推動設(shè)立超千億規(guī)模的產(chǎn)業(yè)基金
...
11 歲的云天勵飛創(chuàng)造了無數(shù)的高光時刻,而故事的開始,還要從陳寧在美國的經(jīng)歷開始說起。
2001 年,陳寧進(jìn)入頂尖研究型大學(xué)佐治亞理工學(xué)院攻讀電子工程博士學(xué)位,當(dāng)時著名移動通信專家斯圖伯爾教授(Gordon L.St ü ber)是學(xué)院的關(guān)鍵技術(shù)領(lǐng)頭人,在他的帶領(lǐng)下,OFDM(正交頻分復(fù)用)技術(shù)實現(xiàn)了突破。
OFDM 的核心是把高速串行數(shù)據(jù)拆成多路并行低速數(shù)據(jù),其并行處理邏輯與芯片設(shè)計中通過多核實現(xiàn)并行算力的邏輯存在相通性,無論是 4G 通信的海量數(shù)據(jù),還是 AI 推理的千億參數(shù),本質(zhì)上都需要高效的并行處理能力。這讓陳寧能夠更深刻地理解芯片設(shè)計。
4 年后,還未畢業(yè)的陳寧就被當(dāng)時的通信巨頭 " 預(yù)訂 " 擔(dān)任高級系統(tǒng)架構(gòu)工程師。
進(jìn)入公司,陳寧領(lǐng)到的第一個任務(wù)是設(shè)計并研發(fā)第四代移動通信(4G-LTE)多模態(tài)終端基帶芯片,原先從事算法工作的陳寧被委派去參與處理器芯片的工作,這讓他有點摸不著頭腦。
在當(dāng)時的技術(shù)演進(jìn)趨勢下,公司的安排不無道理——讓懂通信算法的人來做通信芯片。
2G 和 3G 之后,4G 標(biāo)準(zhǔn)開始制定。與此同時,藍(lán)牙、WiFi 及 UWB 等多種短距離無線通信技術(shù)也在并行發(fā)展,這些不同場景的無線技術(shù)標(biāo)準(zhǔn)共同構(gòu)成了多元化的無線通信體系。
4G 實現(xiàn)了并行數(shù)據(jù)量的激增,而 OFDM 作為 4G 的核心技術(shù),最大特點正是通過多子載波并行傳輸提升數(shù)據(jù)吞吐量。
彼時,OFDM 推動了通信芯片在并行信號處理上的技術(shù)演進(jìn),而與之形成技術(shù)呼應(yīng)的是,英偉達(dá)較早布局的 GPU 多核并行計算,二者分別在無線通信與通用計算領(lǐng)域探索了并行處理的技術(shù)路徑。
這段經(jīng)歷讓陳寧深刻理解,芯片不是簡單的硬件設(shè)計,而是要讓算法和硬件結(jié)合設(shè)計。
4G 終端原型系統(tǒng)的搭建,讓陳寧作為首席代表參與 4G-LTE 國際標(biāo)準(zhǔn)制定,在這期間,陳寧見證了華為、中興及中國移動等中國企業(yè)代表從最初只能在外圍旁聽,到位置不斷靠前,最后是參與國際標(biāo)準(zhǔn)的制定。
中國企業(yè)發(fā)展迅速,赴美的第九年,陳寧恰遇國內(nèi)通訊巨頭在美國組建研發(fā)中心。
2011 年,陳寧承接了一個重大專項,這個專項,或是國內(nèi)第一個關(guān)于并行計算處理器定義的重大專項。
可以說,陳寧是最早把并行計算處理器帶回國內(nèi)的那一撥人。
5 年間,陳寧提交了近百篇專利申請,完成了核心 IP 及應(yīng)用芯片的全流程專利布局。此外,陳寧團(tuán)隊推出了全球第一款基于軟件定義無線電的 4G-LTE 終端芯片、設(shè)計出一系列擁有全自主知識產(chǎn)權(quán)的矢量處理器,實現(xiàn)國有處理器 0 的突破。
求學(xué)過程中主攻算法,進(jìn)入職場后,陳寧的重心轉(zhuǎn)向硬件處理器,這樣的成長經(jīng)歷讓他很早就積累了算法與硬件結(jié)合的經(jīng)驗,為后來云天勵飛推動算法芯片化埋下了伏筆。
02 自研 NPU 讓 「深目 1.0」順利上線
過往的經(jīng)歷讓陳寧對國際巨頭的動作一直保有敏銳的注意,谷歌跟百度搶 Hinton 的團(tuán)隊、4 億美金收購 DeepMind、AlphaGo 戰(zhàn)勝人類最強棋手,深度學(xué)習(xí)領(lǐng)域一個個顛覆性的變化挑動著陳寧的神經(jīng)。
深度學(xué)習(xí)是能把矢量處理器這個技術(shù)路徑完全發(fā)揮出來的領(lǐng)域。那我們何不針對深度學(xué)習(xí)去完全定義一套指令集?
跟多位業(yè)內(nèi)人士聊完之后,陳寧覺得創(chuàng)業(yè)不能再等了。
2014 年,云天勵飛創(chuàng)立,正式投身 NPU 研發(fā);而這一時間節(jié)點,恰好也是中國 NPU 產(chǎn)業(yè)的興起之時——寒武紀(jì)、深鑒科技等企業(yè)紛紛成立,共同開啟了 NPU 研發(fā)與商用的探索之路。
陳寧開發(fā)的第一個項目便是 " 深目 ",打造 " 深目 " 系統(tǒng)所涉及的底層芯片研發(fā)讓這個創(chuàng)業(yè)公司倍感壓力。芯片是一個重資產(chǎn)、慢回報的生意。在 2014 年,AI 還處于發(fā)展初期,一家初創(chuàng)公司說自己要做 AI 芯片,在投資人看來,無疑是 " 不切實際 "。
但陳寧仍然堅定地選擇走這條路。
深目 1.0 上線后,軟硬件運行順暢,最擔(dān)心的系統(tǒng)卡頓也沒有發(fā)生,全球第一套人臉動態(tài)識別 + 大數(shù)據(jù)檢索的智能技術(shù)正式運行。
后來,陳寧向我們講述到:" 神經(jīng)網(wǎng)絡(luò)處理芯片一直是我們內(nèi)部的一個核心團(tuán)隊,2016 年,我們第一代神經(jīng)網(wǎng)絡(luò)處理器在 FPGA 上實現(xiàn),今天可能還跑在龍崗公安分局的機房里,我們兩臺 Nova100 指令集的服務(wù)器替代了幾十臺 CPU 服務(wù)器。"
NNP100 支持下的深目系統(tǒng)獲得成功,讓云天勵飛在三四年間,從幾個人和一間辦公室成長為擁有近千員工的人工智能標(biāo)桿企業(yè)。
03 切換國產(chǎn)工藝成功流片
Nova100 只是開始,芯片研發(fā)讓云天勵飛的團(tuán)隊飽受 " 折磨 "。
當(dāng)時美國還沒有開始大規(guī)模地打壓制裁中國科技企業(yè),要用芯片,直接進(jìn)口是許多企業(yè)的選擇,但陳寧還是想自己做出專為深目系統(tǒng)打造的嵌入式視覺 AI 芯片。
2018 年,美國封鎖芯片出口,同時,云天勵飛推出 DeepEye1000 視覺分析 SoC 芯片,與通用 GPU 相比,DeepEye1000 單位性能提升 20 倍。
2020 年 5 月,云天勵飛被美國商務(wù)部納入實體清單。這意味著云天勵飛在采購含美國技術(shù)的產(chǎn)品及使用相關(guān)技術(shù)工具時將受到嚴(yán)格限制。
這是云天勵飛面臨的又一次大考,公司需要回答一個關(guān)鍵問題:繼續(xù)在境外流片還是切換成國產(chǎn)工藝?
"2020 年國產(chǎn)工藝其實不太成熟,絕大部分公司在選擇工藝的時候,首先選擇的一定不是國產(chǎn)工藝。但也是在那一年,公司決定切回國產(chǎn)工藝。" 云天勵飛 CTO 李愛軍說道。
國產(chǎn)工藝因為良率的問題,每次流片的芯片面積不能太大,且還面臨算力密度的限制。
國產(chǎn)工藝的限制倒逼出云天勵飛的架構(gòu)創(chuàng)新,其首創(chuàng)了 " 算力積木 " 架構(gòu)以解決國產(chǎn)工藝帶來的挑戰(zhàn)。計算單元像樂高塊一樣組合,可實現(xiàn)算力的靈活擴(kuò)展、在國產(chǎn)工藝限制下拼出大算力的 AI 推理芯片。
2022 年,云天勵飛在國產(chǎn)工藝突破上迎來關(guān)鍵里程碑,自主設(shè)計的新一代邊緣計算芯片 DeepEdge10 系列 SoC 采用國內(nèi)先進(jìn)制程工藝成功流片。
2023 年,云天勵飛登陸科創(chuàng)板。
04 聚焦 AI 推理芯片,做難而正確的事
上市,讓云天勵飛走向新的篇章,更大的舞臺讓陳寧有底氣和決心去沖擊 AI 芯片研發(fā)事業(yè)新的高峰。
戰(zhàn)略聚焦 AI 芯片,不是一句口號,而需要大量的資金和時間投入,更需要對這件事能成的篤定。
《英偉達(dá)之道》所記錄的案例,恰是歷史給出的佐證。
英特爾曾為迎合華爾街的預(yù)期,拒絕采用 Arm 架構(gòu)和 GPU。
2006 年,英特爾啟動的 Larrabee GPU 項目因固守 x86 架構(gòu),造成功耗與成本高企,最終在 2010 年因 " 無法實現(xiàn)預(yù)期利潤 " 黯然終止。
同期,英偉達(dá)于 2006 年推出 CUDA,盡管連續(xù)多年虧損,黃仁勛仍執(zhí)意深耕。
Alexnet 的問世,進(jìn)一步激發(fā)了黃仁勛對人工智能的熱情,幾位關(guān)鍵副手都反對進(jìn)一步投資深度學(xué)習(xí)的情況之下,黃仁勛仍然力排眾議,堅持 "All in AI"。
最終在 AI 浪潮之下,英偉達(dá)成為全球首家市值突破四萬億美元的企業(yè)。
推動云天勵飛全面聚焦 AI 芯片,或許也需要巨大的決心和堅持。
一個芯片研發(fā)團(tuán)隊需要 10 多個子團(tuán)隊,各個團(tuán)隊每天磨合十幾個步驟,投入大、風(fēng)險大。
" 有時候一個 BUG 就毀掉你一年的付出,上億的資金打水漂。" 陳寧說到。
但 AI 芯片,是 " 不得不 " 做的事。
推理市場處在爆發(fā)前夜,今年 6 月,AMD CEO 蘇姿豐在新品發(fā)布會上指出,AI 推理計算需求未來幾年將以每年 80% 以上的速度增長,成為 AI 計算的最大驅(qū)動力,且數(shù)據(jù)中心之外,AI 也將部署在每個邊緣系統(tǒng)中。
對此,巨頭們動作頻頻。
英偉達(dá)的 Blackwell Ultra GPU 和下一代架構(gòu) Vera Rubin 都強化了推理能力。AMD 則發(fā)布 Instinct MI350 緊隨其后。
云天勵飛也在加速奔跑。
推理市場和應(yīng)用深度綁定,未來 AI 會在云、邊、端無處不在,在陳寧的規(guī)劃下,云天勵飛推出對應(yīng)這三個領(lǐng)域的產(chǎn)品系列:深穹、深界及深擎。
云端推理加速領(lǐng)域,云天勵飛推出了基于國產(chǎn)工藝打造的深穹 X6000 推理加速卡,擁有超大顯存、超高顯存帶寬算力比以及卓越的編解碼能力,能夠為大模型推理、圖像語義理解等任務(wù)提供高推理性能、高性價比的加速卡硬件產(chǎn)品?;谏铖?X6000 Mesh 加速卡,云天勵飛推出了各類推理一體機,可滿足各類場景、不同推理任務(wù)的需求。
據(jù)悉,云天勵飛已經(jīng)在與潛在大客戶溝通,此外,下一代大算力推理芯片也即將于明年流片。
邊緣計算領(lǐng)域,十余年的產(chǎn)品實踐,讓陳寧與團(tuán)隊積累了大量技術(shù) Know-how,這是云天跑得最快的領(lǐng)域,在高密度視頻智能分析、輕量級大模型(蒸餾模型)推理等典型場景中,云天勵飛已落地多個示范項目。
端側(cè)最具想象力的是具身智能,得益于與十余家頭部機器人廠商合作的建立,云天勵飛的邊緣芯片產(chǎn)品應(yīng)用于服務(wù)型機器人已進(jìn)入實際部署階段。
2023 年,DeepEdge10 進(jìn)入量產(chǎn),至今一年多的時間里,DeepEdge10 已經(jīng)按照陳寧的設(shè)想,在一體機、邊緣盒子、無人車及無人機等場景中,有序地實現(xiàn)了規(guī)?;涞?。
技術(shù)還要往前跑的,李愛軍告訴我們,第二代算力積木架構(gòu)正在研發(fā),將在新型計算、近存計算、NB-Mesh 新型互聯(lián)、新型封裝、NB-link 通用擴(kuò)展性等方面實現(xiàn)迭代,滿足模型對于極致推理效率、能效比及性價比的需求。
定義指令集、打造處理器生態(tài)以及十余年的 NPU 賽道技術(shù)沉淀,都是云天勵飛做好全自研國產(chǎn)工藝芯片的底氣。另一份厚重的家底,是公司戰(zhàn)略投資閃極科技、神州云海、智慧互通、臻識科技等下游公司,以及 11 年來攢下的客戶群。
"AI 推理芯片成本降低,AI 大規(guī)模應(yīng)用就會形成良性的產(chǎn)業(yè)循環(huán),所有的技術(shù)發(fā)展路徑都是這樣,今天,全世界產(chǎn)業(yè)里面最重要的便是打造高性價比、面向各類場景的 AI 推理芯片。" 陳寧說到。
大變革時代,陳寧帶著云天勵飛奔向?qū)儆谒麄兊南乱粋€故事。