公眾號(hào)記得加星標(biāo),第一時(shí)間看推送不會(huì)錯(cuò)過(guò)。
在英特爾、博通、Marvell、英偉達(dá)等巨頭的聯(lián)手推動(dòng)下,CPO(co-packaged optics:共封裝光學(xué))這個(gè)概念越來(lái)越被人熟悉。尤其是在人工智能大模型推高數(shù)據(jù)中心數(shù)據(jù)流量傳輸、" 超節(jié)點(diǎn) " 日漸走紅的當(dāng)下,CPO 被提上了緊急議程。
知名分析機(jī)構(gòu) Yole 也預(yù)測(cè),為了解決數(shù)據(jù)中心面臨的功率、密度、可擴(kuò)展性、帶寬和距離限制等問(wèn)題,產(chǎn)業(yè)界正在推動(dòng)從銅纜到光纖,從可插拔光模塊到 CPO 的轉(zhuǎn)變,這將帶動(dòng) CPO 市場(chǎng)規(guī)模從 2024 年的 4600 萬(wàn)美元躍升到 2030 年的 81 億美元,復(fù)合年增長(zhǎng)率達(dá) 137%。有見(jiàn)及此,除了文章開(kāi)頭提到的幾家廠商以外,包括臺(tái)積電、格羅方德等在內(nèi)的傳統(tǒng)巨頭和不少初創(chuàng)企業(yè)也投入到了這個(gè)轟轟烈烈的 CPO 浪潮中。
作為全球領(lǐng)先的光電混合算力提供商,曦智科技也成為了這個(gè)技術(shù)的重要推動(dòng)者。在近日開(kāi)幕的 2025 世界人工智能大會(huì)(WAIC 2025)上,曦智科技聯(lián)合燧原科技推出了國(guó)內(nèi)首款 xPU-CPO 光電共封裝原型系統(tǒng),為本土的數(shù)據(jù)中心互連樹(shù)立了一個(gè)新標(biāo)桿。
光互連,大勢(shì)所趨
歸根到底,CPO 的誕生,本質(zhì)是激增的流量需求與電信號(hào)傳輸瓶頸的矛盾,驅(qū)動(dòng)光互連發(fā)展的必然走向。
如文章開(kāi)頭所說(shuō),超大規(guī)模數(shù)據(jù)中心和云服務(wù)提供商的數(shù)據(jù)流量呈指數(shù)級(jí)增長(zhǎng),導(dǎo)致對(duì)網(wǎng)絡(luò)基礎(chǔ)設(shè)施帶寬的需求大幅增加,伴之而來(lái)的首個(gè)要求,就是驅(qū)動(dòng)交換機(jī)系統(tǒng)和以太網(wǎng)光纖提供越來(lái)越高的總帶寬。不過(guò)我們也清楚,由于數(shù)據(jù)中心在設(shè)定之初,對(duì)功率和能耗等參數(shù)都有一個(gè)預(yù)設(shè)。換而言之,帶寬的提升,必須要在一個(gè)可控的功率范圍內(nèi)實(shí)現(xiàn),否則帶來(lái)的改動(dòng)將是昂貴的。
近年來(lái),隨著數(shù)據(jù)傳輸量的飛增以及數(shù)據(jù)傳輸速度要求的指數(shù)級(jí)增長(zhǎng),這種矛盾越來(lái)越突出。
曦智科技聯(lián)合創(chuàng)始人,首席技術(shù)官孟懷宇博士在接受半導(dǎo)體行業(yè)觀察采訪的時(shí)候也直言:" 光進(jìn)銅退是過(guò)去幾十年的一個(gè)主旋律。光通信一開(kāi)始發(fā)力點(diǎn)是長(zhǎng)距離的跨洋通信,后來(lái)逐漸進(jìn)入更短的距離,目前在數(shù)據(jù)中心內(nèi)部通信中已經(jīng)成為主流。隨著速率越來(lái)越高,光在越來(lái)越短的距離通信上取代銅,是一個(gè)不可逆的趨勢(shì)。" 以數(shù)據(jù)中心的應(yīng)用為例,孟懷宇告訴半導(dǎo)體行業(yè)觀察,當(dāng)前數(shù)據(jù)中心機(jī)柜之間的互連已經(jīng)默認(rèn)使用光。但在十幾年前,它們依然是銅。
之所以會(huì)發(fā)生這樣的轉(zhuǎn)變,是大家意識(shí)到銅的局限性越來(lái)越明顯,光互連的成本也在下降。在看到第一個(gè)廠商嘗到甜頭并大獲成功以后,大家就紛紛效仿,進(jìn)而推動(dòng)行業(yè)完成變革。在孟懷宇博士看來(lái),同樣的故事,也將在近期火熱的超節(jié)點(diǎn)上演。
當(dāng)前國(guó)際主流超節(jié)點(diǎn)方案是通過(guò)提升單機(jī)柜功耗來(lái)部署更多 GPU,但受限于數(shù)據(jù)中心機(jī)柜的功耗天花板,GPU 密度提升存在瓶頸。而在引入光互連技術(shù)之后,就可以通過(guò)增加機(jī)柜數(shù)量保障 GPU 總量從而構(gòu)建超節(jié)點(diǎn)網(wǎng)絡(luò)。相比銅纜,光纜的遠(yuǎn)距離傳輸優(yōu)勢(shì)為超節(jié)點(diǎn)帶來(lái)交付與機(jī)柜解耦的核心價(jià)值:
1
突破規(guī)模上限:擺脫單機(jī)柜功耗束縛,支持萬(wàn)卡級(jí)彈性擴(kuò)展;
2
激活存量設(shè)施:兼容現(xiàn)有機(jī)房供電與散熱架構(gòu),降低部署成本;
3
靈活交付模式:可按算力需求動(dòng)態(tài)調(diào)整節(jié)點(diǎn)規(guī)模,實(shí)現(xiàn)分階段建設(shè);
4
相比電纜(粗、重),光纜部署更加友好
事實(shí)上,數(shù)據(jù)中心中使用光互連,也不是什么新鮮事。
例如早在 1995 年就被廣泛使用的可插拔光模塊(根據(jù)設(shè)計(jì)的不同,可區(qū)分為 DPO 和 LPO),就是數(shù)據(jù)中心的寵兒。但由于這種模塊被安裝在 PCB 邊緣,ASIC 則在封裝基底上,這就讓 PIC/EIC 與 ASIC 芯片之間擁有了較遠(yuǎn)的距離,而信號(hào)損耗隨著距離的增長(zhǎng)而變得更為明顯。此外,這些模塊的體積較大、互連密度低、功耗較大,隨著使用的增多,會(huì)給系統(tǒng)帶來(lái)很大的功耗負(fù)擔(dān)。
這就驅(qū)使業(yè)界在 2020 年左右提出了 NPO(Near packaged optics:近封裝光學(xué))。
如圖所示,NPO 架構(gòu)將光引擎與封裝 ASIC 相鄰布局于光學(xué)基板上,二者通過(guò)高性能基板互連。根據(jù) OIF 標(biāo)準(zhǔn),NPO 中 ASIC 與光學(xué)元件的間距可達(dá) 150mm,同時(shí)確保信道損耗≤ 13dB。
不過(guò),這依然不能滿足客戶。于是,將光器件和硅片集成在單一封裝基板上,旨在應(yīng)對(duì)下一代帶寬、功耗和成本挑戰(zhàn)的 CPO 應(yīng)運(yùn)而生。
CPO,蓄勢(shì)待發(fā)
有關(guān)注數(shù)據(jù)中心內(nèi)通信的讀者應(yīng)該有印象,在此前,英偉達(dá)曾引發(fā)了一波 " 光退銅進(jìn) " 的討論。起因是該公司黃仁勛當(dāng)時(shí)在介紹 DGX GB200 NVL72 時(shí)候表示:
" 英偉達(dá)在整個(gè)系統(tǒng)中使用了長(zhǎng)度合 2 英里共 5000 條 NVLink 線纜。如果將其切換成光學(xué)器件,就必須使用收發(fā)器和重定時(shí)器。僅這些收發(fā)器和重定時(shí)器就需要 20000 瓦功耗。但采用現(xiàn)在的方案,我們通過(guò) NVLink 交換機(jī)完全免費(fèi)完成了這項(xiàng)工作,并且節(jié)省了這些功耗用于計(jì)算。"
正是這番言論,引發(fā)了大家對(duì)光互連在數(shù)據(jù)中心應(yīng)用前景的擔(dān)憂。
姑勿論我們對(duì)英偉達(dá)的這種理解是否正確,抑或在當(dāng)前他們真的覺(jué)得銅纜更好。但從他們?cè)?GTC 2025 大會(huì)上發(fā)布了全球領(lǐng)先的硅光交換系統(tǒng)這個(gè)消息看來(lái),英偉達(dá)是看好 CPO 的方向的。據(jù)他們介紹,與傳統(tǒng)的可插拔光模塊相比,創(chuàng)新的共封裝硅光技術(shù)具有顯著優(yōu)勢(shì),包括功耗降低 3.5 倍、延遲更低以及網(wǎng)絡(luò)可靠性顯著提升。
從英偉達(dá)的這個(gè) " 風(fēng)波 ",更是折射出國(guó)內(nèi)發(fā)展 CPO 的勢(shì)在必行。
眾所周知,在數(shù)據(jù)中心通信中,大家公認(rèn)的功耗三座大山分別是交換 ASIC、光模塊和 SerDes。當(dāng)中,對(duì)于擔(dān)負(fù)數(shù)據(jù)傳輸重任的 SerDes 來(lái)說(shuō),還有一個(gè)不能規(guī)避的客觀事實(shí),那就是隨著速率提升,功耗也要提升。而且,受到傳輸材料的影響,為了保證信號(hào)傳輸效果,就需要把距離縮短,CPO 就是實(shí)現(xiàn)這個(gè)目標(biāo)的一個(gè)方法。由此,我們可以看到做出使用銅纜決定的英偉達(dá)在 SerDes 的實(shí)力。
如上圖所示,借助先進(jìn)封裝,CPO 技術(shù)能將光收發(fā)模塊和控制操作的 ASIC 芯片異構(gòu)集成到一起。這個(gè)設(shè)計(jì)不但縮短了芯片與模塊之間的布線距離,還通過(guò)將光學(xué)引擎和電交換芯片封裝在單個(gè)芯片中,形成具有一定功能的微系統(tǒng)。避開(kāi)了 BGA 和 LGA 的管腳密度的限制,并以更短的導(dǎo)線驅(qū)動(dòng)收發(fā)器,顯著減少通道損耗,進(jìn)而降低能耗。
孟懷宇博士也告訴半導(dǎo)體行業(yè)觀察,之所以英偉達(dá)還在選擇銅纜,是因?yàn)樗麄儽旧砟M設(shè)計(jì)就是世界一流,再加上他們?cè)趯?duì)先進(jìn)工藝和數(shù)字糾錯(cuò)能力有很高要求的 SerDes 上面有很深的積累。" 在當(dāng)前的全球競(jìng)爭(zhēng)態(tài)勢(shì)下,國(guó)內(nèi)的參與者是時(shí)候選擇 CPO 了。尤其是考慮到當(dāng)前供應(yīng)鏈的成熟度,CPO 蓄勢(shì)待發(fā)。" 孟懷宇博士表示," 相比傳統(tǒng)光模塊,CPO 可以顯著提高帶寬與密度,降低功耗和成本,提高光互連可靠性。"
國(guó)內(nèi)首創(chuàng),意義重大
作為一種發(fā)展已久的技術(shù),CPO 發(fā)展至今,衍生出了多種方案。如在光引擎方面,提供了基于硅光和基于 VCSEL 的技術(shù)路線選擇;來(lái)到硅光調(diào)制器方面,則有 MZM(Mach-Zehnder Modulator)和 MRM(Microring Modulator)之分;在封裝和互連方面,也各有各的優(yōu)勢(shì)。
具體到應(yīng)用場(chǎng)景上,作為一個(gè)物理層的技術(shù),CPO 能把光電的引擎和主芯片封裝在一起,當(dāng)中主芯片常見(jiàn)的是交換機(jī)芯片和 GPU,這也讓各大廠商基于各自優(yōu)勢(shì),選出了最適合他們的決定。例如博通就提供了可連接到博通以太網(wǎng)交換機(jī)和博通 XPU 的 CPO 平臺(tái)解決方案;至于另一個(gè)資深玩家英偉達(dá)則基于公司在可插拔光模塊和 MRM 積累,利用其獨(dú)特的硅光子工藝平臺(tái),打造了基于微環(huán)調(diào)制器的 CPO 系統(tǒng)。
來(lái)到曦智科技和燧原的合作,則是國(guó)內(nèi)首次采用 CPO 技術(shù)實(shí)現(xiàn) GPU 直接出光的成功案例。
" 我們這個(gè)合作是基于短距 SerDes 實(shí)現(xiàn)的,這是全球首創(chuàng)。" 孟懷宇博士告訴半導(dǎo)體行業(yè)觀察,他進(jìn)一步指出,這種短距方案,還沒(méi)有人做過(guò)嘗試。但公司做了一系列的技術(shù)驗(yàn)證,證明這是可行的。
" 該項(xiàng)目驗(yàn)證了 xPU-CPO 光電共封裝技術(shù)的可行性與技術(shù)方向,同時(shí)為中國(guó)人工智能基礎(chǔ)設(shè)施建設(shè)與先進(jìn)光學(xué)封裝產(chǎn)業(yè)突破奠定了關(guān)鍵技術(shù)錨點(diǎn)。" 孟懷宇博士說(shuō)。
在孟懷宇看來(lái),現(xiàn)在國(guó)內(nèi)的 CPO 產(chǎn)業(yè)鏈已成熟,特別是在上游廠商開(kāi)始紛紛入局以后,CPO 的落地更是指日可待。在問(wèn)到既然萬(wàn)事俱備 ,為何目前 CPO 還沒(méi)有大規(guī)模落地的原因時(shí),孟懷宇回應(yīng)道:新技術(shù)和新產(chǎn)品必然伴隨一定的風(fēng)險(xiǎn),大多數(shù)廠商對(duì)于技術(shù)方向的選擇都會(huì)有慣性,會(huì)根據(jù)自身的風(fēng)險(xiǎn)承受能力來(lái)調(diào)整節(jié)奏。因此,CPO 的規(guī)模化落地會(huì)需要一些時(shí)間。但任何積極的驗(yàn)證都會(huì)加速這個(gè)過(guò)程。
而曦智科技的成功,必定將給大家更多信心。
* 免責(zé)聲明:本文由作者原創(chuàng)。文章內(nèi)容系作者個(gè)人觀點(diǎn),半導(dǎo)體行業(yè)觀察轉(zhuǎn)載僅為了傳達(dá)一種不同的觀點(diǎn),不代表半導(dǎo)體行業(yè)觀察對(duì)該觀點(diǎn)贊同或支持,如果有任何異議,歡迎聯(lián)系半導(dǎo)體行業(yè)觀察。