文 | 劃重點(diǎn)KeyPoints,作者 | 林易
10月29日,英偉達(dá)在華盛頓舉行GTC大會(huì),黃仁勛在演講中再次強(qiáng)調(diào)摩爾定律(Moore's Law)已正式終結(jié)。當(dāng)前是一個(gè)AI算力需求呈雙重指數(shù)級(jí)增長(zhǎng)的時(shí)代,這一終結(jié)不僅是技術(shù)的瓶頸,更是一場(chǎng)新的計(jì)算競(jìng)賽的起點(diǎn)。
英偉達(dá)在此次GTC上交付了一套完整的AI工業(yè)革命基礎(chǔ)設(shè)施。從Grace BlackwellGB200到到NVLink-72全互聯(lián)機(jī)架,再到Omniverse DSX數(shù)字孿生工廠(chǎng),英偉達(dá)的戰(zhàn)略核心是:通過(guò)"極致協(xié)同設(shè)計(jì)"(Extreme Co-Design)來(lái)打破物理定律的限制,將AI推理(Inference)這個(gè)新的計(jì)算核心成本降至最低,從而持續(xù)驅(qū)動(dòng)AI工業(yè)發(fā)展的良性循環(huán)。
黃仁勛的演講主要包含以下幾個(gè)方面:
1、算力新經(jīng)濟(jì):推理成本的極致壓縮
英偉達(dá)的新架構(gòu),建立在一個(gè)新的算力洞察之上:AI模型從"預(yù)訓(xùn)練"邁向"后訓(xùn)練"和更高階的思考階段,對(duì)算力的需求呈爆炸式增長(zhǎng)。特別是"思考"過(guò)程,需要AI在每次互動(dòng)中處理上下文、分解問(wèn)題、規(guī)劃和執(zhí)行,這使得推理任務(wù)變得空前復(fù)雜和耗費(fèi)資源。
在摩爾定律失效的背景下,解決雙重指數(shù)級(jí)增長(zhǎng)的算力需求,只能依靠"極致協(xié)同設(shè)計(jì)"。Blackwell架構(gòu)不再將GPU視為獨(dú)立單元,而是通過(guò)NVLink72互聯(lián)結(jié)構(gòu),將72顆GPU整合為一個(gè)虛擬的超級(jí)GPU。相比上一代,GB200在推理性能上實(shí)現(xiàn)了驚人的10倍提升。
極致性能帶來(lái)的是最低的Token生成成本。盡管GB200是最昂貴的架構(gòu)之一,但其每秒Token產(chǎn)出率帶來(lái)的總擁有成本(TCO)最低。這是驅(qū)動(dòng)AI良性循環(huán)的關(guān)鍵經(jīng)濟(jì)杠桿。英偉達(dá)已經(jīng)規(guī)劃了下一代架構(gòu)Rubin,以確保算力性能的指數(shù)級(jí)增長(zhǎng)和成本的指數(shù)級(jí)下降。
2、從芯片到工廠(chǎng):基礎(chǔ)設(shè)施的生態(tài)圈化
英偉達(dá)正在將"數(shù)據(jù)中心"轉(zhuǎn)變?yōu)?AI工廠(chǎng)"。這種工廠(chǎng)只生產(chǎn)一種產(chǎn)品:有價(jià)值的Token。英偉達(dá)推出了Omniverse DSX,這是一個(gè)用于設(shè)計(jì)、規(guī)劃和運(yùn)營(yíng)吉瓦級(jí)AI工廠(chǎng)的藍(lán)圖與數(shù)字孿生平臺(tái)。
DSX讓西門(mén)子、施耐德電氣等合作伙伴,能在虛擬的Omniverse中協(xié)同設(shè)計(jì)計(jì)算密度、布局、電力和冷卻系統(tǒng)。這種設(shè)計(jì)優(yōu)化,對(duì)于一個(gè)1吉瓦的AI工廠(chǎng)而言,每年可帶來(lái)數(shù)十億美元的額外收入,極大地縮短了建設(shè)時(shí)間和上市周期。
在系統(tǒng)層面,英偉達(dá)的ConnectX和BlueField DPU(數(shù)據(jù)處理器)也進(jìn)行了深度協(xié)同設(shè)計(jì)。全新的ConnectX9 Super NIC和Spectrum-X以太網(wǎng)交換機(jī),專(zhuān)為AI高性能設(shè)計(jì),確保了大規(guī)模GPU間的通信不會(huì)成為網(wǎng)絡(luò)瓶頸。
新一代BlueField-4 DPU被定位為"上下文處理器",專(zhuān)門(mén)用于處理AI所需的巨大上下文,例如讀取大量PDF、論文或視頻后回答問(wèn)題,并加速KV緩存,解決當(dāng)前AI模型在處理長(zhǎng)對(duì)話(huà)歷史時(shí)越來(lái)越慢的問(wèn)題。
3、跨越邊界:進(jìn)軍物理AI與核心工業(yè)
英偉達(dá)的意圖將其核心技術(shù)擴(kuò)展到"物理AI"(Physical AI)的實(shí)體經(jīng)濟(jì)維度。
在電信領(lǐng)域,英偉達(dá)與諾基亞(Nokia)建立了深度合作,共同發(fā)布了NVIDIA ARC平臺(tái)。ARC將NVIDIA的Grace CPU、Blackwell GPU和ConnectX網(wǎng)卡結(jié)合,運(yùn)行Aerial CUDA-X庫(kù),旨在打造軟件定義的可編程無(wú)線(xiàn)通信系統(tǒng)。ARC還能實(shí)現(xiàn)AI on RAN,將AI云計(jì)算推向最靠近用戶(hù)的無(wú)線(xiàn)電邊緣,為工業(yè)機(jī)器人和邊緣應(yīng)用提供基礎(chǔ)設(shè)施。
人形機(jī)器人被視為未來(lái)最大的消費(fèi)電子和工業(yè)設(shè)備市場(chǎng)之一。英偉達(dá)是Figure等頂級(jí)機(jī)器人公司的核心合作伙伴,提供訓(xùn)練、模擬和運(yùn)行的全部平臺(tái)。此外,與迪士尼合作開(kāi)發(fā)的機(jī)器人,展示了在物理感知環(huán)境中進(jìn)行訓(xùn)練的潛力。
在自動(dòng)駕駛領(lǐng)域,NVIDIA DRIVE Hyperion平臺(tái)將環(huán)繞攝像頭、雷達(dá)和激光雷達(dá)標(biāo)準(zhǔn)化,使其成為一個(gè)"輪式計(jì)算平臺(tái)"。英偉達(dá)宣布與優(yōu)步(Uber)合作,將這些Drive Hyperion就緒的車(chē)輛接入全球網(wǎng)絡(luò),為Robo-Taxi的全球化部署奠定基礎(chǔ)。
在基礎(chǔ)科學(xué)領(lǐng)域,英偉達(dá)發(fā)布了CUDA-Q平臺(tái)和NVQLink互聯(lián)架構(gòu),目標(biāo)是將GPU超級(jí)計(jì)算與量子處理器(QPU)直接連接。這種混合架構(gòu)用于量子錯(cuò)誤校正和協(xié)同模擬,被美國(guó)能源部(DOE)的各大國(guó)家實(shí)驗(yàn)室廣泛采用。
4、企業(yè)AI與生態(tài)系統(tǒng)的戰(zhàn)略性覆蓋
黃仁勛認(rèn)為,AI的本質(zhì)是"工作者"(Workers),而不是"工具"(Tools)。AI能夠使用工具,這使其能夠參與到此前IT工具無(wú)法觸及的100萬(wàn)億美元的全球經(jīng)濟(jì)中。
為了將AI工作者部署到企業(yè)核心業(yè)務(wù)中,英偉達(dá)宣布了兩項(xiàng)重量級(jí)合作:
第一,攜手網(wǎng)絡(luò)安全巨頭CrowdStrike,共同打造基于云端和邊緣的AI網(wǎng)絡(luò)安全代理,以應(yīng)對(duì)AI帶來(lái)的新安全威脅,要求速度必須達(dá)到"光速"。
第二,與Palantir合作,加速其Ontology平臺(tái)的數(shù)據(jù)處理能力,為政府和企業(yè)提供更大規(guī)模、更快速的商業(yè)洞察。
英偉達(dá)還將CUDA-X庫(kù)集成到SAP、ServiceNow、Synopsys等關(guān)鍵企業(yè)SaaS平臺(tái)中,將這些工作流程轉(zhuǎn)化為"代理式SaaS"(Agentic SaaS)。
此次GTC,英偉達(dá)完成了從芯片公司到AI工業(yè)平臺(tái)領(lǐng)導(dǎo)者的徹底重塑,通過(guò)一套完整的架構(gòu)、網(wǎng)絡(luò)、工廠(chǎng)和行業(yè)延伸,試圖定義新一輪工業(yè)革命的底層標(biāo)準(zhǔn)。

1、開(kāi)場(chǎng):擁抱計(jì)算新紀(jì)元
華盛頓特區(qū)!歡迎來(lái)到GTC。很難不對(duì)美國(guó)感到感性和自豪,我得告訴你這件事。那段視頻太棒了!謝謝。英偉達(dá)的創(chuàng)意團(tuán)隊(duì)表現(xiàn)出色。
歡迎來(lái)到GTC,今天我們將與您深入探討諸多議題。GTC是我們討論行業(yè)、科學(xué)、計(jì)算、當(dāng)下與未來(lái)的地方。所以今天我有很多事情要和你討論,但在開(kāi)始之前,我想感謝所有贊助這場(chǎng)精彩活動(dòng)的合作伙伴。你會(huì)在展會(huì)現(xiàn)場(chǎng)看到所有這些產(chǎn)品,他們來(lái)這里是為了見(jiàn)你,真的很棒。沒(méi)有我們生態(tài)系統(tǒng)中所有合作伙伴的支持,我們無(wú)法完成我們的工作。
這可是AI界的超級(jí)碗,人們說(shuō)。因此,每屆超級(jí)碗都應(yīng)該有一場(chǎng)精彩的賽前表演。大家覺(jué)得賽前節(jié)目怎么樣?還有我們所有明星運(yùn)動(dòng)員和明星陣容。瞧瞧這幫家伙。不知怎的,我竟成了最壯實(shí)的那一個(gè)。你們覺(jué)得呢?我不知道我是否與此有關(guān)。
英偉達(dá)開(kāi)創(chuàng)了六十年來(lái)首個(gè)全新計(jì)算模型,正如你在視頻中所見(jiàn)。新的計(jì)算模型很少出現(xiàn)。這需要大量的時(shí)間和一系列條件。我們觀(guān)察到,我們發(fā)明了這種計(jì)算模型,因?yàn)槲覀兿胍鉀Q通用計(jì)算機(jī)無(wú)法處理的問(wèn)題。普通計(jì)算機(jī)無(wú)法做到。我們還注意到,總有一天晶體管將繼續(xù)發(fā)展。晶體管的數(shù)量將會(huì)增加,但晶體管的性能和功率提升速度將放緩。摩爾定律不會(huì)無(wú)限延續(xù),它終將受到物理定律的限制。而此刻,終于來(lái)臨了。丹納德縮放效應(yīng)已停止,它被稱(chēng)為丹納德縮放效應(yīng)。丹納德縮放定律已于近十年前停止,事實(shí)上,晶體管性能及其相關(guān)功率的提升已大幅放緩。然而,晶體管的數(shù)量仍在持續(xù)增加。我們觀(guān)察到這一點(diǎn)已經(jīng)很久了。
應(yīng)用并行計(jì)算,將其與順序處理的CPU結(jié)合,我們就能將計(jì)算能力擴(kuò)展到遠(yuǎn)超以往的水平。遠(yuǎn)遠(yuǎn)超出。而那一刻真的到來(lái)了。我們現(xiàn)在已經(jīng)看到了那個(gè)拐點(diǎn)。加速計(jì)算的時(shí)代已然來(lái)臨。然而,加速計(jì)算是一種根本不同的編程模型。你不能直接拿CPU軟件,那些是手工編寫(xiě)的軟件,順序執(zhí)行,并將其部署到GPU上確保正常運(yùn)行。事實(shí)上,如果你只是那樣做了,它實(shí)際上運(yùn)行得更慢。因此你必須重新設(shè)計(jì)新的算法。你必須創(chuàng)建新的庫(kù)。事實(shí)上,你必須重寫(xiě)該應(yīng)用程序。這就是為什么花了這么長(zhǎng)時(shí)間的原因。我們花了近三十年才走到今天這一步。但我們是一步一個(gè)腳印地完成的。
這是我們公司的瑰寶。大多數(shù)人都在談?wù)揋PU。GPU固然重要,但若沒(méi)有在其之上構(gòu)建的編程模型,若不致力于該編程模型,就無(wú)法確保其在不同版本間保持兼容性。我們現(xiàn)在正推出CUDA 13,并即將推出CUDA 14。數(shù)以?xún)|計(jì)的GPU在每臺(tái)計(jì)算機(jī)中運(yùn)行,完全兼容。如果我們不這樣做,那么開(kāi)發(fā)者就不會(huì)選擇這個(gè)計(jì)算平臺(tái)。如果我們不創(chuàng)建這些庫(kù),那么開(kāi)發(fā)者就不知道如何使用該算法,也無(wú)法充分發(fā)揮該架構(gòu)的潛力。一個(gè)接一個(gè)的申請(qǐng)。這確實(shí)是我們公司的瑰寶。
CuLitho,計(jì)算光刻技術(shù)。我們花了近七年時(shí)間才與cuLitho走到今天這一步,現(xiàn)在臺(tái)積電也用它,三星也用它,ASML使用它。這是一座令人驚嘆的計(jì)算庫(kù)。光刻,芯片制造的第一步。CAE應(yīng)用中的稀疏求解器。cuOpt,一款幾乎打破所有紀(jì)錄的數(shù)值優(yōu)化工具。旅行推銷(xiāo)員問(wèn)題,如何在供應(yīng)鏈中將數(shù)百萬(wàn)種產(chǎn)品與數(shù)百萬(wàn)客戶(hù)連接起來(lái)。Warp,用于CUDA的Python求解器,用于仿真。cuDF,一種基于數(shù)據(jù)框的方法,本質(zhì)上是加速SQL,數(shù)據(jù)框?qū)I(yè)版-數(shù)據(jù)框數(shù)據(jù)庫(kù)。這個(gè)庫(kù),正是開(kāi)啟AI的起點(diǎn),cuDNN,位于頂部的名為Megatron Core的庫(kù)使我們能夠模擬和訓(xùn)練超大規(guī)模語(yǔ)言模型。這樣的例子不勝枚舉。
MONAI,非常重要,是全球排名第一的醫(yī)學(xué)影像AI框架。順便說(shuō)一句,今天我們不會(huì)過(guò)多討論醫(yī)療保健問(wèn)題。但一定要去聽(tīng)金伯利的主題演講。她會(huì)詳細(xì)介紹我們?cè)卺t(yī)療保健領(lǐng)域開(kāi)展的工作。這樣的例子不勝枚舉?;蚪M學(xué)處理,Aerial,注意聽(tīng),今天我們要做一件非常重要的事。量子計(jì)算。這只是我們公司350個(gè)不同庫(kù)的代表之一。這些庫(kù)中的每一個(gè)都重新設(shè)計(jì)了加速計(jì)算所需的算法。這些庫(kù)的出現(xiàn),使得整個(gè)生態(tài)系統(tǒng)的所有合作伙伴都能利用加速計(jì)算的優(yōu)勢(shì)。這些庫(kù)中的每一家都為我們開(kāi)拓了新的市場(chǎng)。
這是深?yuàn)W的計(jì)算機(jī)科學(xué),深?yuàn)W的數(shù)學(xué),它美得簡(jiǎn)直令人難以置信。涵蓋了所有行業(yè),從醫(yī)療保健到生命科學(xué),制造業(yè)、機(jī)器人技術(shù)、自動(dòng)駕駛汽車(chē)、計(jì)算機(jī)圖形學(xué),甚至電子游戲。你所見(jiàn)到的第一張截圖,正是NVIDIA首次運(yùn)行的應(yīng)用程序。而這正是我們1993年起步的地方。而我們始終堅(jiān)信著自己所追求的目標(biāo),它生效了。很難想象你竟能親眼見(jiàn)證那個(gè)最初的虛擬格斗場(chǎng)景躍然眼前,而那家公司也相信我們今天會(huì)在這里。這真是一段無(wú)比精彩的旅程。我要感謝所有英偉達(dá)員工所做的一切。這真是太不可思議了。
今天我們要涵蓋的行業(yè)很多。我將涵蓋AI、6G、量子技術(shù)、模型、企業(yè)計(jì)算、機(jī)器人技術(shù)和工廠(chǎng)。讓我們開(kāi)始吧。我們有很多內(nèi)容要討論,還有許多重大消息要宣布。許多新伙伴會(huì)讓你大吃一驚。
2、加速計(jì)算崛起
電信是經(jīng)濟(jì)的脊梁,是經(jīng)濟(jì)的命脈。我們的產(chǎn)業(yè),我們的國(guó)家安全。然而,自無(wú)線(xiàn)技術(shù)誕生之初,我們便定義了這項(xiàng)技術(shù),我們制定了全球標(biāo)準(zhǔn),我們將美國(guó)技術(shù)輸出到世界各地,使世界能夠基于美國(guó)技術(shù)和標(biāo)準(zhǔn)進(jìn)行發(fā)展。那件事已經(jīng)過(guò)去很久了。當(dāng)今全球無(wú)線(xiàn)技術(shù)主要依賴(lài)于國(guó)外技術(shù)。我們的基礎(chǔ)通信架構(gòu)建立在外國(guó)技術(shù)之上。這種情況必須停止,而我們正有機(jī)會(huì)做到這一點(diǎn)。尤其是在這個(gè)根本性的平臺(tái)轉(zhuǎn)型期間。眾所周知,計(jì)算機(jī)技術(shù)是支撐所有行業(yè)的基石。這是科學(xué)最重要的工具。這是工業(yè)領(lǐng)域最重要的單一工具。我剛才說(shuō)我們正在經(jīng)歷平臺(tái)轉(zhuǎn)型。這次平臺(tái)轉(zhuǎn)型,應(yīng)當(dāng)是我們重返賽場(chǎng)千載難逢的機(jī)會(huì)。讓我們開(kāi)始運(yùn)用美國(guó)技術(shù)進(jìn)行創(chuàng)新。
今天,我們宣布我們將采取行動(dòng)。我們與諾基亞建立了重要的合作伙伴關(guān)系。諾基亞是全球第二大電信設(shè)備制造商。這是一個(gè)價(jià)值3萬(wàn)億美元的產(chǎn)業(yè)?;A(chǔ)設(shè)施投資高達(dá)數(shù)千億美元。全球有數(shù)百萬(wàn)個(gè)基站。如果我們能夠建立合作伙伴關(guān)系,就能基于這項(xiàng)以加速計(jì)算和AI為核心的非凡新技術(shù)進(jìn)行創(chuàng)新發(fā)展。而對(duì)于美國(guó)而言,要讓美國(guó)成為下一輪6G革命的核心。
因此,今天我們宣布英偉達(dá)推出了一條全新產(chǎn)品線(xiàn)。它被稱(chēng)為NVIDIA ARC,即空中無(wú)線(xiàn)電網(wǎng)絡(luò)計(jì)算機(jī)??罩蠷AN計(jì)算機(jī),ARC。ARC由三項(xiàng)基礎(chǔ)性新技術(shù)構(gòu)建而成:Grace CPU、Blackwell GPU以及我們的Mellanox ConnectX網(wǎng)絡(luò)解決方案專(zhuān)為該應(yīng)用設(shè)計(jì)。所有這些使我們能夠運(yùn)營(yíng)這座庫(kù),我之前提到的這個(gè)名為Aerial的CUDA X庫(kù)。Aerial本質(zhì)上是在CUDAX之上運(yùn)行的無(wú)線(xiàn)通信系統(tǒng)。我們將要首次創(chuàng)造一種軟件定義的可編程計(jì)算機(jī),能夠同時(shí)進(jìn)行無(wú)線(xiàn)通信和AI處理。這完全是革命性的。我們稱(chēng)之為NVIDIA ARC。
諾基亞將與我們合作,整合我們的技術(shù)。重寫(xiě)他們的棧。這是一家擁有7,000項(xiàng)5G核心基礎(chǔ)專(zhuān)利的公司。很難想象還有比他更杰出的電信業(yè)領(lǐng)袖了。因此我們將與諾基亞建立合作伙伴關(guān)系。他們將把NVIDIA ARC作為未來(lái)的基站。NVIDIA ARC還兼容AirScale,即當(dāng)前諾基亞的基站系統(tǒng)。這意味著我們將采用這項(xiàng)新技術(shù),能夠在全球范圍內(nèi)升級(jí)數(shù)百萬(wàn)個(gè)基站,實(shí)現(xiàn)6G和AI的升級(jí)。如今6G和AI確實(shí)具有根本性意義,因?yàn)樗鼈兪状螌?shí)現(xiàn)了我們將能夠使用AI技術(shù),即面向無(wú)線(xiàn)接入網(wǎng)的AI技術(shù)。提高無(wú)線(xiàn)電通信的頻譜效率。利用AI,采用強(qiáng)化學(xué)習(xí),實(shí)時(shí)調(diào)整波束成形,在具體情境中,取決于周邊環(huán)境、交通狀況以及移動(dòng)出行方式、天氣。所有這些因素都可納入考量,從而提升頻譜效率。頻譜效率消耗約全球1.5%至2%的電力。因此,提高頻譜效率不僅能提升無(wú)線(xiàn)網(wǎng)絡(luò)傳輸數(shù)據(jù)的能力,同時(shí)無(wú)需增加所需的能量消耗。
我們還能做另一件事,即為無(wú)線(xiàn)接入網(wǎng)提供AI支持。是AI-on-RAN。這是一個(gè)全新的機(jī)遇。請(qǐng)記住,互聯(lián)網(wǎng)實(shí)現(xiàn)了通信,但真正了不起的是那些聰明的公司。亞馬遜云科技在互聯(lián)網(wǎng)基礎(chǔ)上構(gòu)建了云計(jì)算系統(tǒng)。我們現(xiàn)在要在無(wú)線(xiàn)通信網(wǎng)絡(luò)上實(shí)現(xiàn)同樣的功能。這片新云將成為邊緣工業(yè)機(jī)器人云。此處指的是AI-on-RAN。首項(xiàng)是AI-for-RAN,提升無(wú)線(xiàn)電性能、提高無(wú)線(xiàn)電頻譜效率,第二是基于AI的無(wú)線(xiàn)接入網(wǎng),本質(zhì)上是無(wú)線(xiàn)通信領(lǐng)域的云計(jì)算。云計(jì)算將能夠直接延伸至邊緣區(qū)域,即沒(méi)有數(shù)據(jù)中心的地方。并非如此,因?yàn)槲覀冊(cè)谌蚋鞯囟荚O(shè)有基站。這個(gè)消息真是令人興奮。
讓我們來(lái)談?wù)劻孔佑?jì)算。1981年,粒子物理學(xué)家、量子物理學(xué)家理查德·費(fèi)曼構(gòu)想了一種新型計(jì)算機(jī),能夠直接模擬自然。因?yàn)樽匀槐旧砭褪橇孔踊?。他稱(chēng)之為量子計(jì)算機(jī)。40年后,該行業(yè)實(shí)現(xiàn)了根本性突破。40年后,就在去年,實(shí)現(xiàn)了根本性突破?,F(xiàn)在可以制造一個(gè)邏輯量子比特,一個(gè)保持相干性的邏輯量子位,穩(wěn)定,且錯(cuò)誤已修正。過(guò)去,一個(gè)邏輯量子比特由有時(shí)可能是10個(gè),有時(shí)可能是數(shù)百個(gè)物理量子比特協(xié)同工作。眾所周知,量子比特這些粒子極其脆弱。它們很容易變得不穩(wěn)定。任何觀(guān)察、任何采樣行為、任何環(huán)境條件都會(huì)導(dǎo)致其失相干。因此需要極其嚴(yán)格控制的環(huán)境。
如今,還有許多不同類(lèi)型的物理量子比特,它們協(xié)同工作,讓我們能夠?qū)@些量子比特進(jìn)行糾錯(cuò)。所謂的輔助量子位或綜合量子位,供我們進(jìn)行錯(cuò)誤糾正并推斷其邏輯量子位狀態(tài)。存在各種不同類(lèi)型的量子計(jì)算機(jī),超導(dǎo)、光子學(xué)、囚禁離子、穩(wěn)定原子,各種不同的方法來(lái)制造量子計(jì)算機(jī)?,F(xiàn)在我們意識(shí)到,必須將量子計(jì)算機(jī)直接連接到GPU超級(jí)計(jì)算機(jī),這樣才能進(jìn)行錯(cuò)誤糾正。以便我們能夠?qū)α孔佑?jì)算機(jī)進(jìn)行AI校準(zhǔn)與控制,以便我們能夠共同進(jìn)行模擬,協(xié)同工作,在GPU上運(yùn)行的正確算法,在QPU上運(yùn)行的正確算法,以及這兩種處理器,兩臺(tái)計(jì)算機(jī)并排工作。這就是量子計(jì)算的未來(lái)。
(視頻內(nèi)容:讓我們來(lái)看看。構(gòu)建量子計(jì)算機(jī)的方法有很多。每種都采用量子比特作為其核心構(gòu)建單元。但無(wú)論采用何種方法,所有量子比特,無(wú)論是超導(dǎo)量子比特、囚禁離子還是中性原子或光子,面臨相同的挑戰(zhàn)。它們非常脆弱,對(duì)噪音極其敏感。當(dāng)前的量子比特僅能穩(wěn)定運(yùn)行數(shù)百次操作。但解決有意義的問(wèn)題需要數(shù)萬(wàn)億次運(yùn)算。答案是量子糾錯(cuò)。測(cè)量會(huì)擾動(dòng)量子比特,從而破壞其內(nèi)部的信息。訣竅在于添加額外的量子比特,并使它們處于糾纏態(tài)。這樣,測(cè)量它們就能為我們提供足夠的信息來(lái)計(jì)算錯(cuò)誤發(fā)生的位置,同時(shí)不會(huì)損壞我們關(guān)心的量子比特。它非常出色,但需要超越最先進(jìn)的常規(guī)計(jì)算能力。
正因如此,我們打造了NVQLink,一種全新的互連架構(gòu),可將量子處理器與英偉達(dá)GPU直接連接。量子糾錯(cuò)需要從量子比特中讀取信息,計(jì)算錯(cuò)誤發(fā)生的位置,并將數(shù)據(jù)發(fā)送回去進(jìn)行修正。NVQLink能夠以每秒數(shù)千次的頻率,在量子硬件與外部設(shè)備之間傳輸數(shù)千兆字節(jié)的數(shù)據(jù),以滿(mǎn)足量子糾錯(cuò)所需的高速數(shù)據(jù)傳輸需求。其核心是CUDA-Q,我們面向量子GPU計(jì)算的開(kāi)放平臺(tái)。借助NVQ-Link和CUDA-Q,研究人員將能夠?qū)崿F(xiàn)超越錯(cuò)誤糾正的功能。他們還將能夠協(xié)調(diào)量子設(shè)備和AI超級(jí)計(jì)算機(jī)來(lái)運(yùn)行量子GPU應(yīng)用程序。量子計(jì)算不會(huì)取代經(jīng)典系統(tǒng)。它們將協(xié)同工作,融合為一個(gè)加速的量子超級(jí)計(jì)算平臺(tái)。)
要知道,CEO們可不是整天坐在辦公桌前打字的。這是體力活,純粹的體力活。因此,今天我們宣布推出NVQLink。其實(shí)現(xiàn)得益于兩點(diǎn):當(dāng)然,這個(gè)用于量子計(jì)算機(jī)控制和校準(zhǔn)的互連系統(tǒng),量子糾錯(cuò),以及連接兩臺(tái)計(jì)算機(jī),利用QPU和我們的GPU超級(jí)計(jì)算機(jī)進(jìn)行混合仿真。它還具有完全的可擴(kuò)展性。它不僅能為當(dāng)前數(shù)量有限的量子比特執(zhí)行糾錯(cuò)操作,它為明日的錯(cuò)誤糾正做準(zhǔn)備,屆時(shí)我們將把量子計(jì)算機(jī)從如今的數(shù)百量子比特?cái)U(kuò)展到數(shù)萬(wàn)量子比特。未來(lái)將擁有數(shù)十萬(wàn)個(gè)量子比特。因此,我們現(xiàn)在擁有了一套能夠?qū)崿F(xiàn)控制的架構(gòu),協(xié)同激發(fā)、量子糾錯(cuò)與未來(lái)擴(kuò)展。
業(yè)界的支持令人難以置信。在CUDA-Q發(fā)明之前,請(qǐng)記住,CUDA原本是為GPU、CPU和加速計(jì)算設(shè)計(jì)的,基本上是同時(shí)使用兩個(gè)處理器來(lái)完成一一用對(duì)工具做對(duì)事。如今,CUDA-Q已擴(kuò)展至CUDA之外,從而能夠支持QPU,使兩種處理器協(xié)同工作。QPU與GPU協(xié)同工作,計(jì)算任務(wù)在兩者之間往返傳遞,耗時(shí)僅數(shù)微秒,實(shí)現(xiàn)與量子計(jì)算機(jī)協(xié)同運(yùn)作所需的基本延遲。如今,CUDA-Q已成為一項(xiàng)了不起的突破性技術(shù),被眾多不同領(lǐng)域的開(kāi)發(fā)者所采用。我們今日宣布,共有17家量子計(jì)算機(jī)行業(yè)公司支持NVQLink。而且我對(duì)此感到非常興奮。
八個(gè)不同的美國(guó)能源部實(shí)驗(yàn)室:伯克利實(shí)驗(yàn)室、布魯克海文實(shí)驗(yàn)室、費(fèi)米實(shí)驗(yàn)室、林肯實(shí)驗(yàn)室、洛斯阿拉莫斯、橡樹(shù)嶺、太平洋西北、桑迪亞國(guó)家實(shí)驗(yàn)室。幾乎所有美國(guó)能源部的實(shí)驗(yàn)室都與我們展開(kāi)合作,攜手量子計(jì)算機(jī)公司生態(tài)系統(tǒng)及量子控制器供應(yīng)商,將量子計(jì)算逐步融入科學(xué)發(fā)展的未來(lái)藍(lán)圖。
我們正在經(jīng)歷幾次平臺(tái)轉(zhuǎn)型。一方面,我們正經(jīng)歷著加速計(jì)算的發(fā)展,這就是為什么未來(lái)的超級(jí)計(jì)算機(jī)都將基于GPU。我們將轉(zhuǎn)向AI,使AI與基于原理的求解器、基于原理的模擬協(xié)同工作?;谠淼奈锢砟M不會(huì)消失,但它可以被增強(qiáng)、強(qiáng)化、擴(kuò)展,使用代理模型、AI模型。
我們還知道,通過(guò)基于原理的求解器,經(jīng)典計(jì)算能夠借助量子計(jì)算來(lái)增強(qiáng)對(duì)自然狀態(tài)的理解。我們也知道,未來(lái)我們擁有如此多的信號(hào),必須從世界中采樣如此多的數(shù)據(jù),遙感技術(shù)的重要性已達(dá)到前所未有的高度。除非這些實(shí)驗(yàn)室成為自動(dòng)化工廠(chǎng),否則它們根本無(wú)法以我們所需的規(guī)模和速度進(jìn)行實(shí)驗(yàn),成為機(jī)器人實(shí)驗(yàn)室。因此,所有這些不同的技術(shù)正同時(shí)涌入科學(xué)領(lǐng)域。

我們來(lái)聊聊AI吧。什么是AI?大多數(shù)人會(huì)說(shuō)AI就是聊天機(jī)器人,嗯,這完全是理所當(dāng)然的。毫無(wú)疑問(wèn),ChatGPT正處于人們所認(rèn)為的AI的前沿。然而,正如你此刻所見(jiàn),這些科學(xué)超級(jí)計(jì)算機(jī)不會(huì)運(yùn)行聊天機(jī)器人,他們將從事基礎(chǔ)科學(xué)研究。
科學(xué)AI的世界遠(yuǎn)比想象中更廣闊,遠(yuǎn)不止是一個(gè)聊天機(jī)器人。當(dāng)然,聊天機(jī)器人極其重要,而通用AI則具有根本性的關(guān)鍵意義。深層計(jì)算機(jī)科學(xué)、非凡的計(jì)算能力以及重大突破,仍是實(shí)現(xiàn)AGI的關(guān)鍵要素。但除此之外,AI還有更多可能。
實(shí)際上,我將用幾種不同的方式來(lái)描述AI。第一種方式,即人們最初對(duì)AI的認(rèn)知,是它徹底重構(gòu)了計(jì)算棧。我們過(guò)去做軟件的方式是手工編碼,在CPU上運(yùn)行手工編碼軟件。如今,AI就是機(jī)器學(xué)習(xí)、訓(xùn)練,或者說(shuō)數(shù)據(jù)密集型編程,由在GPU上運(yùn)行的AI訓(xùn)練和學(xué)習(xí)而成。為實(shí)現(xiàn)這一目標(biāo),整個(gè)計(jì)算棧已發(fā)生改變。
注意,你在這兒看不到windows,也看不到CPU。你看到的是完全不同的、從根本上截然不同的架構(gòu)。
在能源之上還有這些GPU。這些GPU被連接到、集成到我稍后將展示的基礎(chǔ)設(shè)施中。在這項(xiàng)基礎(chǔ)設(shè)施之上——它由巨型數(shù)據(jù)中心構(gòu)成,其規(guī)模輕松達(dá)到這個(gè)房間的數(shù)倍之多。巨大的能量隨后通過(guò)名為GPU超級(jí)計(jì)算機(jī)的新設(shè)備轉(zhuǎn)化,從而生成數(shù)據(jù)。這些數(shù)字被稱(chēng)為tokens。
語(yǔ)言,也就是計(jì)算的基本單位,是AI的詞匯表。幾乎任何東西都可以進(jìn)行tokens化。當(dāng)然,你可以對(duì)英語(yǔ)單詞進(jìn)行分詞處理,你可以對(duì)圖像進(jìn)行分詞處理,這就是你能夠識(shí)別圖像或生成圖像的原因。對(duì)視頻進(jìn)行分詞,對(duì)3D結(jié)構(gòu)進(jìn)行分詞。你可以對(duì)化學(xué)物質(zhì)、蛋白質(zhì)和基因進(jìn)行tokens化處理,你可以對(duì)單元格進(jìn)行tokens化處理,將具有結(jié)構(gòu)的幾乎任何事物、具有信息內(nèi)容的任何事物進(jìn)行分詞處理。
一旦能夠?qū)⑵鋞okens化,AI就能學(xué)習(xí)該語(yǔ)言及其含義。一旦它學(xué)會(huì)了那種語(yǔ)言的含義,它就能翻譯,它能回應(yīng),就像你與ChatGPT互動(dòng)那樣,它能生成內(nèi)容。因此,你所看到ChatGPT所做的一切基礎(chǔ)功能,你只需想象一下,如果它是一種蛋白質(zhì)會(huì)怎樣?如果它是一種化學(xué)物質(zhì)呢?如果它是一個(gè)3D結(jié)構(gòu),比如工廠(chǎng)呢?如果它是一個(gè)機(jī)器人,而tokens是理解行為并將其轉(zhuǎn)化為動(dòng)作和行為的標(biāo)記呢?所有這些概念基本上是一樣的。這正是AI取得如此非凡進(jìn)展的原因。
在這些模型之上還有應(yīng)用程序。Transformers是一個(gè)極其有效的模型,但并不存在放之四海皆準(zhǔn)的通用模型。只是AI具有普遍影響。模型種類(lèi)繁多。在過(guò)去的幾年里,我們享受了發(fā)明帶來(lái)的樂(lè)趣,并經(jīng)歷了創(chuàng)新的洗禮,例如多模態(tài)的突破。有這么多不同類(lèi)型的模型,有CNN模型(卷積神經(jīng)網(wǎng)絡(luò)模型),有狀態(tài)空間模型,也有圖神經(jīng)網(wǎng)絡(luò)模型,多模態(tài)模型,當(dāng)然,還包括我剛才描述的所有不同的分詞方式和分詞方法。
你可以構(gòu)建在理解層面具有空間特性、針對(duì)空間感知能力進(jìn)行了優(yōu)化的模型。你可以擁有針對(duì)長(zhǎng)序列進(jìn)行優(yōu)化、在較長(zhǎng)時(shí)間內(nèi)識(shí)別微妙信息的模型。有如此多不同類(lèi)型的模型。在這些模型之上,還有構(gòu)建在這些模型架構(gòu)之上的架構(gòu)——這些就是應(yīng)用程序。
過(guò)去的軟件產(chǎn)業(yè)致力于創(chuàng)造工具。Excel是一個(gè)工具,Word是一款工具,網(wǎng)頁(yè)瀏覽器是一種工具。我之所以知道這些是工具,是因?yàn)槟闶褂盟鼈?。工具行業(yè),正如螺絲刀和錘子,其規(guī)模有限。就IT工具而言,它們可以是數(shù)據(jù)庫(kù)工具,這些IT工具的價(jià)值約為一萬(wàn)億美元左右。
但AI并非工具,AI是工作,這就是本質(zhì)上的區(qū)別。AI實(shí)際上就是能夠真正使用工具的勞動(dòng)者。我特別興奮的一件事,就是歐文在Perplexity公司開(kāi)展的工作。Perplexity使用網(wǎng)頁(yè)瀏覽器預(yù)訂假期或購(gòu)物,本質(zhì)上就是一個(gè)使用工具的AI。Cursor是一款A(yù)I系統(tǒng),是我們?cè)谟ミ_(dá)使用的具有自主決策能力的AI系統(tǒng)。英偉達(dá)的每位軟件工程師都在使用Cursor,它極大地提高了我們的生產(chǎn)效率。它基本上是每位軟件工程師的代碼生成助手,并且它使用了一個(gè)工具,它使用的工具名為VSCode。因此,Cursor是一個(gè)基于VSCode的智能代理式AI系統(tǒng)。
所有這些不同的行業(yè),無(wú)論是聊天機(jī)器人、數(shù)字生物學(xué)、AI助手研究員,還有在自動(dòng)駕駛出租車(chē)內(nèi),當(dāng)然,AI司機(jī)是無(wú)形的。但顯然有一個(gè)AI司機(jī)在工作,而他完成這項(xiàng)工作的工具就是汽車(chē)。因此,我們迄今為止所創(chuàng)造的一切,整個(gè)世界,我們迄今為止創(chuàng)造的一切,都是工具,供我們使用的工具。技術(shù)如今首次能夠承擔(dān)工作,并幫助我們提高生產(chǎn)力。機(jī)遇清單源源不斷,這正是AI能夠觸及IT從未涉足的經(jīng)濟(jì)領(lǐng)域的原因。
IT是支撐著100萬(wàn)億美元全球經(jīng)濟(jì)的工具之下,蘊(yùn)藏著數(shù)萬(wàn)億美元價(jià)值的基石。如今,AI將首次參與這100萬(wàn)億美元的經(jīng)濟(jì)體,并提升其生產(chǎn)力,讓它增長(zhǎng)得更快,變得更大。我們面臨嚴(yán)重的勞動(dòng)力短缺問(wèn)題,擁有能夠增強(qiáng)勞動(dòng)力的AI將助力我們實(shí)現(xiàn)增長(zhǎng)。
從科技產(chǎn)業(yè)的角度來(lái)看,這點(diǎn)同樣耐人尋味:除了AI作為新興技術(shù)正在開(kāi)拓經(jīng)濟(jì)新領(lǐng)域之外,AI本身也是一種新興產(chǎn)業(yè)。正如我先前所解釋的,這個(gè)tokens,這些數(shù)字,在你將所有不同模態(tài)的信息進(jìn)行分詞處理之后,有一家工廠(chǎng)需要生產(chǎn)這些數(shù)字。
與過(guò)去的計(jì)算機(jī)行業(yè)和芯片行業(yè)不同,如果你回顧過(guò)去的芯片行業(yè),芯片行業(yè)約占數(shù)萬(wàn)億美元IT產(chǎn)業(yè)的5%至10%,可能更少。原因在于,使用Excel、使用瀏覽器、使用Word并不需要太多的計(jì)算量。我們進(jìn)行計(jì)算,但在這個(gè)新世界里,需要一臺(tái)始終理解上下文的計(jì)算機(jī)。它無(wú)法預(yù)先計(jì)算出結(jié)果,因?yàn)槊看文阌秒娔X進(jìn)行AI操作時(shí),每次你讓AI做某事時(shí),上下文都不同,因此它必須處理所有這些信息。
例如自動(dòng)駕駛汽車(chē)的情況,它必須處理車(chē)輛的上下文信息,進(jìn)行上下文處理。你要求AI執(zhí)行什么指令?然后它必須一步一步地分解問(wèn)題,思考此事,制定計(jì)劃并付諸實(shí)施。該步驟中的每個(gè)操作都需要生成大量tokens。這就是為什么我們需要一種新型系統(tǒng)的原因,我稱(chēng)之為AI工廠(chǎng)。這絕對(duì)是個(gè)AI工廠(chǎng)。
它與過(guò)去的數(shù)據(jù)中心截然不同。這是一座AI工廠(chǎng),因?yàn)檫@座工廠(chǎng)只生產(chǎn)一種東西。不同于過(guò)去包攬一切的數(shù)據(jù)中心——為我們所有人存儲(chǔ)文件,運(yùn)行各種不同的應(yīng)用程序,你可以像使用電腦一樣使用該數(shù)據(jù)中心,運(yùn)行各種應(yīng)用程序,你某天可以用它來(lái)玩游戲,可以用它來(lái)瀏覽網(wǎng)頁(yè),可以用它來(lái)做賬。因此,那是一臺(tái)屬于過(guò)去的計(jì)算機(jī),一臺(tái)通用計(jì)算機(jī)。
我在此所說(shuō)的計(jì)算機(jī)是一座工廠(chǎng),它基本上只運(yùn)行一件事。它運(yùn)行AI,其目的在于生成價(jià)值最大化的tokens。這意味著他們必須聰明。而你希望以驚人的速度生成這些tokens,因?yàn)楫?dāng)你向AI提出請(qǐng)求時(shí),你希望它做出回應(yīng)。請(qǐng)注意,在高峰時(shí)段,這些AI的響應(yīng)速度正變得越來(lái)越慢,因?yàn)樗獮楹芏嗳俗龊芏喙ぷ?。因此你希望它能以驚人的速度生成有價(jià)值的tokens,而你希望它能以經(jīng)濟(jì)高效的方式實(shí)現(xiàn)。我使用的每個(gè)詞都符合AI工廠(chǎng)的特征,與汽車(chē)廠(chǎng)或任何工廠(chǎng)一樣。這絕對(duì)是工廠(chǎng),而且這些工廠(chǎng)以前從未存在過(guò)。而這些工廠(chǎng)里堆積著成山的芯片。
這便引出了今天。過(guò)去幾年發(fā)生了什么?事實(shí)上,去年發(fā)生了什么?其實(shí)今年確實(shí)發(fā)生了一件相當(dāng)深刻的事情。若你回顧年初,每個(gè)人對(duì)AI都有自己的看法。這種態(tài)度通常是:這會(huì)是個(gè)大事件,那將是未來(lái)。而幾個(gè)月前,不知怎么的,它啟動(dòng)了渦輪增壓。
原因有以下幾點(diǎn)。第一點(diǎn)是,在過(guò)去的幾年里,我們已經(jīng)摸清了如何讓AI變得聰明得多。與其說(shuō)只是預(yù)訓(xùn)練,不如說(shuō)預(yù)訓(xùn)練本質(zhì)上表明:讓我們把人類(lèi)創(chuàng)造過(guò)的所有信息都拿出來(lái),讓我們把它交給AI來(lái)學(xué)習(xí)吧,本質(zhì)上就是記憶和概括。這就像我們小時(shí)候上學(xué)一樣,學(xué)習(xí)的第一階段。預(yù)訓(xùn)練從來(lái)就不是終點(diǎn),正如學(xué)前教育也從來(lái)不是教育的終點(diǎn)。
學(xué)前教育,本質(zhì)上就是培養(yǎng)你掌握智力發(fā)展的基礎(chǔ)技能,讓你懂得如何學(xué)習(xí)其他一切知識(shí)。沒(méi)有詞匯量,不理解語(yǔ)言及其表達(dá)方式,如何思考,這是無(wú)法學(xué)到其他一切的。接下來(lái)是培訓(xùn)后階段。培訓(xùn)之后,在培訓(xùn)之前,是傳授你解決問(wèn)題的技能,分解問(wèn)題,思考它,如何解決數(shù)學(xué)問(wèn)題,如何編寫(xiě)代碼,如何逐步思考這些問(wèn)題,運(yùn)用第一性原理推理。而之后才是計(jì)算真正發(fā)揮作用的階段。
眾所周知,對(duì)我們?cè)S多人來(lái)說(shuō),我們?nèi)ド蠈W(xué)了,就我而言,那是幾十年前的事了。但自那以后,我學(xué)到了更多,思考得也更深了。而原因在于我們始終在不斷汲取新知識(shí)來(lái)充實(shí)自己。我們不斷進(jìn)行研究,也持續(xù)思考。思考才是智力的真正本質(zhì)。
因此,我們現(xiàn)在擁有三項(xiàng)基礎(chǔ)技術(shù)能力。我們擁有這三項(xiàng)技術(shù):預(yù)訓(xùn)練,仍需投入巨大資源,海量的計(jì)算量。我們現(xiàn)在有后訓(xùn)練,它使用了更多的計(jì)算資源。而如今,思考給基礎(chǔ)設(shè)施帶來(lái)了難以置信的計(jì)算負(fù)荷,因?yàn)樗跒槲覀兠總€(gè)人代勞思考。因此,AI進(jìn)行思考所需的計(jì)算量,這種推論,實(shí)在相當(dāng)非凡。
以前我常聽(tīng)人說(shuō)推理很容易,英偉達(dá)應(yīng)該進(jìn)行培訓(xùn)。NVIDIA要搞的,你知道的,他們?cè)谶@方面真的很厲害,所以他們要進(jìn)行培訓(xùn),這個(gè)推論很簡(jiǎn)單。但思考怎么可能容易?背誦記憶的內(nèi)容很容易,背誦乘法表很容易。思考是艱難的,這正是這三把尺子的緣由。這三條新的標(biāo)度律,即全部?jī)?nèi)容都在其中全速運(yùn)轉(zhuǎn),給計(jì)算量帶來(lái)了巨大壓力。
現(xiàn)在又發(fā)生了另一件事。從這三條標(biāo)度律中,我們獲得了更智能的模型。而這些更智能的模型需要更強(qiáng)的計(jì)算能力。但當(dāng)你獲得更智能的模型時(shí),你便獲得了更高的智能水平,人們使用它。你的模型越聰明,使用的人越多?,F(xiàn)在它更接地氣了,它能夠進(jìn)行推理。它能夠解決以前從未學(xué)過(guò)如何解決的問(wèn)題,因?yàn)樗茏鲅芯?,去了解它,回?lái)拆解它,思考如何解決你的問(wèn)題,如何回答你的問(wèn)題,然后去解決它。思考的深度正使模型變得更智能。它越智能,使用的人就越多。它越智能,就需要進(jìn)行越多的計(jì)算。
但事情是這樣的。過(guò)去一年,AI行業(yè)迎來(lái)了轉(zhuǎn)折點(diǎn)。這意味著AI模型如今已足夠智能,他們正在創(chuàng)造價(jià)值,他們值得為此付費(fèi)。NVIDIA為每份Cursor許可證付費(fèi),我們樂(lè)意如此。我們樂(lè)意為之,因?yàn)镃ursor正助力身價(jià)數(shù)十萬(wàn)美元的軟件工程師或AI研究員實(shí)現(xiàn)多重價(jià)值,效率高出許多倍。當(dāng)然,我們非常樂(lè)意為您效勞。這些AI模型已經(jīng)足夠優(yōu)秀,值得為此付費(fèi)。Cursor、ElevenLabs、Synthesia、Abridge、OpenEvidence,名單還在繼續(xù)。當(dāng)然,OpenAI,當(dāng)然,Claude。這些模型如今如此出色,人們?yōu)榇烁顿M(fèi)。
而且因?yàn)槿藗冋跒榇烁顿M(fèi)并使用得更多,每次他們使用更多時(shí),你需要更多計(jì)算能力。我們現(xiàn)在有兩個(gè)指數(shù)函數(shù)。這兩個(gè)指數(shù),其中一個(gè)是三階縮放定律中的指數(shù)計(jì)算需求。第二個(gè)指數(shù)函數(shù)是,模型越聰明,使用的人越多,使用的人越多,它需要的計(jì)算量就越大。
兩個(gè)指數(shù)級(jí)增長(zhǎng)的趨勢(shì)正對(duì)全球計(jì)算資源施加壓力,而就在不久前我才告訴過(guò)你們,摩爾定律已基本終結(jié)。那么問(wèn)題來(lái)了,我們?cè)撛趺崔k?如果我們有這兩項(xiàng)指數(shù)級(jí)增長(zhǎng)的需求,如果我們找不到降低成本的方法,那么這個(gè)正反饋系統(tǒng),這個(gè)本質(zhì)上稱(chēng)為良性循環(huán)的循環(huán)反饋系統(tǒng)——對(duì)幾乎所有行業(yè)都至關(guān)重要,對(duì)任何平臺(tái)型行業(yè)都至關(guān)重要——就可能無(wú)法持續(xù)。
這對(duì)英偉達(dá)至關(guān)重要。我們現(xiàn)已進(jìn)入CUDA的虛擬周期。應(yīng)用程序越多,人們創(chuàng)建的應(yīng)用程序越多,CUDA就越有價(jià)值。CUDA越有價(jià)值,購(gòu)買(mǎi)的CUDA計(jì)算機(jī)就越多。購(gòu)買(mǎi)的CUDA并行計(jì)算機(jī)越多,越來(lái)越多的開(kāi)發(fā)者希望為其創(chuàng)建應(yīng)用程序。經(jīng)過(guò)三十年的發(fā)展,英偉達(dá)終于實(shí)現(xiàn)了這一虛擬循環(huán)。十五年后,我們終于在AI領(lǐng)域?qū)崿F(xiàn)了這一目標(biāo)。AI現(xiàn)已進(jìn)入虛擬循環(huán)階段。
因此你用得越多,因?yàn)锳I很聰明,而我們?yōu)榇烁顿M(fèi),產(chǎn)生的利潤(rùn)就越多。產(chǎn)生的利潤(rùn)越多,投入的計(jì)算資源就越多。在電網(wǎng)中,投入到AI工廠(chǎng)的計(jì)算資源越多,計(jì)算能力越強(qiáng),AI變得越來(lái)越聰明。越聰明,使用它的人越多,使用它的應(yīng)用程序就越多,我們能解決的問(wèn)題就越多。
這個(gè)虛擬循環(huán)正在運(yùn)轉(zhuǎn)。我們需要做的是大幅降低成本。因此,其一,用戶(hù)體驗(yàn)得以提升,當(dāng)你向AI發(fā)出指令時(shí),它會(huì)更快地作出響應(yīng)。其二,通過(guò)降低其成本來(lái)維持這個(gè)虛擬循環(huán)的運(yùn)轉(zhuǎn),以便它能變得更智能,以便更多人會(huì)使用它,諸如此類(lèi)。那個(gè)虛擬循環(huán)正在運(yùn)轉(zhuǎn)。
但當(dāng)摩爾定律真的達(dá)到極限時(shí),我們?cè)撊绾瓮黄颇??答案就是極致協(xié)同設(shè)計(jì)。你不能僅僅設(shè)計(jì)芯片,就指望在芯片上運(yùn)行的東西會(huì)變得更快。在芯片設(shè)計(jì)中,你所能做的最好就是添加——我不知道,每隔幾年晶體管數(shù)量就會(huì)增加50%。如果你再增加更多晶體管的話(huà)……你知道嗎,我們可以擁有更多的晶體管,臺(tái)積電是一家了不起的公司,我們只會(huì)繼續(xù)增加更多晶體管。
然而,這些都是百分比,而非指數(shù)增長(zhǎng)。我們需要復(fù)合指數(shù)增長(zhǎng)來(lái)維持這個(gè)虛擬循環(huán)的運(yùn)轉(zhuǎn)。我們稱(chēng)之為極致協(xié)同設(shè)計(jì)。

英偉達(dá)是當(dāng)今世界上唯一一家能夠真正從一張白紙開(kāi)始,構(gòu)思全新基礎(chǔ)架構(gòu)的公司,包括計(jì)算機(jī)架構(gòu)、新型芯片、新型系統(tǒng)、新型軟件、新型架構(gòu)、新型應(yīng)用程序,同時(shí)兼顧。在座的許多人之所以在此,是因?yàn)槟銈兌际悄菍咏Y(jié)構(gòu)的不同組成部分,在與NVIDIA合作時(shí),是該堆棧的不同部分。我們從根本上重新構(gòu)建了所有架構(gòu)。
然后,由于AI是一個(gè)如此龐大的問(wèn)題,我們擴(kuò)大規(guī)模。我們打造了一臺(tái)完整的計(jì)算機(jī),這是首臺(tái)能夠擴(kuò)展至整機(jī)架規(guī)模的計(jì)算機(jī)。這臺(tái)計(jì)算機(jī)配備單張GPU,隨后我們通過(guò)發(fā)明名為Spectrum-X的新型AI以太網(wǎng)技術(shù)實(shí)現(xiàn)橫向擴(kuò)展。
人人都說(shuō)以太網(wǎng)就是以太網(wǎng)。但以太網(wǎng)根本算不上以太網(wǎng)。Spectrum-X以太網(wǎng)專(zhuān)為AI性能而設(shè)計(jì),這正是它如此成功的原因。即便如此,那也不夠大。我們將用AI超級(jí)計(jì)算機(jī)和GPU填滿(mǎn)整個(gè)房間。這仍然不夠大,因?yàn)锳I的應(yīng)用數(shù)量和用戶(hù)數(shù)量正在持續(xù)呈指數(shù)級(jí)增長(zhǎng)。
我們將多個(gè)這樣的數(shù)據(jù)中心相互連接起來(lái),我們稱(chēng)之為Spectrum-XGS的規(guī)?!狦iga Scale X-Spectrum。通過(guò)這樣做,我們?cè)谌绱司薮蟮膶用嫔线M(jìn)行協(xié)同設(shè)計(jì),達(dá)到如此極致的程度,其性能提升令人震驚,并非每代提升50%或25%,但遠(yuǎn)不止于此。
這是我們迄今為止打造的最極致的協(xié)同設(shè)計(jì)計(jì)算機(jī),坦率地說(shuō),是現(xiàn)代制造的。自IBM System/360以來(lái),我認(rèn)為還沒(méi)有哪臺(tái)計(jì)算機(jī)像這樣被徹底重新設(shè)計(jì)過(guò)。這個(gè)系統(tǒng)的創(chuàng)建過(guò)程極其艱難。
我馬上讓你見(jiàn)識(shí)它的妙處。但本質(zhì)上我們所做的,好吧,這有點(diǎn)像美國(guó)隊(duì)長(zhǎng)的盾牌。所以NVLink72,如果我們要制造一枚巨型芯片,一塊巨型GPU,它看起來(lái)會(huì)是這樣。這就是我們必須進(jìn)行的晶圓級(jí)加工的程度,太不可思議了。
所有這些芯片現(xiàn)在都被裝入一個(gè)巨大的機(jī)架中。是我干的還是別人干的?放入那個(gè)巨大的架子…… 你知道嗎,有時(shí)候我覺(jué)得自己并不孤單。僅憑這組巨型支架,便使所有芯片協(xié)同運(yùn)作,渾然一體。這簡(jiǎn)直令人難以置信,我這就向你展示其中的好處。情況是這樣的。所以…… 謝謝,珍妮。我——我喜歡這個(gè)。嗯。好的。女士們、先生們,賈妮娜·保羅。哇!明白了。在未來(lái)……
接下來(lái),我就像雷神那樣去干。就像你在家里,卻夠不到遙控器,你只要這樣做,就會(huì)有人把它送給你。就是這樣。嗯。如果你看一下列表。這種事從不會(huì)發(fā)生在我身上,我只是在做夢(mèng)罷了。
看起來(lái)你實(shí)際能基準(zhǔn)測(cè)試的GPU列表大約有90%是NVIDIA。好吧,所以不管怎樣,我們基本上…… 但是。這是NVLink 8。如今,這些模型如此龐大,我們的解決方式是將模型將這個(gè)龐然大物拆解成眾多專(zhuān)家。這有點(diǎn)像一個(gè)團(tuán)隊(duì)。因此,這些專(zhuān)家擅長(zhǎng)處理特定類(lèi)型的問(wèn)題。我們召集了一大批專(zhuān)家。
因此,這個(gè)價(jià)值數(shù)萬(wàn)億美元的巨型AI模型匯聚了眾多不同領(lǐng)域的專(zhuān)家。我們將所有這些不同領(lǐng)域的專(zhuān)家都集中到一個(gè)GPU上?,F(xiàn)在,這是NVLink 72。我們可以把所有芯片都集成到一塊巨型晶圓上,每位專(zhuān)家都能相互交流。因此,這位首席專(zhuān)家能夠與所有在崗的專(zhuān)家進(jìn)行交流,以及所有必要的上下文、提示和我們必須處理的大量數(shù)據(jù),一堆tokens,我們必須發(fā)送給所有專(zhuān)家。專(zhuān)家們會(huì)…… 無(wú)論哪位專(zhuān)家被選中解答問(wèn)題,都會(huì)隨即嘗試作出回應(yīng)。
然后它就會(huì)開(kāi)始逐層逐層地執(zhí)行這個(gè)操作,有時(shí)八人,有時(shí)十六人,有時(shí)這些專(zhuān)家有時(shí)是64,有時(shí)是256。但關(guān)鍵在于,專(zhuān)家的數(shù)量正越來(lái)越多。嗯,這里,NVLink 72,我們擁有72個(gè)GPU。正因如此,我們才能將四位專(zhuān)家整合到單個(gè)GPU中。
你需要為每塊GPU做的最重要的事就是生成tokens,即您在HBM內(nèi)存中擁有的帶寬數(shù)量。我們擁有一臺(tái)H系列GPU,為四位專(zhuān)家提供計(jì)算支持。與這里不同,因?yàn)槊颗_(tái)計(jì)算機(jī)最多只能安裝八個(gè)GPU,我們必須將32位專(zhuān)家整合到單個(gè)GPU中。因此這塊GPU需要為32位專(zhuān)家進(jìn)行思考,相比之下,該系統(tǒng)中每塊GPU只需處理四項(xiàng)任務(wù)。正因如此,速度差異才此驚人。
這剛發(fā)布。這是由SemiAnalysis完成的基準(zhǔn)測(cè)試。他們干得非常、非常徹底。他們對(duì)所有可進(jìn)行基準(zhǔn)測(cè)試的GPU進(jìn)行了基準(zhǔn)測(cè)試。全球各地的供應(yīng)鏈都在制造它,因此我們現(xiàn)在可以向所有這些地區(qū)交付這種新架構(gòu),從而使資本支出投資于這些設(shè)備,這些計(jì)算機(jī)能夠提供最佳的總體擁有成本。
現(xiàn)在在這之下,有兩件事正在發(fā)生。所以當(dāng)你看這個(gè)時(shí),實(shí)際上是相當(dāng)非同尋常的。無(wú)論如何,這相當(dāng)非同尋常?,F(xiàn)在同時(shí)發(fā)生著兩次平臺(tái)轉(zhuǎn)變。
記住,如我之前跟你提到的,加速計(jì)算用于數(shù)據(jù)處理、圖像處理、計(jì)算機(jī)圖形學(xué)。它確實(shí)執(zhí)行各種計(jì)算。它運(yùn)行SQL,運(yùn)行Spark,它運(yùn)行…… 你知道,你讓它,你告訴我們你需要運(yùn)行什么,這可是件大事。它說(shuō)我們現(xiàn)在可以更快地做出回應(yīng),但這才是更重大的事。
因此在下面層面,不管是否有AI,世界正從通用計(jì)算轉(zhuǎn)向加速計(jì)算。不管是否有AI。事實(shí)上,許多CSP早已提供在AI出現(xiàn)之前就存在的服務(wù)。記住,它們是在機(jī)器學(xué)習(xí)時(shí)代被發(fā)明的,像XGBoost這樣的經(jīng)典機(jī)器學(xué)習(xí)算法,像用于推薦系統(tǒng)的數(shù)據(jù)框,協(xié)同過(guò)濾,內(nèi)容過(guò)濾。所有這些技術(shù)都誕生于通用計(jì)算的早期時(shí)代。
即便是那些算法,即便是那些架構(gòu),如今在加速計(jì)算的加持下也變得更加強(qiáng)大。因此,即使沒(méi)有AI,全球云服務(wù)提供商也將投資于加速技術(shù)。NVIDIA的GPU是唯一能同時(shí)實(shí)現(xiàn)上述所有功能并支持AI的GPU。專(zhuān)用集成電路或許能夠?qū)崿F(xiàn)AI,但它無(wú)法完成其他任何任務(wù)。
NVIDIA完全能夠做到這一切,這也解釋了為什么完全采用NVIDIA架構(gòu)是如此穩(wěn)妥的選擇。我們現(xiàn)已進(jìn)入良性循環(huán),抵達(dá)了轉(zhuǎn)折點(diǎn),這實(shí)在非同尋常。
我在這間會(huì)議室里有許多合作伙伴,而你們所有人都是我們供應(yīng)鏈的重要組成部分。我知道你們大家工作多么努力。我想感謝你們所有人,你們工作多么努力。非常感謝。
現(xiàn)在我將向你展示原因。這就是我們公司業(yè)務(wù)的現(xiàn)狀。正如我剛才提到的所有原因,我們看到Grace Blackwell正呈現(xiàn)出非凡的增長(zhǎng)態(tài)勢(shì)。它由兩個(gè)指數(shù)函數(shù)驅(qū)動(dòng)。我們現(xiàn)在已掌握情況。
我認(rèn)為,在Blackwell以及Rubin早期增長(zhǎng)態(tài)勢(shì)上,2026年我們很可能是歷史上首家能夠看到5000億美元業(yè)務(wù)規(guī)模的公司。正如你所知,2025年尚未結(jié)束,2026年也尚未開(kāi)始。這就是賬面上的業(yè)務(wù)量,迄今為止已達(dá)半萬(wàn)億美元。
在這些產(chǎn)品中,我們已在前幾個(gè)季度售出了六百萬(wàn)臺(tái)Blackwell設(shè)備。我猜生產(chǎn)的前四個(gè)季度,四分之三的產(chǎn)量。2025年還有一個(gè)季度要走。然后我們有四個(gè)季度。因此未來(lái)五個(gè)季度,將有5000億美元。這相當(dāng)于Hopper增長(zhǎng)率的五倍,這多少說(shuō)明了些什么。
這就是Hopper的全部人生。這不包括中國(guó)和亞洲。所以這只是西方市場(chǎng)。Hopper,在其全部生命周期中,四百萬(wàn)塊GPU。Blackwell,每個(gè)Blackwell在一個(gè)大封裝中包含兩塊GPU。在Rubin的早期階段有2000萬(wàn)塊Blackwell GPU。令人難以置信的增長(zhǎng)。
因此,我要感謝我們所有的供應(yīng)鏈合作伙伴。大家。我知道你們工作多么辛苦。我制作了一段視頻來(lái)慶祝你的工作。
極致版Blackwell GB200Nv與Grace Blackwell NVLink 72的協(xié)同設(shè)計(jì),使我們實(shí)現(xiàn)了十倍代際性能提升。簡(jiǎn)直難以置信?,F(xiàn)在,真正令人難以置信的部分是這個(gè)。這是我們制造的第一臺(tái)AI超級(jí)計(jì)算機(jī)。這是2016年,我將其交付給舊金山的一家初創(chuàng)公司,結(jié)果發(fā)現(xiàn)是OpenAI。這就是那臺(tái)電腦。
為了制造那臺(tái)計(jì)算機(jī),我們?cè)O(shè)計(jì)了一枚芯片。我們?cè)O(shè)計(jì)了一款新芯片。為了我們現(xiàn)在能夠進(jìn)行協(xié)同設(shè)計(jì),看看我們得處理的這么多芯片。這就是需要的。你不可能拿一塊芯片就讓計(jì)算機(jī)速度提升十倍,那不可能發(fā)生。
使計(jì)算機(jī)速度提升十倍的方法在于我們能夠持續(xù)實(shí)現(xiàn)性能的指數(shù)級(jí)增長(zhǎng)。我們能夠以指數(shù)級(jí)持續(xù)壓低成本的方法,是極端協(xié)同設(shè)計(jì)以及同時(shí)在所有這些不同芯片上并行工作。我們現(xiàn)在把Rubin接回家了。這是Rubin。
這是我們的第三代NVLink 72機(jī)架級(jí)計(jì)算機(jī)。第三代。GB200是第一代。遍布全球的所有合作伙伴們,我知道你們付出了多么艱辛的努力。這真的是極其艱難。第二代,順滑得多。而這一代,看這個(gè),完全無(wú)線(xiàn)纜。完全無(wú)線(xiàn)纜。而這一切現(xiàn)在又回到了實(shí)驗(yàn)室。
這是下一代,Rubin。在我們發(fā)貨GB300的同時(shí),我們正在準(zhǔn)備讓Rubin進(jìn)入量產(chǎn)。你知道的,就在明年的這個(gè)時(shí)候,也許會(huì)稍微早一點(diǎn)。因此,每一年,我們都會(huì)提出最激進(jìn)的協(xié)同設(shè)計(jì)系統(tǒng),以便不斷提高性能并持續(xù)降低tokens生成成本。
看看這個(gè)。這是一臺(tái)令人難以置信的漂亮計(jì)算機(jī)。這是100 PetaFLOPS。我知道這沒(méi)有任何意義。100 PetaFLOPS。但與我十年前交付給OpenAI的DGX-1相比,性能提升了100倍。就在這里。與那臺(tái)超級(jí)計(jì)算機(jī)相比是100倍。一百臺(tái)那種的,來(lái)算算看,一百臺(tái)那種大概相當(dāng)于25個(gè)這樣的機(jī)架,都被這一樣?xùn)|西替代了。一個(gè)維拉·魯賓。
所以,這是計(jì)算托盤(pán)。所以這是Vera Rubin超級(jí)芯片。可以嗎?這是計(jì)算托盤(pán)。就在這里,上方。安裝起來(lái)非常容易。只需把這些東西掀開(kāi),塞進(jìn)去。就連我也能做到。這是Vera Rubin計(jì)算托盤(pán)。
如果你決定要添加一個(gè)特殊處理器,我們添加了另一個(gè)處理器,稱(chēng)為上下文處理器,因?yàn)槲覀兲峁┙oAI的上下文量越來(lái)越大。我們希望它在回答問(wèn)題之前先讀取大量PDF,希望它能讀取大量歸檔論文,觀(guān)看大量視頻,在回答我的問(wèn)題之前先去學(xué)習(xí)所有這些內(nèi)容。所有這些上下文處理都可以被添加進(jìn)去。
因此您可以看到底部有八個(gè)ConnectX-9新型SuperNIC網(wǎng)卡。你有八個(gè)。您擁有BlueField-4,這款新型數(shù)據(jù)處理器,兩個(gè)Vera處理器,以及四個(gè)Rubin軟件包,或八個(gè)Rubin GPU。這一切都集中在這個(gè)節(jié)點(diǎn)上。完全無(wú)線(xiàn),100%液冷。
至于這款新處理器,今天我就不多說(shuō)了。我時(shí)間不夠,但這完全是革命性的。而原因在于,你們的AI需要越來(lái)越多的內(nèi)存。你與它的互動(dòng)更頻繁了,你希望它能記住我們上次的對(duì)話(huà)。你為我所學(xué)的一切,等我下次回來(lái)時(shí),請(qǐng)千萬(wàn)別忘記。
因此,所有這些記憶將共同構(gòu)筑出名為KV緩存的東西。而KV緩存,檢索它時(shí),你可能已經(jīng)注意到,每次你進(jìn)入你的會(huì)話(huà),你們現(xiàn)在的AI刷新和檢索所有歷史對(duì)話(huà)的時(shí)間越來(lái)越長(zhǎng)了。而且原因在于我們需要一款革命性的新處理器。這被稱(chēng)為BlueField-4。
接下來(lái)是NVLink交換機(jī)。這正是使我們能夠?qū)⑺杏?jì)算機(jī)連接在一起的關(guān)鍵所在。而這個(gè)交換機(jī)的帶寬現(xiàn)已達(dá)到全球互聯(lián)網(wǎng)峰值流量的數(shù)倍。因此,該主干將同時(shí)向所有GPU傳遞并傳輸所有數(shù)據(jù)。
除此之外,這是Spectrum-X開(kāi)關(guān)。這款以太網(wǎng)交換機(jī)的設(shè)計(jì)使得所有處理器能夠同時(shí)相互通信,而不會(huì)造成網(wǎng)絡(luò)擁塞。堵塞網(wǎng)絡(luò),這很技術(shù)性??梢詥??所以這三者結(jié)合起來(lái)。然后這就是量子開(kāi)關(guān)。這是InfiniBand,這是以太網(wǎng)。我們不在乎你想用什么語(yǔ)言,無(wú)論您采用何種標(biāo)準(zhǔn),我們都為您準(zhǔn)備了卓越的橫向擴(kuò)展架構(gòu)。
無(wú)論是InfiniBand、Quantum還是Spectrum以太網(wǎng),這款采用硅光子技術(shù),并提供完全共封裝的選項(xiàng)?;旧?,激光會(huì)直接接觸硅片,并將它與我們的芯片連接起來(lái)??梢詥??這就是Spectrum-X以太網(wǎng)。哦,這就是它的樣子。這是一個(gè)機(jī)架。這是兩噸。150萬(wàn)個(gè)部件和這根脊柱,這根脊柱在一秒鐘內(nèi)承載著整個(gè)互聯(lián)網(wǎng)的流量。相同的速度,能在所有這些不同的處理器之間遷移。100%液冷。所有這一切,都是為了世界上最快的tokens生成速度??梢詥??所以那就是機(jī)架的樣子。
現(xiàn)在,那是一個(gè)機(jī)架。一個(gè)千兆瓦級(jí)的數(shù)據(jù)中心會(huì)有,來(lái)算算,16個(gè)機(jī)架大約是姑且叫它9,000,8,000個(gè)這樣的將是一個(gè)一千兆瓦的數(shù)據(jù)中心。所以那將是未來(lái)的AI工廠(chǎng)。
如你所見(jiàn),NVIDIA起初是設(shè)計(jì)芯片,隨后我們開(kāi)始設(shè)計(jì)系統(tǒng),并且我們?cè)O(shè)計(jì)AI超級(jí)計(jì)算機(jī)?,F(xiàn)在我們正在設(shè)計(jì)完整的AI工廠(chǎng)。每次我們將更多問(wèn)題整合進(jìn)來(lái)進(jìn)行解決時(shí),我們都會(huì)想出更好的解決方案。我們現(xiàn)在構(gòu)建完整的AI工廠(chǎng)。
這個(gè)AI工廠(chǎng)將會(huì)是…… 我們?yōu)閂era Rubin構(gòu)建的東西。我們創(chuàng)造了一項(xiàng)技術(shù),使我們所有的合作伙伴都能夠以數(shù)字化方式集成到這個(gè)工廠(chǎng)中。
在Vera Rubin作為真實(shí)計(jì)算機(jī)出現(xiàn)之前很久很久,我們已經(jīng)把它作為數(shù)字孿生計(jì)算機(jī)來(lái)使用。很久在這些AI工廠(chǎng)出現(xiàn)之前,我們就會(huì)使用它,我們會(huì)設(shè)計(jì)它,我們會(huì)規(guī)劃它、優(yōu)化它,并以數(shù)字孿生的方式來(lái)運(yùn)行它。
因此,所有與我們合作的合作伙伴,我非常高興你們所有支持我們的人。Gio在這里,G Ver... Vernova在這里,Schneider。我想,Olivier在這里,Olivier Blum在這里。西門(mén)子,令人難以置信的合作伙伴。好的。羅蘭·布什,我想他在看。嗨,羅蘭??傊?,真的,非常非常棒的合作伙伴與我們一起工作。
起初,我們有CUDA,以及各種不同的軟件合作伙伴生態(tài)系統(tǒng)?,F(xiàn)在,我們有Omniverse DSX,并且正在構(gòu)建AI工廠(chǎng)。同樣地,我們也有這些與我們合作的令人驚嘆的合作伙伴生態(tài)系統(tǒng)。
讓我們來(lái)談?wù)勀P?,特別是開(kāi)源模型。在過(guò)去幾年里,發(fā)生了幾件事。一是開(kāi)源模型因?yàn)榫邆渫评砟芰Χ兊梅浅?qiáng)大;它們之所以非常強(qiáng)大,是因?yàn)樗鼈兪嵌嗄B(tài)的,并且由于蒸餾技術(shù),它們的效率非常高。因此,所有這些不同的功能已經(jīng)使開(kāi)源模型首次對(duì)開(kāi)發(fā)人員極其有用。它們現(xiàn)在是初創(chuàng)公司的命脈。顯然,這些初創(chuàng)公司的生存命脈在不同的行業(yè)中各不相同,正如我之前提到的,每個(gè)行業(yè)都有其自身的用例、其自身的數(shù)據(jù)、自己的已用數(shù)據(jù),自己的飛輪。所有這些能力,那些領(lǐng)域?qū)iL(zhǎng)需要能夠嵌入到模型中,開(kāi)源使這成為可能。研究人員需要開(kāi)源,開(kāi)發(fā)者需要開(kāi)源,世界各地的公司,我們需要開(kāi)源。開(kāi)源模型真的非常非常重要。
美國(guó)也必須在開(kāi)源方面處于領(lǐng)先地位。我們擁有極其出色的專(zhuān)有模型,我們擁有令人驚艷的專(zhuān)有模型,我們同樣需要令人驚艷的開(kāi)源模型。我們的國(guó)家依賴(lài)它,我們的初創(chuàng)公司依賴(lài)它,因此NVIDIA致力于去實(shí)現(xiàn)這一目標(biāo)。我們現(xiàn)在是最大的,我們?cè)陂_(kāi)源貢獻(xiàn)方面處于領(lǐng)先地位。我們?cè)谂判邪裆嫌?3個(gè)模型。我們擁有來(lái)自不同領(lǐng)域的這些語(yǔ)言模型,我將要討論的物理AI模型、機(jī)器人模型到生物學(xué)模型。每一個(gè)這些模型都有龐大的團(tuán)隊(duì),這也是我們?yōu)樽约簶?gòu)建超級(jí)計(jì)算機(jī)以支持所有這些模型創(chuàng)建的原因之一。我們擁有第一的語(yǔ)音模型、第一的推理模型、第一的物理AI模型,下載量非常非??捎^(guān)。我們致力于此,原因在于科學(xué)需要它,研究人員需要它,初創(chuàng)公司需要它,企業(yè)也需要它。
我很高興AI初創(chuàng)公司以NVIDIA為基礎(chǔ)構(gòu)建。他們這樣做有好幾種原因。首先,當(dāng)然我們的生態(tài)系統(tǒng)很豐富,我們的工具運(yùn)行得非常好。我們所有的工具都能在我們所有的GPU上運(yùn)行,我們的GPU無(wú)處不在。它實(shí)際上存在于每一個(gè)云中,它可以在本地部署,你可以自己構(gòu)建。你可以自己搭建一個(gè)發(fā)燒友級(jí)別的游戲電腦,里面裝多塊GPU,然后你可以下載我們的軟件棧,它就是能用。我們有大量開(kāi)發(fā)者在不斷豐富生態(tài)系統(tǒng),使其越來(lái)越強(qiáng)大。所以我對(duì)我們合作的所有初創(chuàng)公司感到非常滿(mǎn)意,我對(duì)此心存感激。
同樣,許多這些初創(chuàng)公司現(xiàn)在也開(kāi)始創(chuàng)造更多方式來(lái)利用我們的GPU,例如CoreWeave、Nscale、Nebius、Lambda、Crusoe等。這些公司正在建立這些新的GPU云來(lái)為初創(chuàng)公司服務(wù),我非常感激這一點(diǎn)。這一切之所以成為可能,是因?yàn)镹VIDIA無(wú)處不在。
我們將我們的庫(kù)整合在一起,所有我剛才跟你提到的CUDA X庫(kù)、我提到的所有開(kāi)源AI模型、我提到的所有模型,例如,我們已經(jīng)集成到AWS中。真的很喜歡和Matt共事。例如,我們已與Google Cloud集成。真的很喜歡和Thomas共事。每一個(gè)云都集成了NVIDIA GPUs和我們的計(jì)算、我們的庫(kù),以及我們的模型。很喜歡與微軟Azure的Satya一起合作,很喜歡與Oracle的Clay一起合作。每一個(gè)這些云都集成了NVIDIA堆棧。因此,不論你去哪里,無(wú)論你使用哪個(gè)云端,它的工作效果令人難以置信。
我們還將NVIDIA的庫(kù)集成到全球的SaaS中,以便這些SaaS最終都能成為具代理能力的SaaS。我喜歡Bill McDermott對(duì)ServiceNow的愿景。那里有人,對(duì),就這樣。我想那可能是Bill。嗨,Bill。那么ServiceNow是什么?全球85%的企業(yè)級(jí)工作負(fù)載、工作流。SAP,全球80%的商業(yè)交易。Christian Klein和我正在合作將NVIDIA庫(kù)集成起來(lái),將CUDA X、NeMo和NeMotron,以及我們所有的AI系統(tǒng)集成到SAP中。
與Synopsys的Sassine合作,加速全球的CAE,使CAD、EDA工具更快且可擴(kuò)展,幫助他們創(chuàng)建AI代理。有朝一日,我很想雇傭一個(gè)AI代理ASIC設(shè)計(jì)師來(lái)與我們的ASIC設(shè)計(jì)師合作,從本質(zhì)上來(lái)說(shuō),就是Synopsys的AI代理。我們正在與Anirudh一起合作,Anirudh,是的,我今天早些時(shí)候見(jiàn)過(guò)他,他參與了賽前節(jié)目。Cadence做著令人難以置信的工作,加速他們的技術(shù)棧,創(chuàng)建AI代理,使得Cadence的AI ASIC設(shè)計(jì)師和系統(tǒng)設(shè)計(jì)師能夠與我們協(xié)同工作。
今天,我們宣布一個(gè)新的項(xiàng)目。AI將大幅提升生產(chǎn)力,AI將徹底改變每一個(gè)行業(yè)。但AI也會(huì)極大地增強(qiáng)網(wǎng)絡(luò)安全挑戰(zhàn),那些惡意的AI。因此我們需要一個(gè)強(qiáng)大的防御者,我無(wú)法想象有比CrowdStrike更好的防御者。我們與CrowdStrike合作,將網(wǎng)絡(luò)安全的速度提升到光速,以創(chuàng)建一個(gè)在云端擁有網(wǎng)絡(luò)安全AI代理的系統(tǒng),同時(shí)在本地或邊緣也擁有表現(xiàn)極為出色的AI代理。這樣一來(lái),每當(dāng)出現(xiàn)威脅時(shí),你就能在瞬間檢測(cè)到它。我們需要速度,我們需要一個(gè)快速的自主智能、超智能的AI。
我有第二個(gè)聲明。這是世界上發(fā)展最快的企業(yè)公司,可能是當(dāng)今世界上最重要的企業(yè)級(jí)堆棧,Palantir Ontology。這里有來(lái)自Palantir的人嗎?我剛才還在和Alex聊天。這是Palantir Ontology,他們獲取信息、獲取數(shù)據(jù)、獲取人為判斷,并將其轉(zhuǎn)化為商業(yè)洞察。我們與Palantir合作,加速Palantir的所有工作,以便我們能夠進(jìn)行數(shù)據(jù)處理,以更大規(guī)模和更高速度進(jìn)行數(shù)據(jù)處理,更大規(guī)模、更多速度。無(wú)論是過(guò)去的結(jié)構(gòu)化數(shù)據(jù),當(dāng)然也包括我們將擁有結(jié)構(gòu)化數(shù)據(jù)、人為記錄的數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù),并為我們的政府處理這些數(shù)據(jù),用于國(guó)家安全,以及為全球的企業(yè)服務(wù),以光速處理這些數(shù)據(jù)并從中發(fā)現(xiàn)洞見(jiàn)。這就是未來(lái)的樣子。Palantir將與NVIDIA集成,以便我們能夠以光速和極大規(guī)模進(jìn)行處理。
5、進(jìn)軍物理AI、機(jī)器人技術(shù)與自動(dòng)駕駛
讓我們來(lái)談?wù)勎锢鞟I。物理AI需要三臺(tái)計(jì)算機(jī)。正如訓(xùn)練一個(gè)語(yǔ)言模型需要兩臺(tái)計(jì)算機(jī)一樣,一臺(tái)用于訓(xùn)練它、評(píng)估它,然后用于推理它。所以你看到的是大型的GB200。為了用于物理AI,你需要三臺(tái)計(jì)算機(jī)。你需要這臺(tái)計(jì)算機(jī)來(lái)訓(xùn)練它,這是GB,即Grace Blackwell NVLink-72。我們需要一臺(tái)能夠運(yùn)行我之前用Omniverse DSX展示的所有模擬的計(jì)算機(jī)。它基本上是一個(gè)數(shù)字孿生,讓機(jī)器人學(xué)習(xí)如何成為一個(gè)優(yōu)秀的機(jī)器人,并使工廠(chǎng)實(shí)質(zhì)上成為一個(gè)數(shù)字孿生。那臺(tái)計(jì)算機(jī)是第二臺(tái)計(jì)算機(jī),即Omniverse計(jì)算機(jī)。這臺(tái)計(jì)算機(jī)必須在生成式AI方面表現(xiàn)卓越,并且必須在計(jì)算機(jī)圖形學(xué)方面表現(xiàn)出色,傳感器模擬、光線(xiàn)追蹤、信號(hào)處理。這臺(tái)計(jì)算機(jī)被稱(chēng)為Omniverse計(jì)算機(jī)。一旦我們訓(xùn)練好模型,就在數(shù)字孿生中模擬該AI,而該數(shù)字孿生可以是一個(gè)工廠(chǎng)的數(shù)字孿生,以及大量機(jī)器人的數(shù)字孿生體。然后,你需要操作那臺(tái)機(jī)器人,這就是機(jī)器人計(jì)算機(jī)。這個(gè)可以裝進(jìn)一輛自動(dòng)駕駛汽車(chē)?yán)?,其中一半可以裝進(jìn)一臺(tái)機(jī)器人里。可以嗎?或者你實(shí)際上可以擁有,比如說(shuō),機(jī)器人在操作中非常靈活且非??焖?,可能需要兩臺(tái)這樣的計(jì)算機(jī)。這就是Thor,Jetson Thor機(jī)器人計(jì)算機(jī)。這三臺(tái)計(jì)算機(jī)都運(yùn)行CUDA,這使我們能夠推進(jìn)物理AI,能夠理解物理世界、理解物理定律的AI,因果關(guān)系、持久性,物理AI。
我們有令人難以置信的合作伙伴與我們一起打造工廠(chǎng)的物理AI。我們自己也在使用它來(lái)打造我們?cè)诘驴怂_斯的工廠(chǎng)?,F(xiàn)在,一旦我們建成了機(jī)器人工廠(chǎng),我們里面有一堆機(jī)器人,這些機(jī)器人也需要物理AI,將物理AI應(yīng)用于數(shù)字孿生內(nèi)部,并在其中運(yùn)行。
我要感謝我們的合作伙伴富士康。在這里。但所有這些生態(tài)系統(tǒng)合作伙伴使我們能夠創(chuàng)造未來(lái)的機(jī)器人工廠(chǎng)。這個(gè)工廠(chǎng)本質(zhì)上是一個(gè)機(jī)器人,它正在協(xié)調(diào)機(jī)器人去制造出具有機(jī)器人性質(zhì)的東西。要做到這一點(diǎn)所需的軟件量非常龐大,除非你能夠在數(shù)字孿生中去規(guī)劃它、去設(shè)計(jì)它、在數(shù)字孿生中去運(yùn)營(yíng)它,否則讓這個(gè)方案奏效的希望幾乎不可能。
我也很高興看到Caterpillar,我的朋友Joe Creed,以及他那家有著百年歷史的公司也在將數(shù)字孿生技術(shù)融入他們的制造方式。這些工廠(chǎng)將配備未來(lái)的機(jī)器人系統(tǒng),其中最先進(jìn)的之一是Figure。Brett Adcock今天在這里。他三年半前創(chuàng)辦了一家公司,他們現(xiàn)在市值接近400億美元。我們正在共同訓(xùn)練這個(gè)AI,訓(xùn)練機(jī)器人、模擬機(jī)器人,當(dāng)然還有裝入Figure的機(jī)器人電腦。真的非常驚人。我有幸見(jiàn)證了這一點(diǎn),這真的相當(dāng)非凡。很可能類(lèi)人機(jī)器人會(huì)出現(xiàn),而且,我的朋友Elon也在做這方面的工作,這很可能會(huì)成為最大的消費(fèi)類(lèi)產(chǎn)品之一,新的消費(fèi)電子市場(chǎng),當(dāng)然還有最大的一類(lèi)工業(yè)設(shè)備市場(chǎng)之一。
Peggy Johnson和Agility的團(tuán)隊(duì)正在與我們合作開(kāi)發(fā)用于倉(cāng)庫(kù)自動(dòng)化的機(jī)器人。Johnson & Johnson的團(tuán)隊(duì)再次與我們合作,訓(xùn)練機(jī)器人,在數(shù)字孿生中進(jìn)行仿真,并且還要操作機(jī)器人。這些Johnson & Johnson外科手術(shù)機(jī)器人甚至將進(jìn)行完全非侵入性的手術(shù),達(dá)到世界前所未有的精確度。
當(dāng)然,史上最可愛(ài)的機(jī)器人,迪士尼的機(jī)器人。這是與我們息息相關(guān)的某件事。我們正在與Disney Research合作開(kāi)發(fā)一個(gè)全新的框架和仿真平臺(tái),基于一種名為Newton的革命性技術(shù)。而那款Newton模擬器使得機(jī)器人在具備物理感知的環(huán)境中學(xué)習(xí)如何成為一名優(yōu)秀的機(jī)器人。
現(xiàn)在,人形機(jī)器人仍在開(kāi)發(fā)中,但與此同時(shí),有一款機(jī)器人明顯處于拐點(diǎn)上,它基本上就在這里,那是一個(gè)帶輪子的機(jī)器人。這是一個(gè)無(wú)人駕駛出租車(chē)。無(wú)人駕駛出租車(chē)本質(zhì)上就是一個(gè)AI司機(jī)?,F(xiàn)在,我們今天正在做的事情之一,我們宣布推出NVIDIA DRIVE Hyperion。這是一件大事。我們創(chuàng)建了這個(gè)架構(gòu),以便世界上每一家汽車(chē)公司都能制造車(chē)輛,可以是商用的,也可以是乘用的,可以是專(zhuān)用于無(wú)人出租車(chē),制造出具備無(wú)人出租車(chē)準(zhǔn)備能力的車(chē)輛。配備環(huán)視攝像頭、雷達(dá)和激光雷達(dá)的傳感套件使我們能夠?qū)崿F(xiàn)最高級(jí)別的全位感知套件與冗余,這是實(shí)現(xiàn)最高安全級(jí)別所必需的。Hyperion DRIVE,DRIVE Hyperion現(xiàn)在已被設(shè)計(jì)進(jìn)Lucid、梅賽德斯-奔馳、我的朋友Ola Kllenius,Stellantis的團(tuán)隊(duì),還有許多其他車(chē)型即將到來(lái)。
一旦你有了一個(gè)基本的標(biāo)準(zhǔn)平臺(tái),那么自動(dòng)駕駛系統(tǒng)的開(kāi)發(fā)者們,他們中有很多非常有才華的團(tuán)隊(duì),例如Wayve、Waabi、Aurora、Momenta、Nuro、WeRide等,有這么多公司可以把他們的AV系統(tǒng)移植到標(biāo)準(zhǔn)底盤(pán)上運(yùn)行?;旧?,標(biāo)準(zhǔn)底盤(pán)現(xiàn)在已經(jīng)變成了一個(gè)移動(dòng)的計(jì)算平臺(tái)。并且因?yàn)樗菢?biāo)準(zhǔn)化的,且傳感器套件非常全面,他們都可以將他們的AI部署到上面。
未來(lái),每年將有萬(wàn)億英里被駕駛,每年制造1億輛汽車(chē),全球大約有5000萬(wàn)輛出租車(chē)將會(huì)被大量無(wú)人駕駛出租車(chē)所增強(qiáng)。所以這將是一個(gè)非常龐大的市場(chǎng)。為了將其連接并在全球部署,今天我們宣布與Uber建立合作伙伴關(guān)系。Uber的Dara,Dara要走了。我們正在合作,將這些NVIDIA DRIVE Hyperion汽車(chē)連接成一個(gè)全球網(wǎng)絡(luò)。而在未來(lái),你將能夠召喚到這些汽車(chē)中的一輛,生態(tài)系統(tǒng)將非常豐富,我們會(huì)在全世界看到Hyperion或無(wú)人駕駛出租車(chē)出現(xiàn)。這將成為我們的一個(gè)新的計(jì)算平臺(tái),我預(yù)計(jì)它會(huì)非常成功。好的。
這就是我們今天所討論的內(nèi)容。我們討論了很多很多事情。請(qǐng)記住,其核心是兩點(diǎn),是從通用計(jì)算向加速計(jì)算的兩次平臺(tái)轉(zhuǎn)變。NVIDIA CUDA及其名為CUDA-X的一系列庫(kù)使我們能夠應(yīng)對(duì)幾乎所有行業(yè),我們正處于拐點(diǎn),現(xiàn)在它正如虛擬循環(huán)所示地增長(zhǎng)。第二個(gè)拐點(diǎn)現(xiàn)在已經(jīng)到來(lái),從傳統(tǒng)手寫(xiě)軟件到AI的轉(zhuǎn)變。兩個(gè)平臺(tái)同時(shí)發(fā)生轉(zhuǎn)變,這就是我們感受到如此驚人增長(zhǎng)的原因。
量子計(jì)算,我們已經(jīng)提到過(guò)。我們談到了開(kāi)源模型。我們談到了與CrowdStrike的企業(yè)應(yīng)用,以及Palantir,加速他們的平臺(tái)。我們談到了機(jī)器人技術(shù),一個(gè)新的可能成為最大規(guī)模的消費(fèi)電子和工業(yè)制造行業(yè)之一。當(dāng)然,我們還談到了6G,NVIDIA有了用于6G的新平臺(tái),我們稱(chēng)之為Aria。我們有一個(gè)用于機(jī)器人汽車(chē)的新平臺(tái),我們把它稱(chēng)為Hyperion。我們有新的平臺(tái),即便是面向工廠(chǎng),也是兩類(lèi)工廠(chǎng),我們把那個(gè)AI工廠(chǎng)稱(chēng)為DSX,然后把工廠(chǎng)與AI結(jié)合,我們稱(chēng)之為MEGA。
女士們、先生們,感謝你們今天的到來(lái),并且感謝你們讓我——謝謝——感謝你們讓我們能夠把GTC帶到華盛頓特區(qū)。我們希望每年都舉辦一次。感謝你們!