中文字幕乱老妇女一视频,97青草香蕉依人在线视频,男人的天堂国产综合,伊人中文字幕亚洲精品

<style id="pje8p"><tr id="pje8p"></tr></style>
    • 關(guān)于ZAKER 合作
      鈦媒體 21分鐘前

      物理 AI 解答“把大象放進(jìn)冰箱需要幾步?”

      文 | 半導(dǎo)體產(chǎn)業(yè)縱橫

      " 把大象放進(jìn)冰箱需要幾步?" 過去的標(biāo)準(zhǔn)步驟是:打開冰箱門、放入大象、關(guān)上冰箱門。那如果機(jī)器人來完成這一指令的工程化實(shí)踐,又需要幾步呢?在物理 AI 技術(shù)快速發(fā)展的當(dāng)下,我們并非要對(duì)這一場(chǎng)景進(jìn)行現(xiàn)實(shí)復(fù)刻,而是以其為具象化案例,探討物理 AI 在虛擬仿真、邏輯推理與現(xiàn)實(shí)部署全鏈路中的技術(shù)能力,驗(yàn)證該技術(shù)如何打破信息世界與物理世界的邊界,為復(fù)雜工程任務(wù)的解決提供新路徑。

      當(dāng)機(jī)器人需要理解大象的物理屬性、冰箱的空間結(jié)構(gòu),還要規(guī)劃連貫的動(dòng)作序列時(shí),背后需要的是虛擬環(huán)境構(gòu)建、大模型推理訓(xùn)練與現(xiàn)實(shí)部署的全鏈路技術(shù)支撐。而英偉達(dá)(NVIDIA)憑借其在計(jì)算機(jī)圖形學(xué)、物理仿真與 AI 領(lǐng)域的深度融合,以 Omniverse+Cosmos 為核心,搭建起了物理 AI 從虛擬到現(xiàn)實(shí)的完整橋梁,讓 " 大象進(jìn)冰箱 " 的工程化落地成為可能。

      第一步:虛擬世界中搭建 " 大象 - 冰箱 " 場(chǎng)景模型

      在機(jī)器人執(zhí)行復(fù)雜任務(wù)的工程實(shí)踐中,虛擬環(huán)境就是技術(shù)驗(yàn)證的 " 試驗(yàn)場(chǎng) "。若缺乏符合物理規(guī)律的大象與冰箱模型,后續(xù) " 把大象關(guān)進(jìn)冰箱 " 的 AI 訓(xùn)練和推理將失去可靠基礎(chǔ)。

      英偉達(dá)的核心優(yōu)勢(shì)在于用 Omniverse 構(gòu)建出能復(fù)刻物理規(guī)律的數(shù)字孿生空間,再以 Cosmos 賦予其生成式建模的能力,讓大象與冰箱的虛擬存在既真實(shí)又靈活。

      NVIDIA Omniverse 并非普通的 3D 建模工具,而是一個(gè)基于 OpenUSD(通用場(chǎng)景描述)標(biāo)準(zhǔn)的實(shí)時(shí)協(xié)作與仿真平臺(tái),其核心是對(duì)物理世界的毫米級(jí)復(fù)刻,確保虛擬環(huán)境與現(xiàn)實(shí)規(guī)律高度一致。在構(gòu)建物理場(chǎng)景時(shí),Omniverse 的物理引擎會(huì)精準(zhǔn)計(jì)算每一個(gè)細(xì)節(jié):對(duì)大象,它會(huì)模擬其體重、肌肉運(yùn)動(dòng)慣性、皮膚彈性等物理屬性,甚至能還原大象行走時(shí)四肢的受力分布,確保機(jī)器人與大象交互時(shí)的力反饋符合現(xiàn)實(shí)規(guī)律;對(duì)冰箱,它會(huì)拆解其門體開合的鉸鏈力學(xué)、密封條的摩擦力、內(nèi)部空間的容積限制,甚至模擬門體故障(如卡頓、密封條老化無法閉合)等極端場(chǎng)景,為后續(xù)測(cè)試提供全面的場(chǎng)景覆蓋。

      更關(guān)鍵的是,Omniverse 支持多工具協(xié)同與實(shí)時(shí)渲染。設(shè)計(jì)師可在 Maya 中制作大象的外觀模型,在 Blender 中調(diào)整冰箱的結(jié)構(gòu)細(xì)節(jié),所有修改會(huì)實(shí)時(shí)同步到 Omniverse 平臺(tái),避免了傳統(tǒng)建模中文件格式不兼容、版本混亂等問題,大幅提升了虛擬場(chǎng)景的搭建效率。

      而 NVIDIA Cosmos 則是作為面向物理 AI 的生成式世界基礎(chǔ)模型平臺(tái),能降低虛擬場(chǎng)景的構(gòu)建門檻,讓工程師能快速生成符合需求的訓(xùn)練環(huán)境,且所有生成場(chǎng)景均以技術(shù)可行性為前提,不含脫離現(xiàn)實(shí)的夸張?jiān)O(shè)計(jì)。

      作為英偉達(dá)面向物理 AI 的生成式世界基礎(chǔ)模型平臺(tái),Cosmos 徹底改變了虛擬場(chǎng)景的構(gòu)建方式。傳統(tǒng)場(chǎng)景搭建需工程師手動(dòng)建模、調(diào)整參數(shù),耗時(shí)數(shù)周甚至數(shù)月;而 Cosmos 只需輸入文本(如 " 一只成年非洲象、一臺(tái)高 2.5 米的雙開門冰箱,放置在 20 平方米的室內(nèi)空間 ")或參考圖像,就能自動(dòng)生成符合物理規(guī)律的虛擬場(chǎng)景。

      這種生成式能力的核心在于兩點(diǎn):一是基于海量物理數(shù)據(jù)訓(xùn)練的常識(shí)理解,例如自動(dòng)識(shí)別 " 大象體積大于冰箱門,需先開門再引導(dǎo)進(jìn)入 " 的基礎(chǔ)順序,確保場(chǎng)景邏輯符合現(xiàn)實(shí)認(rèn)知;二是與 Omniverse 物理引擎的深度協(xié)同,生成的大象模型會(huì)自動(dòng)匹配 Omniverse 的力反饋參數(shù),冰箱的門體開合邏輯也會(huì)直接接入仿真系統(tǒng),無需額外調(diào)試。這意味著,針對(duì)不同場(chǎng)景,工程師無需重新搭建場(chǎng)景,只需通過文本指令即可快速生成新的訓(xùn)練環(huán)境,大幅降低了物理 AI 的開發(fā)門檻。

      第二步:教會(huì) AI 理解大象與冰箱

      有了虛擬場(chǎng)景,下一步就是讓機(jī)器人看懂目標(biāo)、想通步驟,這需要大模型具備物理理解與邏輯推理能力。英偉達(dá)推出的 Cosmos Reason,正是為解決這一問題而生,它讓機(jī)器人像人類一樣思考任務(wù)流程,而非機(jī)械執(zhí)行預(yù)設(shè)指令。

      " 把大象放進(jìn)冰箱 " 的虛擬任務(wù),本質(zhì)是模擬 " 大型物體與封閉空間的交互 " 場(chǎng)景,背后涉及多維度的決策需求:AI 需識(shí)別物體與空間的位置關(guān)系、判斷設(shè)備的運(yùn)行狀態(tài)、規(guī)劃自身的移動(dòng)路徑、控制操作力度以避免故障、引導(dǎo)物體移動(dòng)時(shí)避開障礙物等。這些需求與現(xiàn)實(shí)中 " 工業(yè)設(shè)備搬運(yùn) "" 大型家電安裝 " 等工程場(chǎng)景的邏輯高度一致,為 AI 的工程化應(yīng)用提供了模擬訓(xùn)練基礎(chǔ)。

      Cosmos Reason 是一款開放、可定制、具備商業(yè)應(yīng)用能力的 70 億參數(shù)推理視覺語言模型(VLM),專為物理 AI 設(shè)計(jì)。通過融合物理理解、先驗(yàn)知識(shí)與常識(shí)推理能力,該模型賦能機(jī)器人、輔助駕駛汽車及視覺 AI 智能體在真實(shí)環(huán)境中智能運(yùn)作。

      通過 Cosmos Reason,機(jī)器人可以解釋環(huán)境,并在收到復(fù)雜命令時(shí)將其分解為任務(wù),并使用常識(shí)執(zhí)行這些任務(wù),即使在不熟悉的環(huán)境中也是如此。

      Cosmos Reason 通過視覺輸入能實(shí)時(shí)分析 " 大象 " 的尺寸、" 冰箱 " 的容量,判斷 " 大象能否進(jìn)入冰箱 "。它還會(huì)將復(fù)雜任務(wù)拆分為可執(zhí)行的動(dòng)作腳本:" 移動(dòng)至冰箱前→檢測(cè)門體狀態(tài)→啟動(dòng)開門電機(jī)→門體打開至 90 度后停止→移動(dòng)至大象側(cè)方→發(fā)出引導(dǎo)信號(hào)→伴隨大象移動(dòng)調(diào)整自身位置→確認(rèn)大象完全進(jìn)入→關(guān)閉冰箱門 "。如果虛擬場(chǎng)景中出現(xiàn) " 冰箱門卡住 " 的情況,Cosmos Reason 不會(huì)重復(fù)發(fā)力(避免電機(jī)損壞),而是會(huì)先檢測(cè)卡頓位置(如密封條異物),再調(diào)整開門角度(輕微抬起門體),這正是基于 " 機(jī)械故障處理 " 的先驗(yàn)知識(shí),而非單一的動(dòng)作指令。

      在機(jī)器人中,通常需要兩個(gè) AI 模型:一個(gè) VLM 負(fù)責(zé)理解指令并規(guī)劃行動(dòng),另一個(gè)視覺語言動(dòng)作模型(VLA)負(fù)責(zé)快速反應(yīng)和執(zhí)行動(dòng)作。有了 Cosmos Reason 作為 VLM,機(jī)器人能夠更好地理解模糊的指令,并推導(dǎo)出具體的行動(dòng)方案。

      第三步:讓機(jī)器人從虛擬訓(xùn)練到現(xiàn)實(shí)部署

      虛擬世界訓(xùn)練的 AI 能力,如何在現(xiàn)實(shí)中施展?對(duì)此,英偉達(dá)提出了 " 三臺(tái)計(jì)算機(jī) " 理念,為物理 AI 從訓(xùn)練到部署提供了完整的技術(shù)支撐,覆蓋了機(jī)器人智能化的全生命周期:一臺(tái)是 DGX 用來訓(xùn)練 AI,另一臺(tái) AGX 用來部署 AI,最后一臺(tái)便是 Omniverse+Cosmos。

      DGX:訓(xùn)練物理 AI

      要讓機(jī)器人學(xué)會(huì) " 大象進(jìn)冰箱 ",需要海量的虛擬場(chǎng)景數(shù)據(jù)(如不同體型的大象、不同結(jié)構(gòu)的冰箱、不同環(huán)境干擾)來訓(xùn)練模型。這類訓(xùn)練需要的龐大計(jì)算能力,只有依靠專門的超級(jí)計(jì)算基礎(chǔ)設(shè)施才能實(shí)現(xiàn),因此用于訓(xùn)練的計(jì)算機(jī)至關(guān)重要。英偉達(dá) DGX 系統(tǒng)憑借超強(qiáng)算力,能高效處理這些數(shù)據(jù):一方面,它能快速迭代 Cosmos Reason 模型,優(yōu)化任務(wù)拆解邏輯;另一方面,它能通過強(qiáng)化學(xué)習(xí),讓機(jī)器人在 " 失敗場(chǎng)景 "(如大象未進(jìn)入就關(guān)門、開門力度過大導(dǎo)致門體損壞)中調(diào)整策略,提升魯棒性。

      AGX:部署物理 AI

      訓(xùn)練好的模型需要 " 裝 " 到現(xiàn)實(shí)機(jī)器人上,而英偉達(dá) Jetson AGX 系列(如 NVIDIA Jetson Thor)就是為此設(shè)計(jì)的邊緣計(jì)算平臺(tái),可以運(yùn)行輕量化后的 Cosmos Reason 模型。在現(xiàn)實(shí)場(chǎng)景中,AGX 能實(shí)時(shí)接收機(jī)器人傳感器(攝像頭、激光雷達(dá))的數(shù)據(jù),快速輸出動(dòng)作指令,比如檢測(cè)到真實(shí)大象的位置后,0.1 秒內(nèi)規(guī)劃出移動(dòng)路徑,確保機(jī)器人動(dòng)作不延遲。

      Omniverse+Cosmos:仿真與合成數(shù)據(jù)生成平臺(tái)

      這是 " 三臺(tái)計(jì)算機(jī) " 的核心紐帶,也是虛擬與現(xiàn)實(shí)的 " 緩沖帶 "。對(duì)于大語言模型研究人員,他們有幸可以使用海量互聯(lián)網(wǎng)數(shù)據(jù)用于預(yù)訓(xùn)練,但是物理 AI 領(lǐng)域卻沒有這類資源。

      現(xiàn)實(shí)中," 大象進(jìn)冰箱 " 的訓(xùn)練數(shù)據(jù)獲取成本極高(可能損壞機(jī)器人、傷害大象),且難以覆蓋所有極端情況(如突發(fā)停電、地面濕滑等)。同時(shí),數(shù)據(jù)收集工作耗時(shí)耗力,這使得其成本極高,且難以實(shí)現(xiàn)規(guī)?;瘮U(kuò)展。而在 Omniverse 中,工程師可模擬上千種甚至更多的極端場(chǎng)景獲取大量數(shù)據(jù)用來訓(xùn)練物理 AI。

      NVIDIA Omniverse 與仿真技術(shù)副總裁 Rev Lebaredian 強(qiáng)調(diào),物理 AI 是連接信息世界與物理世界的橋梁,將計(jì)算的影響力從 5 萬億美元的信息產(chǎn)業(yè)拓展至 100 萬億美元的物理世界市場(chǎng)。" 如果你想構(gòu)建一個(gè)能在現(xiàn)實(shí)世界安全行動(dòng)的機(jī)器人系統(tǒng),唯一的方法就是仿真。我們必須在部署前用仿真反復(fù)測(cè)試所有可能的極端情況——現(xiàn)實(shí)世界測(cè)試太慢、太貴、太危險(xiǎn)。"

      不止 " 大象進(jìn)冰箱 ",物理 AI 重構(gòu)千行百業(yè)

      當(dāng)機(jī)器人在現(xiàn)實(shí)中成功將 " 大象放進(jìn)冰箱 " 時(shí),也意味著物理 AI 完成了從技術(shù)閉環(huán)到應(yīng)用落地的關(guān)鍵一步。但這僅僅只是開始,英偉達(dá)的物理 AI 正以 Omniverse+Cosmos 為核心,滲透到工業(yè)、物流、醫(yī)療等千行百業(yè),將計(jì)算的影響力從 5 萬億美元的信息產(chǎn)業(yè),推向 100 萬億美元的物理世界市場(chǎng)。

      " 大象進(jìn)冰箱 " 的虛擬案例,本質(zhì)上是英偉達(dá)物理 AI 技術(shù)的一個(gè)縮影——它證明了通過虛擬場(chǎng)景生成(Omniverse+Cosmos)→模型推理訓(xùn)練(Cosmos Reason+DGX)→現(xiàn)實(shí)部署優(yōu)化(AGX)的閉環(huán),AI 能真正理解并改造物理世界。如今,英偉達(dá)正聯(lián)合 Accenture、Avathon、Belden、DeepHow、Milestone Systems 和 Telit Cinterion 等合作伙伴一起通過基于物理 AI 的感知和推理強(qiáng)化全球運(yùn)營,將這一技術(shù)融入全球產(chǎn)業(yè)生態(tài)。

      " 大象進(jìn)冰箱 " 的虛擬案例,并非要實(shí)現(xiàn)荒誕的現(xiàn)實(shí)場(chǎng)景,而是標(biāo)志著人類用物理 AI 打破信息世界與物理世界邊界的技術(shù)探索起點(diǎn)。而英偉達(dá),正站在這一革命的最前沿。

      相關(guān)閱讀

      最新評(píng)論

      沒有更多評(píng)論了

      覺得文章不錯(cuò),微信掃描分享好友

      掃碼分享

      熱門推薦

      查看更多內(nèi)容