中文字幕乱老妇女一视频,97青草香蕉依人在线视频,男人的天堂国产综合,伊人中文字幕亚洲精品

<style id="pje8p"><tr id="pje8p"></tr></style>

<blockquote id="go6aa"></blockquote>

<pre id="go6aa"><dfn id="go6aa"></dfn></pre><dd id="go6aa"><td id="go6aa"></td></dd>

<option id="go6aa"></option>

鈦媒體 12小時(shí)前

搭建 AI 通往真實(shí)世界交互的橋梁，商湯“絕影開悟”世界模型再升級(jí)

世界模型的價(jià)值不在于替代人類認(rèn)知，而在擴(kuò)展 AI 的物理邊界。正如商湯 CTO 王曉剛所言：" 我們搭建的是橋梁，而非終點(diǎn)。"

2025 年 7 月 26 日，世界人工智能大會(huì)（WAIC 2025）在上海開幕，商湯絕影帶來(lái)了升級(jí)后的 " 絕影開悟 " 世界模型。

這款官方定義為 " 連接數(shù)字世界與真實(shí)物理世界 " 的技術(shù)產(chǎn)品，一方面展示了商湯在輔助駕駛領(lǐng)域的量產(chǎn)落地能力，同時(shí)也揭示了其向具身智能領(lǐng)域延伸的野心——通過構(gòu)建 4D 真實(shí)世界模型，為 AI 搭建通往物理世界交互的技術(shù)橋梁。

從數(shù)據(jù)生成到實(shí)訓(xùn)場(chǎng)建設(shè)

在輔助駕駛領(lǐng)域，" 絕影開悟 " 的量產(chǎn)能力成為本次亮相的核心亮點(diǎn)。作為行業(yè)首個(gè)已實(shí)現(xiàn)量產(chǎn)的生成式世界模型，其技術(shù)價(jià)值已體現(xiàn)在產(chǎn)業(yè)實(shí)踐中。

此前，上海自動(dòng)駕駛實(shí)訓(xùn)場(chǎng)建設(shè)成果發(fā)布，商湯絕影深度參與其中，以 " 絕影開悟 " 世界模型給自動(dòng)駕駛實(shí)訓(xùn)場(chǎng)建設(shè)提供支持。

目前，商湯絕影已與上汽集團(tuán)旗下智己汽車打通 Cut-in（加塞）、碰撞等關(guān)鍵場(chǎng)景的數(shù)據(jù)生成鏈路，意味著這些高風(fēng)險(xiǎn)、低概率的駕駛場(chǎng)景可通過模型批量生成，無(wú)需依賴真實(shí)路測(cè)采集。

雙方的合作不止于此，據(jù)透露，未來(lái)將聯(lián)合打造 " 數(shù)據(jù)工廠 "，通過規(guī)?；蓤?chǎng)景數(shù)據(jù)，加速輔助駕駛系統(tǒng)的安全落地。

這種模式的優(yōu)勢(shì)在于解決了傳統(tǒng)路測(cè)的核心痛點(diǎn)：真實(shí)場(chǎng)景采集成本高、極端案例覆蓋率低。例如，一場(chǎng)罕見的暴雨天氣下的連環(huán)追尾場(chǎng)景，通過 " 絕影開悟 " 可在數(shù)小時(shí)內(nèi)生成數(shù)千組變體數(shù)據(jù)，而真實(shí)采集可能需要數(shù)年等待。

技術(shù)落地的背后，是產(chǎn)品化能力的支撐。

本次世界人工智能大會(huì)上，商湯絕影正式發(fā)布輔助駕駛領(lǐng)域首個(gè)生成式世界模型產(chǎn)品平臺(tái)，面向 B 端企業(yè)與 C 端開發(fā)者開放試用。

該平臺(tái)的功能體現(xiàn)在兩方面：一是場(chǎng)景定制的靈活性，支持天氣（晴 / 雨 / 雪）、光線（黎明 / 正午 / 黃昏）、道路類型（高速 / 城區(qū) / 鄉(xiāng)村）等多維度參數(shù)調(diào)整；二是 " 提示詞生成 " 的便捷性，用戶輸入 " 雨天路面直行，前方有面包車在碰撞前剎停 " 等描述，即可一鍵生成對(duì)應(yīng)場(chǎng)景視頻。

與之配套的，是業(yè)內(nèi)最大規(guī)模的生成式駕駛數(shù)據(jù)集 "WorldSim-Drive"。

該數(shù)據(jù)集包含超 100 萬(wàn)段（clips）量產(chǎn)級(jí)數(shù)據(jù)，覆蓋 50 余種天氣光照條件、200 類交通標(biāo)牌及 300 類道路連接場(chǎng)景。

比數(shù)據(jù)數(shù)量更關(guān)鍵的是數(shù)據(jù)質(zhì)量。通過多視角時(shí)空對(duì)齊技術(shù)，模型可以同時(shí)生成第一視角（駕駛員視角）與第三視角（外部觀測(cè)視角）數(shù)據(jù)，且分辨率達(dá) 1080P，時(shí)長(zhǎng)支持分鐘級(jí)連續(xù)記錄，保真度接近真實(shí)采集數(shù)據(jù)。

效率方面，" 絕影開悟 " 基于單張 A100 GPU，其每日生成的數(shù)據(jù)量相當(dāng)于 10 臺(tái)真實(shí)測(cè)試車或 100 臺(tái)路測(cè)車的采集能力，效率約為 500 臺(tái)量產(chǎn)車的總和。

據(jù)悉，目前商湯絕影已有 20% 的訓(xùn)練數(shù)據(jù)來(lái)自該模型生成，大幅降低了對(duì)真實(shí)路測(cè)的依賴。

4D交互訓(xùn)練場(chǎng)：從仿真測(cè)試到實(shí)時(shí)體驗(yàn)

" 絕影開悟 " 的技術(shù)縱深，體現(xiàn)在其構(gòu)建的 4D 實(shí)時(shí)交互訓(xùn)練場(chǎng)。其通過融合 3DGS 重建技術(shù)與世界模型生成能力，讓 4D 交互訓(xùn)練場(chǎng)實(shí)現(xiàn)了三項(xiàng)進(jìn)步。

其一，大尺度高精度重建。模型能夠?qū)?1km 范圍內(nèi)的真實(shí)空間進(jìn)行高精度數(shù)字化重建，為車端模型提供接近真實(shí)的虛擬測(cè)試環(huán)境。

其二，動(dòng)態(tài)場(chǎng)景閉環(huán)生成。用戶通過文本描述或場(chǎng)景布局設(shè)定，就可以觸發(fā) " 輸入需求→生成場(chǎng)景→微調(diào)優(yōu)化 " 的閉環(huán)流程，快速生成占道急剎、環(huán)島繞行等復(fù)雜場(chǎng)景。

其三，實(shí)時(shí)交互能力。策略模型與環(huán)境模型可以實(shí)現(xiàn)實(shí)時(shí)響應(yīng)，從而確保仿真測(cè)試結(jié)果與真實(shí)駕駛的一致性。

目前，4D 實(shí)時(shí)交互訓(xùn)練場(chǎng)已在合作中落地。商湯絕影與智己汽車合作構(gòu)建的測(cè)試場(chǎng)景庫(kù)，已覆蓋占道急剎、環(huán)島繞行等典型場(chǎng)景，未來(lái)計(jì)劃擴(kuò)展至千萬(wàn)級(jí)規(guī)模，來(lái)覆蓋幾乎所有的駕駛可能性。

在 WAIC 現(xiàn)場(chǎng)，觀眾還可以通過交互界面體驗(yàn) " 虛擬駕駛 "，例如在模型生成的暴雨天氣高速場(chǎng)景中，實(shí)時(shí)操控車輛應(yīng)對(duì)加塞，感受模型對(duì)物理環(huán)境的仿真精度。

向具身智能的延伸

如果說(shuō)智能汽車是 " 簡(jiǎn)單的具身智能 "，那么機(jī)器人等硬件則需要更復(fù)雜的物理世界理解能力。

這類具身智能面臨的核心難題是 " 數(shù)據(jù)維度爆炸 "，即機(jī)器人的傳感器配置（視覺、觸覺、力覺等）、移動(dòng)方式（輪式、履帶式、多足式）遠(yuǎn)多于汽車，且需應(yīng)對(duì)家庭、工業(yè)等多樣化場(chǎng)景，傳統(tǒng)數(shù)據(jù)采集方式成本高、效率低。更棘手的是 "Sim2Real 鴻溝 "，即通過模擬工具生成的數(shù)據(jù)難以直接應(yīng)用于真實(shí)場(chǎng)景。

而商湯絕影的解決辦法是將輔助駕駛領(lǐng)域的 " 虛實(shí)融合 " 數(shù)據(jù)遷移到具身智能上。

首先，構(gòu)建多模態(tài)時(shí)空對(duì)齊能力。通過多傳感器融合技術(shù)，模型可將視覺、觸覺等數(shù)據(jù)在時(shí)間與空間維度精準(zhǔn)匹配。

其次，生成高保真 4D 環(huán)境?；趧?dòng)態(tài)環(huán)境建模技術(shù)，模型能實(shí)時(shí)預(yù)測(cè)物體運(yùn)動(dòng)軌跡，例如預(yù)判家庭場(chǎng)景中寵物的突然跑動(dòng)。

最后，建立閉環(huán)驗(yàn)證體系。通過強(qiáng)化學(xué)習(xí)，機(jī)器人可以在虛擬環(huán)境中反復(fù)訓(xùn)練交互動(dòng)作，再遷移至真實(shí)世界。

支撐這一遷移的是商湯的具身 3D 資產(chǎn)庫(kù)，其中包含了 10 萬(wàn)個(gè)真實(shí) 3D 資產(chǎn)，涵蓋了家庭、辦公、工業(yè)等 20 類場(chǎng)景的動(dòng)作數(shù)據(jù)。

更關(guān)鍵的是數(shù)據(jù)視角的完整性，模型既可生成機(jī)器人的 " 第一視角 "，例如抓取物體的手部特寫；也能生成 " 第三視角 "，例如上帝視角下的機(jī)器人全身動(dòng)作，從而解決了傳統(tǒng)數(shù)據(jù)視角單一的問題。

結(jié)語(yǔ)：

" 絕影開悟 " 的進(jìn)化路徑，本質(zhì)上是 AI 從數(shù)字世界走向物理世界的縮影。

商湯科技聯(lián)合創(chuàng)始人、CTO 王曉剛在世界人工智能大會(huì)上表示，" 絕影開悟 " 世界模型的核心價(jià)值在于 " 將 AI 創(chuàng)造力轉(zhuǎn)化為生產(chǎn)力 "，既為輔助駕駛提供場(chǎng)景數(shù)據(jù)，也為具身智能打造數(shù)據(jù)引擎。

從輔助駕駛到機(jī)器人，從數(shù)據(jù)生成到實(shí)時(shí)交互，" 絕影開悟 " 的技術(shù)邏輯都圍繞一個(gè)目標(biāo)：通過構(gòu)建與真實(shí)世界一致的 4D 模型，讓 AI 在虛擬環(huán)境中 " 學(xué)會(huì) " 與物理世界交互。

當(dāng)這種能力成熟時(shí)，或許我們將看到家庭機(jī)器人能精準(zhǔn)預(yù)判老人起身時(shí)的動(dòng)作輔助，工業(yè)機(jī)械臂能在復(fù)雜流水線中自主避障。而這一切的起點(diǎn)，正是世界模型這個(gè)連接數(shù)字與物理世界的技術(shù)橋梁。（本文首發(fā)于鈦媒體 App 作者｜王垚，編輯｜李玉鵬）

查看原文

宙世代

ZAKER旗下Web3.0元宇宙平臺(tái)

一起剪

ZAKER旗下免費(fèi)視頻剪輯工具

相關(guān)標(biāo)簽

機(jī)器人 ai

相關(guān)閱讀

PCB+PET銅箔+固態(tài)電池！公司HVLP1-2主要終端應(yīng)用于英偉達(dá)項(xiàng)目及400G/800G光模塊領(lǐng)域

財(cái)聯(lián)社 2小時(shí)前

黃仁勛：最好的賺錢機(jī)會(huì)來(lái)了！AI五年內(nèi)創(chuàng)造的百萬(wàn)富翁會(huì)比互聯(lián)網(wǎng)20年創(chuàng)造的更多

快科技 7小時(shí)前

微軟Edge轉(zhuǎn)向AI瀏覽器！推出全新Copilot模式：可實(shí)時(shí)分析屏幕內(nèi)容

快科技 7小時(shí)前

單款下載超1.8億，這個(gè)經(jīng)典玩法正在“血洗”各大榜單

鈦媒體 8小時(shí)前

拉夏貝爾：重生后我成了女裝榜一

鈦媒體 8小時(shí)前

當(dāng) AI 與數(shù)學(xué)在上海相遇：2025 WAIC背后的智慧革命

鈦媒體 8小時(shí)前

《流浪地球2》同款“機(jī)甲”上市！穿戴后輕松爬10樓

快科技 9小時(shí)前

行業(yè)最高水平！當(dāng)貝S7 Ultra Max原生對(duì)比度達(dá)到8000：1

快科技 10小時(shí)前

影石為何殺入無(wú)人機(jī)市場(chǎng) 創(chuàng)始人回應(yīng)：有三個(gè)原因無(wú)比尊重大疆

快科技 10小時(shí)前

李楠曬出iPhone 17 Air模型：輕薄真的是殺手锏

快科技 10小時(shí)前

根本不夠賣??！NVIDIA庫(kù)存H20芯片僅90萬(wàn)顆：遠(yuǎn)不及中國(guó)需求180萬(wàn)顆

快科技 10小時(shí)前

白熱化！國(guó)產(chǎn)協(xié)作機(jī)器人市占率超九成，“出?！背蔀楸剡x題

21世紀(jì)經(jīng)濟(jì)報(bào)道 10小時(shí)前

從螞蟻到平安，王曉航去向已定

21世紀(jì)經(jīng)濟(jì)報(bào)道 10小時(shí)前

“黑科技”音樂會(huì)，WAIC新奇瞬間

21世紀(jì)經(jīng)濟(jì)報(bào)道 11小時(shí)前

蔚來(lái)通報(bào)網(wǎng)絡(luò)水軍惡意造謠：已起訴“大D有態(tài)度、阿文鑒機(jī)”等賬號(hào)

快科技 11小時(shí)前

最新評(píng)論

沒有更多評(píng)論了

鈦媒體

訂閱

覺得文章不錯(cuò)，微信掃描分享好友

掃碼分享

熱門推薦

查看更多內(nèi)容

Blockchain News

<ul id="wu0so"></ul>