《科創(chuàng)板日報》11 月 8 日訊(記者 黃心怡)在第八屆進博會期間,來自宇樹科技、優(yōu)比選、商湯科技等多位專家圍繞具身智能的落地應(yīng)用分享了看法。
《科創(chuàng)板日報》記者了解到,明年將是人形機器人落地的關(guān)鍵年。目前,人形機器人已在一定范圍內(nèi)應(yīng)用于表演、交互、展廳導(dǎo)覽等場景,然而要進入工廠實現(xiàn) " 大規(guī)模交付 " 仍存在瓶頸,距離真正意義上的產(chǎn)業(yè)化尚有差距。若未來要進一步走入家庭場景,則還需應(yīng)對標(biāo)準(zhǔn)規(guī)范、安全性、用戶隱私等一系列更為復(fù)雜的問題。
整體而言,機器人產(chǎn)業(yè)正從基礎(chǔ)的本體制造,向更細(xì)分、更高難度的領(lǐng)域深入探索。未來產(chǎn)業(yè)將持續(xù)向上游延伸,朝著更精細(xì)化、技術(shù)密集度更高的方向發(fā)展,最終構(gòu)建起完整的人形機器人產(chǎn)業(yè)鏈。
▍明年將是人形機器人落地的關(guān)鍵年
優(yōu)必選副總裁、研究院院長焦繼超認(rèn)為,明年會是人形機器人落地的關(guān)鍵一年。對于行業(yè)特別是對于優(yōu)必選來說,必須要找到一個真正落地的場景,而且該場景是有可復(fù)制性,具有一定的規(guī)模性。
對于人形機器人,焦繼超認(rèn)為工業(yè)場景應(yīng)該是率先落地,實現(xiàn)全自主地工作。商業(yè)場景今年也有一些真正的應(yīng)用,除了跳舞、表演外,還包括導(dǎo)覽、4S 店、展廳的講解等。
" 明年全尺寸的人形在這些場景里會有更多的應(yīng)用。在其他的行業(yè)里, 2-3 年之后在工業(yè)場景才能泛化到一些更復(fù)雜的操作。在商業(yè)場景類似酒店服務(wù)員的角色,因為涉及與人打交道的更復(fù)雜場景,這個時間點應(yīng)該是 3-5 年。家庭場景則涉及到標(biāo)準(zhǔn)問題和安全問題,進入家庭場景能夠作業(yè)的人形機器人,至少需要 8-10 年左右的時間。"
微億智造聯(lián)合創(chuàng)始人、首席運營官潘正頤也認(rèn)為,人工智能將在未來智能制造中發(fā)揮關(guān)鍵乃至決定作用。而當(dāng)前制造企業(yè)面臨的核心挑戰(zhàn)在于:過度依賴自動化易引發(fā)剛性生產(chǎn),難以適應(yīng)多品種、小批量的柔性需求;過度依賴人工則易造成效率瓶頸與質(zhì)量一致性差問題。具身智能技術(shù)與工業(yè)機器人的深度融合成為破局關(guān)鍵,如通過機器人調(diào)試智能化、多工序柔性切換等,實現(xiàn)生產(chǎn)柔性、效率與質(zhì)量協(xié)同提升,真正推動人工智能在工業(yè)現(xiàn)場的深度落地與價值實現(xiàn)。

此外,隨著自動駕駛技術(shù)的發(fā)展,無人物流車正迎來快速普及的契機,將深入解決 " 最后一公里 " 的末端配送難題。它們可自主完成上貨、分揀等任務(wù),應(yīng)用于前置倉、閃購倉等標(biāo)準(zhǔn)化程度高、數(shù)量龐大的場景。然而,其大規(guī)模應(yīng)用仍面臨核心挑戰(zhàn):如何精準(zhǔn)識別和處理數(shù)千甚至上萬個 SKU(庫存單位),這對機器的視覺感知與認(rèn)知決策能力提出了極高要求。
帕西尼感知科技創(chuàng)始人兼 CEO 許晉誠看好近端小型人形機器人的落地。" 小型人形機器人,現(xiàn)階段在娛樂相關(guān)、教育相關(guān)基本上已經(jīng)有大量落地能力。而走進工廠可能在五年內(nèi)。"
擎朗創(chuàng)始人兼 CEO 李通則提到了中國機器人的出海機遇。" 在這個關(guān)鍵時間節(jié)點上,機器人正在大規(guī)模走進全球的工廠和生活,這為中國機器人企業(yè)提供了前所未有的出海窗口期。"

▍人形機器人大規(guī)模交付仍存在難點
一目科技創(chuàng)始人兼 CEO 李智強在采訪中對《科創(chuàng)板日報》表示,具身智能的核心點是 " 類人 ",這就需要擁有感知 - 決策 - 執(zhí)行這樣一整套閉環(huán)控制,才能夠?qū)崿F(xiàn)類人的具身智能。其中,感知能力必不可少,而且非常重要。一目科技此前發(fā)布了全球最薄可商用仿生視觸覺傳感器,目前形成銷售和合作線索的已有上百家客戶。
他認(rèn)為,在視觸覺傳感器這些新興領(lǐng)域,中國企業(yè)的機遇很大。不過仍需要提升參數(shù)性能以及量產(chǎn)能力," 能實現(xiàn) 10 萬、百萬量級量產(chǎn)的企業(yè),還比較稀缺。"
談及產(chǎn)業(yè)趨勢,李智強表示,機器人產(chǎn)業(yè)正從本體往更細(xì),更難的方向上探索。" 今年的趨勢是手的自由度越來越高、越來越靈活。未來將繼續(xù)往上游發(fā)展,走向更精細(xì)化,技術(shù)含量更高的方向,最終形成完整的人形機器人產(chǎn)業(yè)鏈。"
在李智強看來,現(xiàn)階段人形機器人的大規(guī)模交付仍存在瓶頸,離真正的產(chǎn)業(yè)化仍有一段距離。
" 工業(yè)領(lǐng)域動作不復(fù)雜,但重復(fù)性操作比較多,對精度要求比較高,很多傳統(tǒng)的工業(yè)臂就已經(jīng)可以搞定了。這樣的一些場景并非人形機器人最合適的場景。一目科技更多地在探索非重復(fù)性的、非標(biāo)準(zhǔn)化的,需要精細(xì)化操作的場景。"

樂聚智能董事長冷曉琨則判斷,明年人形機器人在工業(yè)領(lǐng)域有望出現(xiàn)采購交付數(shù)量過萬的企業(yè)。預(yù)計在未來五年左右,相關(guān)技術(shù)有望邁過 " 基本可用 " 的門檻。
"但要真正作為產(chǎn)品進入到我們身邊的話,可能要奔著十來年的過程,涉及到的標(biāo)準(zhǔn)、安全、隱私一系列問題,要比技術(shù)問題復(fù)雜棘手得多。"
▍世界模型更被看好
當(dāng)前,世界模型和 VLA 模型代表了具身智能領(lǐng)域兩個并行互補的技術(shù)路線,一目科技創(chuàng)始人兼 CEO 李智強認(rèn)為,最終收斂至哪一條,還未有定論。" 中短期內(nèi),VLA 模型是補充,長遠(yuǎn)來看大概率會走向世界模型,但其有賴于大量的數(shù)據(jù)訓(xùn)練。"
宇樹科技創(chuàng)始人王興興也更青睞基于視頻生成的世界模型。他指出,當(dāng)前基于 VLA+RL 的模型在泛化能力上仍有不足,個人更喜歡基于視頻生成技術(shù)構(gòu)建的世界模型。
但他也表示,世界模型同樣面臨挑戰(zhàn)。" 中小型機器人公司對這個模型跑不太動,因為視頻生成模型對算力的需求非常大,需要的算力卡比較多。目前反而是一些大的 AI 公司、互聯(lián)網(wǎng)公司對視頻模型的資源更加豐富,可以做出來的概率更大一點。"