AI“大腦”與機器人“身軀”能合體嗎
不久前,上海交通大學學生馮臨溪帶領的IRMV賽隊從全球13支頂尖賽隊中脫穎而出,斬獲第五屆ATEC科技精英賽亞軍。
這場人形機器人競賽可比“人形機器人運動會”難多了。賽場像是“荒野求生”現場,機器人要完成定向越野、吊橋穿越等極限任務,而且拒絕遙控。這意味着,人形機器人得像個人一樣自主感知、決策、執行任務。
這場比賽也體現了當前全球AI(人工智能)發展中的融合之勢:一面,是人形機器人即將步入量產元年;另一面,則是AI大模型不再滿足於困在服務器裏,而是急切地渴望“身軀”。來自貝恩公司的報告預測,未來10年,人形機器人將開啓“通用型勞動力”時代。
AI“大腦”與機器人“身軀”的融合之路,究竟行至何處?其融合的瓶頸與引爆點又是什麼?作爲中國AI產業高地與機器人研發重鎮,上海如何面向未來答好這道題?
融合已是必然
XREAL創始人兼CEO徐馳很喜歡一部十多年前的電影《她》,電影講述男主角與AI產生了情感羈絆。AI說:“我想看看你的世界。”於是,男主角將手機攝像頭固定在襯衫口袋上,讓“她”看見眼前的世界。
“今天我們所做的,就是打造一個‘更好的手機’,讓AI能夠伴隨我們。”在徐馳看來,過去兩年,以大模型爲代表的AI“大腦”經歷了能力上的躍遷,大模型逐步走向多模態,當人們不斷賦予AI對真實世界的感知能力時,大模型已不再滿足於被困在服務器的機箱裏,它們渴望“身體”、渴望感官、渴望新的增量數據。
另一方面,機器人“身軀”經過多年發展,在硬件關節、運動控制等方面取得長足進步。2024年世界人工智能大會上,人形機器人還只是展示品,到了2025年,它們已能跑能跳,還能打場拳擊賽,證明“軀體”的物理基礎正快速成熟。
與此同時,人形機器人產業也已走到量產新階段。貝恩公司全球合夥人、大中華區高科技業務主席成鑫表示,2024年,人形機器人出貨量僅達數千臺,但2026年或迎來量產元年,未來5至10年則將進入黃金髮展期。就在不久前,智元機器人第5000臺通用具身機器人下線,規模效應初顯。但公司聯合創始人王闖說了一句意味深長的話:“量產只是起點。”它意味着產品開始經受真實場景的考驗。
從某種程度上說,窗口期已然打開。AI“大腦”與機器人“身軀”的結合,已不是一個技術是否可行的問題,而是一個何時、以何種方式、在何種規模上落地的問題。
跨越“軟硬鴻溝”
儘管趨勢明朗,但融合並非坦途。至少,爲人形機器人裝上“大腦”,可不僅僅是讓它變成下一個“導覽機器人”,它比大模型與手機、眼鏡等智能硬件的融合,也更爲複雜。
“AI與具身智能的結合點將聚焦在視覺語言動作模型(VLA模型)具備物理常識和行動能力的閉環系統中。”德勤中國諮詢數智工程服務全國主管合夥人孫曉臻認爲,這一融合進程具體可以體現爲幾個遞進層次。一是感知與理解的融合,即“眼與腦”的結合,當下VLA模型的發展就成爲關鍵。二是規則與執行的閉環,即“腦與手”的結合,這一層是雙向同步的數字孿生,通過在數字環境中訓練和模擬,能夠實時同步至現實環境中執行。
當下,技術層的“感知—決策—控制”閉環尚未打通,但前沿領域已開始探索這種融合。在ATEC科技精英賽中,上海交大IRMV賽隊就在嘗試把AI大腦的抽象推理能力,精準轉化爲機器人身軀在複雜物理世界中的毫米級動作。隊長馮臨溪介紹,參賽機器人用了“拿來主義”的宇樹機器人,“這相當於一個硬件平臺,國內已做得非常領先”。團隊需要考慮的是算法,比如,定向越野考察的是運動控制和感知力的結合,鼓勵機器人自主完成任務,這就意味着需要研發感知算法,設計整個自動化流程,以及處理各種感知算法的特殊情況,光線變化、地面起伏、未知物體等無數變量,都需要通過軟硬協同來完成。
宇樹科技創始人王興興認爲,當前具身智能發展仍存在一些挑戰,特別在模型層面,多模態數據的融合並不理想,並且在機器人領域,模型與機器人的控制模態對齊也是難點。在他看來,只有當人形機器人能夠對80%未曾見過的任務達到80%的完成率時,才意味着通用具身基模的出現。
如果說比賽只是一種模擬,那麼,現實中更需要考慮的是“爲誰服務”和“能解決什麼問題”。貝恩公司全球副合夥人賀赫指出,當前訓練數據多來自工業物流場景,缺乏家庭等複雜開放環境的數據積累,這嚴重限制了模型的場景遷移能力。王闖也看到了量產之後的更深挑戰——機器人能否留在場景裏,在他看來,找到剛需、高頻、可規模複製的落地場景,是商業閉環的關鍵。
“合體”恰逢其時
從當前AI浪潮的技術演進來看,AI大模型和具身智能是兩條較爲獨立的產業路線。產業規模過於龐大,也增加了“大腦”與“身軀”生態融合的難度。
如果將當下比作“智能手機爆發前夜,充滿碎片化與混沌的時刻”,那麼無論是機器人操作系統、中間件,還是應用開發生態,都遠未形成統一標準。賀赫認爲,機器人軟件相關的生態正變得越來越重要,很難說有一家公司可以在未來的軟件生態下實現通喫,如何在軟件生態中佔據一席之地,某種程度也會成爲機器人廠商的護城河。
這是一個相互促進的過程。在徐馳看來,如果想把AI帶入下一階段,讓它變得更個性化、更主動、更強大,需要的是“增量數據”,包括人形機器人、智能眼鏡等,都是巨大的增量數據來源,它將更大釋放AI的能力。王興興也認爲,現在讓AI幹活,頂多算是荒漠上長了幾棵小草,爆發性增長的前夜還沒有到來。
從某種程度上說,融合不僅僅是把一個大模型“塞”進機器人本體,更需構建一套從底層芯片、操作系統到開發工具、應用商店的完整新生態。孫曉臻表示,從實現難度看,AI與具身智能“合體”仍處於早期發展階段,在多個維度面臨挑戰,包括數據缺失、安全與風險控制尚不成熟,以及系統集成與成本壓力等,“儘管前景光明,但需要整個生態共同努力”。
“十五五”規劃建議將推動具身智能成爲新的經濟增長點納入佈局。當下,具身智能領域的競爭已從單純企業引進轉向生態構建。2025年8月發佈的《上海市具身智能產業發展實施方案》明確提出,到2027年核心產業規模突破500億元,聚焦全產業鏈生態構建,搶佔生態鏈戰略佈局的窗口期。爲此,上海的產學研正在協同努力探索中。相信不久的將來,更多成果會走進市場。
文丨徐晶卉
編輯丨王秋童