登錄
註冊
據 Woofun AI 消息,6 月 24 日,通用具身智能企業 RoboScience 機器科學正式發佈自研 Visics 通用具身大模型,首次完整披露 VLOA 技術架構,並展示其在傢俱拼裝、靈巧抓取及動態流水線等真實場景的落地能力。該模型旨在解決行業長期缺乏統一基礎表徵單元的痛點,通過重構認知與執行邏輯,實現跨本體、跨物體、跨任務的全域泛化,標誌着具身智能從單一硬件綁定向通用智能體演進的關鍵轉折。長期以來,大語言模型擁有標準文本 Token,自動駕駛具備統一視覺或點雲表徵,這些基礎格式的確定使得數據與模型能在不同場景間高效複用。
然而,具身智能領域至今未形成行業公認的基礎表徵單元,這一缺失直接決定了數據採集方式、模型學習路徑以及遷移至新場景的可行性。過去兩年,行業主流做法是讓模型直接學習機器人關節運動軌跡,即復刻特定硬件在特定任務下的動作座標。
這種邏輯的致命缺陷在於,一旦更換機器人本體、操作對象或作業場景,模型此前習得的能力便無法直接遷移。模型學會的僅是"夾爪如何抓起杯子"的具體動作,而非理解"抓取"這一動作本身的物理本質,包括什麼是抓、需要施加多大的力、物體受力後的反應機制等核心要素。RoboScience 機器科學創始人兼 CEO 田野指出,當前機器人操作面臨泛化能力差、精細操作難、長程任務誤差累積三大核心瓶頸。爲此,團隊選擇從底層出發,搭建一套全新的具身基礎表徵單元,以突破現有技術的天花板。作爲整套技術體系的核心底座,RoboScience 機器科學自研了 Visics 通用具身大模型,提出 Object Trajectory(物體 3D 點雲軌跡)作爲統一中間表徵標準,以此搭建分層解耦的 VLOA 架構,圍繞物體爲中心,徹底重構機器人的認知與執行邏輯。田野解釋稱,"Object"這個詞同時包含物體、目標兩層含義,能夠精準定義機器人與物件的交互關係,以及操作後物體需要達成的運動變化狀態。Visics 通用具身大模型內部採用雙引擎架構,由具身世界模型和通用操作模型各自獨立運轉,分開預訓練、分別迭代,互不干擾。其中,具身世界模型以海量互聯網視頻作爲預訓練數據,圍繞物體狀態、三維軌跡、接觸力與物理因果關係建模,深度學習物體在真實世界中的運動規律。通用操作模型則負責把"物體運動軌跡"轉化爲"機器人該怎麼做"。它通過物理引擎生成大規模仿真數據持續迭代,能夠操作剛體、鉸鏈件、軟質可形變體等各類物體,支持跨本體部署與閉環控制,同時兼容視覺、觸覺、力覺等多模態感知輸入。兩大引擎通過 VLOA 架構完成分層協同,Object Trajectory 作爲統一中間接口,上層具身世界模型負責預判、推演物體合理運動軌跡,下層通用操作模型給出適配各類機器人的硬件控制指令、負責落地執行軌跡。
這種分層解耦的設計,最終實現三大維度的全域泛化,適配任意機器人本體、操作任意類型物體、自主完成多樣化任務。以抓取動作爲例,對比傳統綁定單一機械臂、單一物件的訓練方案,基於 VLOA 架構的模型在抓取成功率、操作姿態豐富度、運算響應速度上均有明顯提升。在具身智能領域,數據是模型能力的根基,但傳統數據路線正面臨成本與產能的雙重天花板。
Woofun AI 整理數據顯示,RoboScience 機器科學以自研高精度仿真引擎 RoboMirage 爲核心,結合全自動視頻數據標註與清洗管線,構建了一套"仿真 + 視頻"雙數據飛輪。這套體系可將單條數據的獲取成本壓至傳統方案的 1/20 至 1/200,並以每週數十萬小時的速度持續擴張,預計 2026 年將構建超過 1T 高質量 manipulation 操作軌跡數據集。自成立以來,RoboScience 機器科學已獲得京東集團、商湯科技、達晨財智、招商局創投、零一創投、普華資本等多家 CVC 和財務機構的投資及產業支持,在北京、深圳、蘇州、杭州設有研發和生產中心。公司以大模型爲核心,縱向打通自研本體、控制器與 RobotOS,橫向構建模型泛化、便捷開發與多層級生態,搭建軟硬一體、閉環協同的商業模式。聯合創始人汪濤指出,具身智能真正的實際應用尚未到來,公司選擇先從物體維度切入,即解決對剛性、柔性及各種屬性物體的泛化操作能力,而非直接進入工業場景與自動化方案競爭。如商超、電商物流等場景,天然面臨海量 SKU、多品類的揀選與補貨需求,正是驗證物體維度泛化能力的最佳試驗場。
目前,RoboScience 機器科學已同多家零售、物流、康養服務企業及機器人本體、靈巧手公司開展試點合作,計劃於今年實現面向工業與商業場景的標準化機器人本體產品量產。
這一戰略路徑表明,具身智能的破局點或許不在於單一場景的極致優化,而在於構建能夠理解物理世界通用規律的底層模型。隨着 Object Trajectory 標準的逐步確立,機器人將不再是被編程執行固定動作的工具,而是具備物理推理能力的智能體,這將是繼大語言模型爆發後,人工智能在物理世界落地的又一里程碑。