近日,在2025中關村論壇"人工智能前沿峰會"上,智源研究院推出兩項突破性成果——跨平臺智能協(xié)作系統(tǒng)RoboOS及開源認知中樞RoboBrain。
據(jù)現(xiàn)場技術白皮書顯示,RoboBrain已集成超百億參數(shù)的多模態(tài)大模型,支持對自然語言指令的語義解構(gòu)與三維空間映射,在工業(yè)分揀、家庭服務等場景中實現(xiàn)意圖理解準確率達92.7%。
該技術體系通過模塊化架構(gòu)實現(xiàn)多場景任務快速遷移部署與異構(gòu)設備協(xié)同,標志著單體智能向群體智能的范式轉(zhuǎn)變,為構(gòu)建標準化智能體生態(tài)系統(tǒng)奠定技術基礎。
實際上,在實體化智能領域,長周期復雜作業(yè)能力是機器人執(zhí)行任務的關鍵瓶頸。
RoboBrain創(chuàng)新性地整合了任務解析、空間感知與運動規(guī)劃三維度能力,將抽象語義指令轉(zhuǎn)化為精確動作序列,顯著提升遠程操控效能。目前該系統(tǒng)已實現(xiàn)人類自然語言指令與多視角視覺數(shù)據(jù)的聯(lián)合理解,可動態(tài)生成帶實時反饋的行動方案,同步評估執(zhí)行狀態(tài)并預測運動軌跡。
技術層面,RoboBrain通過融合環(huán)境三維信息與目標對象狀態(tài),支持第一/第三人稱視角的跨模態(tài)數(shù)據(jù)處理,可針對機械臂控制、移動導航等差異化任務生成最優(yōu)路徑規(guī)劃,并在多場景遷移中保持穩(wěn)定的泛化性能。
RoboOS系統(tǒng)采用"中樞-邊緣"分層架構(gòu),通過智能資源調(diào)度與跨設備協(xié)同機制,為機器人提供可擴展的底層支撐平臺。其創(chuàng)新之處在于實現(xiàn)認知模型(如多模態(tài)大模型)與執(zhí)行模塊(抓取、避障等)的即插即用,目前已適配松靈雙機械臂、智元人形機器人等十余種智能終端。
依托多模態(tài)大模型技術積累,智源研究院正聯(lián)合北京大學、中科院自動化所等學術機構(gòu),攜手銀河通用、宇樹科技等產(chǎn)業(yè)伙伴,共建智能體創(chuàng)新聯(lián)合實驗室,重點突破數(shù)據(jù)閉環(huán)、模型訓練及場景驗證等關鍵技術,加速智能體技術的產(chǎn)業(yè)化落地進程。
從長遠來看,人形機器人具有獨特優(yōu)勢,其與人的構(gòu)型相似,能更好適應社會基礎設施,從海量互聯(lián)網(wǎng)數(shù)據(jù)中學習人類技能,有利于具身智能和具身大腦模型的迭代。
不過,短期內(nèi),人形機器人在產(chǎn)業(yè)落地方面仍面臨諸多挑戰(zhàn),很多機器人尚處于“能走”階段,正向“走得快、走得穩(wěn)”的目標努力。
昵稱 驗證碼 請輸入正確驗證碼
所有評論僅代表網(wǎng)友意見,與本站立場無關