當前位置：首頁 > 新聞資訊 > 機器人開發(fā) > 大模型與智能機器人結(jié)合,用語言指導(dǎo)機器人抓取物體

大模型與智能機器人結(jié)合,用語言指導(dǎo)機器人抓取物體

來源：CAAI認知系統(tǒng)與信息處理專委會編輯：創(chuàng)澤時間：2023/9/6 主題：其他 [加盟]

從斯坦福大學(xué)的 VIMA 機器人智能體，到谷歌 DeepMind 推出控制機器人的視覺 - 語言 - 動作（VLA）的模型 RT-2，大模型加持的機器人研究備受關(guān)注。

當前，自監(jiān)督和語言監(jiān)督的圖像模型已經(jīng)包含豐富的世界知識，這對于泛化來說非常重要，但圖像特征是二維的。我們知道，機器人任務(wù)通常需要對現(xiàn)實世界中三維物體的幾何形狀有所了解。

基于此，來自 MIT CSAIL 和 IAIFI 的研究者利用蒸餾特征場（Distilled Feature Field，DFF），將準確的 3D 幾何圖形與來自 2D 基礎(chǔ)模型的豐富語義結(jié)合起來，讓機器人能夠利用 2D 基礎(chǔ)模型中豐富的視覺和語言先驗，完成語言指導(dǎo)的操作。

論文地址：https://arxiv.org/abs/2308.07931

具體來說，該研究提出了一種用于 6-DOF 抓取和放置的小樣本學(xué)習(xí)方法，并利用強大的空間和語義先驗泛化到未見過物體上。使用從視覺 - 語言模型 CLIP 中提取的特征，該研究提出了一種通過開放性的自然語言指令對新物體進行操作，并展示了這種方法泛化到未見過的表達和新型物體的能力。

研究團隊用一個講解視頻詳細介紹了 F3RM 方法的技術(shù)原理：

免费一级片观看,日韩99在线,欧美另类视频,第四色播日韩第一页

大模型與智能機器人結(jié)合,用語言指導(dǎo)機器人抓取物體

控制器在機器人運動控制系統(tǒng)中發(fā)揮核心作用

機器人整體電子電氣結(jié)構(gòu)以電控系統(tǒng)為基礎(chǔ)

氣壓/液壓驅(qū)動型機器人靈巧手特點

電機驅(qū)動型機器人靈巧手特點

驅(qū)動器混合置型機器人靈巧手特點

驅(qū)動器內(nèi)置型機器人靈巧手特點

驅(qū)動器外置型機器人靈巧手特點

機器人多指靈巧手經(jīng)歷了三個階段

機器人靈巧手是指數(shù)≥3，自由度≥9 的末端執(zhí)行器

智能類人機器人特斯拉擎天柱 (Optimus) 執(zhí)行機構(gòu)分析

人形機器人前主要聚焦于運動控制能力的提升

特斯拉機器人軀干共有28個關(guān)節(jié)

服務(wù)機器人(迎賓、講解、導(dǎo)診...)

智能消毒機器人

機器人開發(fā)平臺

大模型與智能機器人結(jié)合,用語言指導(dǎo)機器人抓取物體

服務(wù)機器人(迎賓、講解、導(dǎo)診...)

智能消毒機器人

機器人開發(fā)平臺

服務(wù)機器人(迎賓、講解、導(dǎo)診...)