創(chuàng)澤機器人 |
CHUANGZE ROBOT |
“小腦”的運動規(guī)劃與控制是展廳迎賓講解機器人實現(xiàn)自然和流暢動作的 關(guān)鍵。傳統(tǒng)的基于模型的控制方法通過建立機器人的運動學和動力學模型,進行運動軌跡規(guī)劃和平衡控制,特點是身體控制穩(wěn)健,步頻較慢,代表算法有零力矩點(ZMP,Zero Moment Point)算法、線性倒 立擺(LIP,Linear Inverted Pendulum)算法、模型預測控制(MPC, Model Predictive Control)算法、中心引力優(yōu)化(CFO,Central Force Optimization)算法等,但整體開發(fā)較為復雜,成本高,不利于產(chǎn)品快 速迭代;趯W習的控制方法則使用端到端的人工智能技術(shù),代替復 雜的運動學模型,大幅度降低了“小腦”開發(fā)難度、提升了迭代速度, 一般通過人類示教或自主學習建立運動執(zhí)行策略。其中通過人類示教 的方式也稱為模仿學習,指通過人或者其他專家提供反饋示教的方式, 使機器人以產(chǎn)生與示教相似的行動策略進行學習,效果依賴高質(zhì)量示范數(shù)據(jù)。通過自主學習的方式也稱為強化學習,指通過精心設(shè)計學習 目標,機器人不斷在環(huán)境中探索逐漸發(fā)現(xiàn)最大化獎勵的方式學習到最 優(yōu)的執(zhí)行策略,效果依賴于仿真環(huán)境。
目前主要的“小腦”技術(shù)路線包括以下幾種。
基于模型的控制方法:
ZMP判據(jù)及預觀控制;诤喕牡沽[模型/小車模型進行質(zhì) 心點運動規(guī)劃和控制。該算法需要精確的動力學模型和復雜的在線控 制策略,擾動適應(yīng)性差。典型代表有日本本田、AIST 的相關(guān)產(chǎn)品。
混雜零動態(tài)規(guī)劃方法。通過在全身動力學模型上采用非線性控制, 根據(jù)狀態(tài)選擇步態(tài),進行軌跡跟蹤控制。該算法需要精確的動力學模 型和線性化反饋,實時求解慢,對復雜環(huán)境適應(yīng)性差。典型代表有美 國俄勒岡州立大學的相關(guān)產(chǎn)品。
虛擬模型解耦控制。將控制解耦為速度、姿態(tài)、高度等,建立彈 簧阻尼等虛擬模型進行力矩控制。該算法降低了對精確動力學模型的 依賴,但融合復雜,對復雜環(huán)境的容錯能力有限。典型代表為波士頓 動力的相關(guān)產(chǎn)品。
模型預測控制+全身控制。基于簡單/復雜的動力學模型進行力的 預測控制,進而全身優(yōu)化,可實現(xiàn)臂足協(xié)同及物體接觸。該算法依賴 精確動力學模型和狀態(tài)估計,線性模型僅適用于下肢單一步態(tài)的控制, 而非線性模型求解速度慢。典型代表有美國麻省理工學院、瑞士蘇黎 世聯(lián)邦理工大學和波士頓動力公司的相關(guān)產(chǎn)品。
基于學習的控制方法:
強化學習。通過獎勵設(shè)計和仿真環(huán)境設(shè)計,實現(xiàn)了受控步態(tài)、奔 跑、轉(zhuǎn)彎、上下臺階等運動學習,提升運動的魯棒性,并可以通過采 用因果 Transformer 模型,從觀測和行動的歷史中對未來行動進行自 回歸預測來訓練。典型代表如 Agility Robotics 的相關(guān)產(chǎn)品。
模仿學習。采用非線性最優(yōu)化求解的動作映射,以人機關(guān)節(jié)軌跡 相似為目標,以機器人可執(zhí)行性、安全性、穩(wěn)定性判據(jù)為約束,規(guī)劃 運動方案。該算法計算耗時長,嚴重依賴初值,對碰撞檢測難以解析 計算。典型代表有日本 AIST、北京理工大學的相關(guān)產(chǎn)品。
機器人底盤 Disinfection Robot 消毒機器人 講解機器人 迎賓機器人 移動機器人底盤 商用機器人 智能垃圾站 智能服務(wù)機器人 大屏機器人 霧化消毒機器人 紫外線消毒機器人 消毒機器人價格 展廳機器人 服務(wù)機器人底盤 核酸采樣機器人 智能配送機器人 導覽機器人 |