亚洲精品亚洲人成在线观看下载-亚洲精品色情app在线下载观看-欧美孕妇变态孕交粗暴-中国农村熟妇性视频-真人作爱免费视频

激光焊接機器人
分揀機器人是怎么工作的,當機器人遇見強化學習,會碰出怎樣的火花?
2022-08-15
智能自動分揀機器人藥品分揀機器人批發(fā)價格

當機器人遇見強化學習,會碰出怎樣的火花?

一名叫Cassie的機器人,給出了生動演繹。

最近,24歲的中國南昌小伙李鐘毓和其所在團隊,用強化學習教Cassie走路,目前它已學會蹲伏走路和載重走路等。

相關論文以《雙足機器人魯棒參數(shù)化運動控制的強化學習》(ReinforcementLearningforRobustParameterizedLocomotionControlofBipedalRobots)為題,已被機器人國際學術頂會ICRA收錄。

智慧垃圾分揀機器人應用領域

通過強化學習,它能自己走路,并能進行自我恢復。在現(xiàn)實世界中,通過反復試驗來訓練大型機器人會很危險,為解決這些問題,李鐘毓所在小組使用了兩個不同的仿真環(huán)境。

研究中,一個虛擬版本的Cassie,通過與環(huán)境交互產(chǎn)生的大量數(shù)據(jù),來學習穩(wěn)定的步態(tài)。

習得的步態(tài)控制器,被轉(zhuǎn)移到名為SimMechanics的第二個仿真環(huán)境中進行驗證,該環(huán)境有更高的準確性,可用以模擬現(xiàn)實世界的物理過程,但是會減慢仿真運行速度。

而通過使用在仿真環(huán)境中學習的步態(tài)控制器,Cassie能非常平穩(wěn)地行走,且無需進行任何額外微調(diào)。它不僅能像人類一樣前后左右地走,還能蹲著走,也能承受意料之外的負載,更能從強行推動造成的失穩(wěn)狀態(tài)中恢復過來。

智能分揀機器人上市公司

比如,在測試期間,Cassie損壞了它右腿的兩個電機,但它仍能調(diào)整其步行策略、并進行適應。

機器人如何更魯棒?答案是強化學習

Cassie是李鐘毓所在的HybridRoboticsGroup實驗室、從美國AgilityRobotics公司買來的,它大概有一米多高,內(nèi)部擁有十個電機,以及二十個自由度。

據(jù)他介紹,Cassie于2017年首次開始出售,他從2019年開始接觸,目前已經(jīng)研究兩年有余。

并聯(lián)分揀機器人關鍵技術

買來后,其主要用于測試和驗證不同算法,如控制算法和導航控制算法等。在李鐘毓這里,Cassie更像是一個研究平臺。

事實上,足式機器人的核心正是控制算法。研究中,李鐘毓主要使用Python進行編程,主體代碼由其所在小組搭建,剩余一部分基于其他學者的開源代碼。

由于是二足機器人,算法控制上會更難。而該研究的創(chuàng)新點在于,用強化學習的方法,得到控制二足機器人步態(tài)的算法,相比傳統(tǒng)基于模型的算法,性能可得到顯著提升。

由此帶來的魯棒性也比較強,怎么推它都不會倒,即便在幾乎快要摔倒的情況下,也能快速恢復穩(wěn)定狀態(tài),這也是業(yè)內(nèi)首次展示出二足機器人如此穩(wěn)定的性能。

在強化學習之前,傳統(tǒng)基于模型的方法,需要很多時間和技巧給機器人做建模,尤其對于二足機器人而言,一旦其自身性質(zhì)和周圍環(huán)境發(fā)生改變,比如電機壞了、地面摩擦力有變化,模型很有可能就會失效。

其次,對于雙足式的機器人系統(tǒng),其非線性非常高,并且由于是高自由度的混合系統(tǒng),每一次踏步都會受到地面沖擊力,因此很難獲得精確模型。

而要想做一個實時控制算法,就要使用相對完整的動力學模型。但是,即便具備好的模型,部署在非常高自由度的非線性系統(tǒng)上,也很難做到較快的實時計算。

因此,使用傳統(tǒng)方法時,很多學者都會做出權衡取舍,比如往往用簡化模型來做控制算法。

這樣做出的算法有兩個缺點:一是無法完整利用動力學模型,無法充分發(fā)揮機器人系統(tǒng)的靈敏性;二是基于模型的算法,一旦超過其穩(wěn)定區(qū)域,算法就會輕易崩潰。

而強化學習的優(yōu)點在于,通過相對完整的機器人動力系統(tǒng),Cassie在仿真環(huán)境反復嘗試后,就能獲得大量和環(huán)境交互的數(shù)據(jù),從而學會用穩(wěn)定步態(tài)行走。

圖|本次研究的核心:基于強化學習的步態(tài)控制器

如上圖所示,這是本次研究提出的基于學習的步行控制器,控制器的輸入包括所期望的步態(tài)參數(shù)、期望的轉(zhuǎn)彎偏航速度、由期望的步態(tài)參數(shù)解碼的參考步態(tài)、一段時間內(nèi)的觀察到的機器人狀態(tài)以及控制器的輸出。

另據(jù)悉,控制器可輸出十個電機的期望位置,通過低通濾波器后,可被發(fā)送到各個關節(jié)處的PD控制器產(chǎn)生期望的電機力矩。

兩大創(chuàng)新,讓Cassie可模仿各種步態(tài)

李鐘毓告訴DeepTech,該研究主要有兩大創(chuàng)新點。

第一個創(chuàng)新點,在于采用了步態(tài)庫,里面有各種各樣不同的步行速度和步行高度的步態(tài),比如有1米每秒的前進速度、0.3米每秒的側(cè)向行走速度、和0.7米的步行高度下的步態(tài)。這樣就能在步態(tài)庫中各取所需,從而讓機器人模仿不同的參考步態(tài),同時還能追蹤參考步態(tài)的速度和步行高度。

通過步態(tài)庫,在訓練中使用神經(jīng)網(wǎng)絡所代表的控制器,就能控制不同的步行速度和步行高度,比如往前或者往后。此外,不同步態(tài)之間還可實現(xiàn)來回切換。

此外,步態(tài)庫還能提供更多參考動作,Cassie在仿真學習時,就能見到各種步態(tài),同時還能學會在各種動作下保持平衡。

如下圖所示,Cassie滑了一跤,幾乎差點摔倒,但在用安全繩把自己拉起來后,它能迅速恢復穩(wěn)定步態(tài),這個能力是前所未有的,而且李鐘毓也并未就該能力,專門訓練過它。

也就是說,這是Cassie通過在訓練中模仿各種步態(tài),并讓自己從不同步態(tài)的過渡中“自摸學會”的能力,這在大部分基于模型控制算法的機器人身上很難實現(xiàn)。

試想一下,如果機器人自己倒在地上,沒有人扶它,無論對它自己還是對周圍人都非常危險。

藥品分揀機器人視覺

第二個創(chuàng)新點在于,結合了機器人的歷史輸入和輸出,從而實現(xiàn)對Cassie和其所在環(huán)境的在線系統(tǒng)辨識。

圖書館分揀機器人

這樣,控制器就能讓Cassie適應不同的環(huán)境,比如不同地面的摩擦力。

測試中,Cassie的兩個電機壞了,但它仍能快速適應系統(tǒng)變化。再比如,把不同重物放在Cassie身上,即便拉著后面的安全架,它也能迅速適應這種變化。

圖書分揀機器人的前景

據(jù)悉,該研究由李鐘毓所在的、由Prof.KoushilSreenath帶領的課題組,和伯克利大學Prof.SergeyLevine、以及Prof.PieterAbbeel兩個課題組合作。

李鐘毓所在的小組,專注于機器人和控制算法領域,其他兩個小組則是強化學習方面的專家。此外,該工作的成功也離不開團隊成員程旭欣、XueBinPeng、GlenBerseth的共同努力。

可應用于災后搜救和快遞“最后一公里”

相比其他機器人,Cassie有更大的運動空間,因為人類社會的環(huán)境,主要圍繞人類需求而建造。而二足控制算法,能讓Cassie在人類環(huán)境中更好地運動比如爬樓梯,這也是輪式機器人無法實現(xiàn)的。

具體應用中,當發(fā)生地震時,Cassie能在塌房中做救援工作;或者在“最后一公里”的快遞中,在此之前先用快遞車運送到固定地方,但因為收件人一般在室內(nèi),這時Cassie就能替代快遞小哥,把快遞當面送給用戶。

此外,Cassie這類二足機器人,形態(tài)上和人類相似,人類也更傾向于和它們做更好的交互,比如可以給其設計富有感情的動作,冷冰冰的機器也能變得更有溫度。

李鐘毓之前的論文《動畫Cassie:一個可讀的動力學機器人角色》(AnimatedCassie:ADynamicRelatableRoboticCharacter),首次用動畫軟件給Cassie設計了富有表情的動作,并使用基于模型的軌跡優(yōu)化的算法,設計出來的動作能讓Cassie在現(xiàn)實世界中復現(xiàn)出來,上述論文也入選了IROS2020最佳娛樂應用論文。

據(jù)悉,這也是首次在二足機器人上做這種嘗試,Cassie也因此能用肢體語言表達感情和人交互。

未來,李鐘毓會就Cassie的算法技術做以局部開源,相關研究方法已經(jīng)以論文形式發(fā)表,以推動足式機器人的進步。

看好中國機器人發(fā)展態(tài)勢,博士畢業(yè)后或?qū)⒒貒l(fā)展

談及研究中難忘的事情,李鐘毓表示,當時仿真訓練做了很久都“顆粒無收”,不過此前也沒有學者能一次就做成功。

仿真訓練模型,非常難以部署到真實世界中。畢竟真實環(huán)境和仿真環(huán)境的差異非常大。為此,他折騰很久都沒有眉目,導師也勸他再做不出來就要換方向。

但他秉持“不是有希望才堅持,而是堅持才有希望”的想法,首次把訓練得到的控制器部署在Cassie就取得了成功。

實驗成功后,他激動得給導師發(fā)了一條短信,導師知道后也非常振奮。這等于無需進行算法調(diào)參,開發(fā)好就能直接部署到機器人上。

李鐘毓生于1996年,來自江西南昌,本科就讀于浙江大學竺可楨學院,學習機械電子工程,大四時申請到去卡內(nèi)基梅隆大學機器人研究所做科研實習。

在那里,他專門在機器人Ballbot的開發(fā),該機器人能在一個球上保持平衡,并能帶領盲人避開障礙物,這也為他后續(xù)工作夯實了基礎。

由于表現(xiàn)優(yōu)秀,本科畢業(yè)后,CMU的導師把其推薦到伯克利大學機械系控制和機器人方向直博。

今年他在讀博二,雖然畢業(yè)去向還未明朗,但他認為回國是很好的選擇。因為他認為,中國現(xiàn)在有非常成熟的機器人平臺,兩足機器人也有著很好的發(fā)展空間。

原文標題:24歲浙大畢業(yè)生研發(fā)兩足機器人,已學會蹲伏走路和載重走路,應用于“最后一公里快遞”和災后搜救|專訪

高速分揀機器人維護保養(yǎng)立鏢分揀機器人國產(chǎn)分揀機器人供應商
主站蜘蛛池模板: 情人伊人久久综合亚洲| 人妻在厨房被色诱 中文字幕| 国产精品久久久av久久久| 加勒比色老久久综合网| 日日躁夜夜躁狠狠躁| 狠狠躁夜夜躁无码中文字幕| 久久婷婷六月综合色液啪| 国语做受对白xxxxx在线| 69精品国产久热在线观看| 麻豆成人久久精品综合网址| 国产美女精品视频线免费播放| 综合久久给合久久狠狠狠97色| 色哟哟在线视频精品一区| 换脸国产av一区二区三区| 人人澡人人曰人人摸看| 狠狠噜狠狠狠狠丁香五月| 无码中文字幕日韩专区视频| 任我爽精品视频在线观看| 丰满熟妇乱又伦在线无码视频| 国产女人高潮视频在线观看| 成人国产精品日本在线观看| 日韩一卡2卡3卡4卡新区亚洲| 人人妻人人玩人人澡人人爽 | 最新国产精品精品视频| 色偷偷偷在线视频播放| 欧美人妻体内射射| 天堂网在线最新版www| 中文字幕人妻丝袜乱一区三区| 国产精品未满十八禁止观看| 精品无码久久久久国产| 人人妻人人爽人人爽| 国产成熟女人性满足视频| 国产极品粉嫩泬免费观看| 色欲av无码无在线观看| 色婷婷亚洲婷婷7月| 在线精品亚洲第一区焦香| 特级欧美插插插插插bbbbb| 顶级欧美做受xxx000| 精品视频一区二区三三区四区| 豆国产93在线 | 亚洲| 激情爆乳一区二区三区|