0
| 本文作者: 晟煒 | 編輯:郭奕欣 | 2017-05-31 09:35 | 專題:ICRA 國際機器人與自動化會議 |
雷鋒網AI科技評論按:ICRA全稱為“IEEE International Conference on Robotics and Automation”(機器人與自動化會議),是機器人技術領域最有影響力的國際學術會議之一。ICRA 2017于5月29日至6月4日舉行,雷鋒網AI科技評論從新加坡帶來一線報道。該會議舉辦期間,雷鋒網將圍繞會議議程及獲獎論文展開系列專題報道,敬請期待。
認知機器人領域共有四篇入圍最佳論文,雷鋒網將做逐一介紹。
使用分數空間描述引導任務和運動規劃問題的研究
來自麻省理工大學的研究者,Kim, Beomjoon; Kaelbling, Leslie; Lozano-Perez, Tomas提出了一種算法來加速任務和運動規劃中的搜索速度。算法針對如何在學習中提高效率的三個不同的挑戰:預測什么?如何描述一個規劃任務實例?怎樣將知識從一個問題實例傳遞到另一個?我們提出了一種方法。它能基于對規劃問題實例的普遍描述,預測搜索空間的約束。這被叫做分數空間。用現有方法的性能來表示這些問題實例。使用這種描述方法,將知識從在分數空間中基于相似性的問題,以約束的形式進行傳遞。他們設計了一種序列算法,能高效地進行約束預測,并使用三個不同的具有挑戰性的任務和運動規劃問題進行了評估。結果顯示,與無引導規劃相比,他們的方法在速度上有了量級上的提高。
原文鏈接:http://lis.csail.mit.edu/pubs/kim-icra17.pdf
關于部分可觀察任務中力反饋表示的研究
觸覺是人類最早發展出來的感知系統。它在我們日常與環境交互過程中扮演重要的角色。為了成功完成一項任務,在操作過程中需要引入力反饋。然而,人工設計一個反饋機制極具挑戰。來自康奈爾大學的研究者,Sung, Jaeyong; Salisbury, Kenneth; Ashutosh Saxena設想一個操作任務需要引入觸覺傳感器反饋,以此來修正已有的規劃。對于部分可觀測任務,他們使用一個新的架構,任務模型是一個部分可觀測馬爾科夫決策過程(POMDP)。并將力反饋的適當表達作為POMDP模型中的狀態進行研究。模型使用循環神經網絡進行參數化,使用變分貝葉斯方法優化近似后驗。最后,他們建立深度Q學習來選擇每個狀態下的最優行動,而不使用仿真器。他們使用模型,在PR2機器人進行了多次旋動旋鈕直到到位的測試。
原文鏈接:https://arxiv.org/pdf/1705.06243.pdf
深度多模型嵌入:使用點云、語言和軌跡來操作新的對象
機器人需要根據各種感知形式,比如視覺,語言和運動軌跡才能在真實世界的環境里進行活動。但是,要通過人工設計的方式把這些分散的感知形式聯系起來是極具挑戰的。來自康奈爾大學的研究者,Sung, Jaeyong; Lenz, Ian; Ashutosh Saxena介紹了一種算法,學習如何將點云,自然語言和操作軌跡等數據通過深度神經網絡引入一個共享的嵌入空間。通過他們的網絡可以在語義上有意義的空間進行學習。他們使用基于損失的邊界將相關的對拉得更近,同時將相關性較低的放得更遠。他們同時使用兩者在較低層次進行預訓練,在最后的嵌入空間進行精調,從而實現更加動態的表達。他們使用這個算法執行操作新的對象和裝置的測試。測試中的經驗來自于之前在其他對象上的測試。在一個巨大的數據包中,相比于以前的技術,他們在精確性和運行時間上有了顯著的進步。他們也在PR2機器人上使用學習到的嵌入空間進行了端到端的試驗。
原文鏈接:https://arxiv.org/pdf/1509.07831.pdf
機器人運動規劃的深度視覺預見方法
提高機器人學習技能和環境能力的一個巨大挑戰是徹底放棄人類監督。這樣機器人可以在不受人類價值反饋的限制下收集它們需要的數據,并提高它們的性能。基于模型的強化學習方法有望使它具有預測自己行為結果的能力。它可以在沒有人類監督的情況下,針對各種任務和環境提供一個靈活的可預測模型。來自伯克利的兩位研究者,Finn, Chelsea; Levine, Sergey提出一種方法,它把以行動為條件的深度視覺運動模型和可預測模型控制結合起來,完全使用沒有經過標簽的訓練數據。他們的方法并不需要經過校準的相機,經過調試的訓練集,或者精確的感知和驅動。結果顯示,通過他們的方法可以讓機器人完成非抓取操作,推動對象。并且在訓練中可以在沒有看到對象的情況下操作新的對象。
原文鏈接:https://arxiv.org/pdf/1610.00696.pdf
相關視頻:https://wn.com/deep_visual_foresight_for_planning_robot_motion