• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
    此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
    人工智能 正文
    發(fā)私信給高云河
    發(fā)送

    0

    看一遍人類(lèi)動(dòng)作就能模仿,能理解語(yǔ)義的谷歌機(jī)器人登上無(wú)監(jiān)督學(xué)習(xí)的新高度

    本文作者: 高云河 編輯:楊曉凡 2017-07-22 21:13
    導(dǎo)語(yǔ):谷歌期望通過(guò)教會(huì)機(jī)器人理解語(yǔ)義概念,以使得機(jī)器人能夠從人類(lèi)的示范中學(xué)習(xí)動(dòng)作,以及理解物體的語(yǔ)義概念,完成抓取動(dòng)作。

    雷鋒網(wǎng) AI 科技評(píng)論按:機(jī)器學(xué)習(xí)能讓機(jī)器人學(xué)會(huì)復(fù)雜的技能,例如抓住把手打開(kāi)門(mén)。然而學(xué)習(xí)這些技能需要先人工編寫(xiě)一個(gè)獎(jiǎng)勵(lì)函數(shù),然后才能讓機(jī)器人開(kāi)始優(yōu)化它。相比之下,人類(lèi)可以通過(guò)觀察別人的做法來(lái)理解任務(wù)的目標(biāo),或者只是被告知目標(biāo)是什么,就可以完成任務(wù)。目前,谷歌期望通過(guò)教會(huì)機(jī)器人理解語(yǔ)義概念,以使得機(jī)器人能夠從人類(lèi)的示范中學(xué)習(xí)動(dòng)作,以及理解物體的語(yǔ)義概念,完成抓取動(dòng)作。

    以下為雷鋒網(wǎng) AI 科技評(píng)論編譯的這篇谷歌博客的部分內(nèi)容。

    問(wèn)題的引入

    人類(lèi)與機(jī)器人不同,我們不需要編寫(xiě)目標(biāo)函數(shù)即可以完成許多復(fù)雜的任務(wù)。我們可以這樣做,是因?yàn)槲覀兝昧俗约簩?duì)世界先驗(yàn)知識(shí):當(dāng)我們看到有人切蘋(píng)果時(shí),我們明白,目標(biāo)是切出兩個(gè)蘋(píng)果片,不管它是什么類(lèi)型的蘋(píng)果,還是用什么樣的工具來(lái)切蘋(píng)果。同樣,如果我們被告知拿起蘋(píng)果,我們明白我們要抓住特定的物體“蘋(píng)果”,而不是梨或者桃子,因?yàn)槲覀兛梢栽诃h(huán)境中理解“蘋(píng)果”這個(gè)詞:我們知道這個(gè)詞的意思。

    這些就是語(yǔ)義概念:例如切兩個(gè)蘋(píng)果切片為顯著事件,而“蘋(píng)果”這樣的詞就表示的物體類(lèi)別。那么我們可以教導(dǎo)機(jī)器人來(lái)了解語(yǔ)義概念,讓它們通過(guò)物體類(lèi)別標(biāo)簽或用戶提供的示例來(lái)實(shí)現(xiàn)簡(jiǎn)單命令嗎?在這篇文章中,谷歌的研究者討論了他們最近關(guān)于機(jī)器人學(xué)習(xí)的一些工作,它們結(jié)合了機(jī)器人自主收集的經(jīng)驗(yàn)和人工標(biāo)注的數(shù)據(jù),其中機(jī)器人的自主收集的數(shù)據(jù)很豐富,但缺乏人工提供的標(biāo)注,而人工標(biāo)注的數(shù)據(jù)能使機(jī)器人更好地理解語(yǔ)義。同時(shí)本文也描述了機(jī)器人如何使用它們的經(jīng)驗(yàn)來(lái)理解人工示范中的顯著事件,并且理解諸如“玩具”和“筆”之類(lèi)的語(yǔ)義類(lèi)別,以基于用戶命令拾取物體。

    通過(guò)深度視覺(jué)特征理解人類(lèi)示范

    在第一組實(shí)驗(yàn)中,研究者介紹了他們這篇論文中的內(nèi)容:「Unsupervised Perceptual Rewards for Imitation Learning」。目標(biāo)是使機(jī)器人能夠在只看到少量未標(biāo)注的人類(lèi)演示的情況下,理解一個(gè)任務(wù),比如打開(kāi)一扇門(mén)。通過(guò)分析這些演示,機(jī)器人必須理解執(zhí)行哪些語(yǔ)義方面顯著的事件能夠使任務(wù)成功,然后使用強(qiáng)化學(xué)習(xí)來(lái)執(zhí)行這些顯著事件。

    看一遍人類(lèi)動(dòng)作就能模仿,能理解語(yǔ)義的谷歌機(jī)器人登上無(wú)監(jiān)督學(xué)習(xí)的新高度

    左圖:人類(lèi)演示    右圖:相應(yīng)的機(jī)器人模擬

    在非常小的數(shù)據(jù)集上使用無(wú)監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)中最具挑戰(zhàn)性的場(chǎng)景之一。為了使該方法可行,研究者使用了從ImageNet上進(jìn)行圖像識(shí)別訓(xùn)練的大型網(wǎng)絡(luò)的深度視覺(jué)特征。這種深度視覺(jué)特征對(duì)于語(yǔ)義概念是敏感的,能夠很好的提取語(yǔ)義概念,同時(shí)防止諸如外觀和照明等變量的干擾。研究者使用這些功能來(lái)解釋用戶提供的演示,結(jié)果顯示從幾個(gè)演示中就可以以無(wú)監(jiān)督的方式學(xué)習(xí)到獎(jiǎng)勵(lì)函數(shù),而無(wú)需額外訓(xùn)練。

     看一遍人類(lèi)動(dòng)作就能模仿,能理解語(yǔ)義的谷歌機(jī)器人登上無(wú)監(jiān)督學(xué)習(xí)的新高度

    在從觀察中學(xué)習(xí)到獎(jiǎng)勵(lì)函數(shù)之后,研究者用它來(lái)引導(dǎo)機(jī)器人學(xué)習(xí)開(kāi)門(mén)任務(wù),只使用圖像來(lái)評(píng)估獎(jiǎng)勵(lì)函數(shù)。借助初始的動(dòng)作演示,機(jī)器人有10%的時(shí)間能夠成功完成開(kāi)門(mén)動(dòng)作,而在機(jī)器人使用學(xué)習(xí)到的獎(jiǎng)勵(lì)函數(shù)繼續(xù)學(xué)習(xí)之后,準(zhǔn)確率則能夠提高到100%。

     看一遍人類(lèi)動(dòng)作就能模仿,能理解語(yǔ)義的谷歌機(jī)器人登上無(wú)監(jiān)督學(xué)習(xí)的新高度

    學(xué)習(xí)過(guò)程

    通過(guò)自我監(jiān)督和模仿來(lái)模仿人的動(dòng)作

    在「Time-Contrastive Networks: Self-Supervised Learning from Multi-View Observation」這篇論文中,谷歌的研究者提出了一種從觀察中學(xué)習(xí)世界的新穎方法,并通過(guò)自我監(jiān)督的姿態(tài)模擬實(shí)驗(yàn)證明了該方法的可行性。該方法主要依靠的時(shí)間和空間的同時(shí)性進(jìn)行監(jiān)督:通過(guò)訓(xùn)練區(qū)分視頻不同時(shí)期的幀,該方法學(xué)會(huì)將現(xiàn)實(shí)分解和組織成有用的抽象表示。

    在例如姿態(tài)模擬的任務(wù)中,抽象表示的不同維度可能編碼了人或機(jī)器人身體的不同關(guān)節(jié)。研究者并沒(méi)有手動(dòng)定義人與機(jī)器人關(guān)節(jié)之間的映射(這種映射通常由于人和機(jī)器人的生理差異而模糊不清),而是讓機(jī)器人以端到端的方式進(jìn)行模仿學(xué)習(xí)。當(dāng)模型同時(shí)接受人和機(jī)器人觀察的訓(xùn)練時(shí),即使沒(méi)有提供任何人與機(jī)器人的對(duì)應(yīng)關(guān)系,模型也可以自然地發(fā)現(xiàn)兩者之間的對(duì)應(yīng)關(guān)系。因此,該方法可以得到一種機(jī)器人,無(wú)需人與機(jī)器人之間的對(duì)應(yīng)關(guān)系,即可模仿人的姿勢(shì)。

    看一遍人類(lèi)動(dòng)作就能模仿,能理解語(yǔ)義的谷歌機(jī)器人登上無(wú)監(jiān)督學(xué)習(xí)的新高度

    機(jī)器人的自監(jiān)督人類(lèi)動(dòng)作模擬

    上面展示的多對(duì)一和高度非線性關(guān)節(jié)映射是端到端學(xué)習(xí)有點(diǎn)的有力證明。在這個(gè)例子中,人的上下運(yùn)動(dòng)涉及許多關(guān)節(jié),而機(jī)器人只需要一個(gè)關(guān)節(jié)。結(jié)果顯示機(jī)器人并沒(méi)有使用任何明確的人類(lèi)姿態(tài)信息,本身就發(fā)現(xiàn)了這種高度復(fù)雜的映射

    通過(guò)物體語(yǔ)義類(lèi)別進(jìn)行抓取

    上面的實(shí)驗(yàn)展示了人類(lèi)如何通過(guò)演示來(lái)制定機(jī)器人的目標(biāo),在這種情況下,機(jī)器人必須解釋任務(wù)的語(yǔ)義:顯著事件和姿勢(shì)的相關(guān)特征。如果不向機(jī)器人展示任務(wù)來(lái)制定目標(biāo),而是只是通過(guò)告訴機(jī)器人要做什么來(lái)制定目標(biāo),這該怎么辦呢?這就需要機(jī)器人理解語(yǔ)義,以便識(shí)別世界中哪些物體與用戶指定的語(yǔ)義類(lèi)別相對(duì)應(yīng)。在End-to-End Learning of Semantic Grasping這篇文章中,谷歌的研究者研究了人類(lèi)手工標(biāo)注的數(shù)據(jù)和機(jī)器人自動(dòng)收集的數(shù)據(jù)的組合如何用于執(zhí)行語(yǔ)義抓取的任務(wù),機(jī)器人必須從與箱子中拾取用戶指定物體,例如“橡皮擦”或“玩具”。

    看一遍人類(lèi)動(dòng)作就能模仿,能理解語(yǔ)義的谷歌機(jī)器人登上無(wú)監(jiān)督學(xué)習(xí)的新高度

    為了學(xué)習(xí)如何執(zhí)行語(yǔ)義抓取,機(jī)器人首先通過(guò)自主地嘗試拾取各種各樣的物體,收集一個(gè)大量的抓取數(shù)據(jù)集。該數(shù)據(jù)本身可以使機(jī)器人拾取物體,但并不能使機(jī)器人理解如何將物體與其語(yǔ)義標(biāo)簽相關(guān)聯(lián)。為了能夠理解語(yǔ)義,研究者再次使用了適度的人工監(jiān)督。每次機(jī)器人成功抓住一個(gè)物體,機(jī)器人會(huì)對(duì)該物體進(jìn)行拍照,如下圖所示。

    看一遍人類(lèi)動(dòng)作就能模仿,能理解語(yǔ)義的谷歌機(jī)器人登上無(wú)監(jiān)督學(xué)習(xí)的新高度

    然后,這些圖像的中的一部分由人工進(jìn)行標(biāo)注。由于呈現(xiàn)的圖像展示了物體在抓取姿態(tài)下的標(biāo)準(zhǔn)外觀,因此很容易通過(guò)在標(biāo)注的圖片上訓(xùn)練分類(lèi)器,將這些標(biāo)簽傳遞給剩余的未標(biāo)注的圖像。然后標(biāo)注過(guò)的表示圖像即可以告訴機(jī)器人實(shí)際拾取了哪個(gè)物體。在此后機(jī)器人從箱子拾取物體時(shí),可以將抓取時(shí)觀察到的圖像與標(biāo)簽聯(lián)系到一起。

    使用這個(gè)標(biāo)記的數(shù)據(jù)集,谷歌的研究者訓(xùn)練了一個(gè)雙流模型,該模型以當(dāng)前獲得的圖像和機(jī)器人將要采取的動(dòng)作為條件,預(yù)測(cè)應(yīng)該抓取哪個(gè)物體。研究者采用的雙流模型靈感來(lái)源于人類(lèi)視覺(jué)皮層中觀察到的dorsal-ventral分解,其中ventral流負(fù)責(zé)推理物體語(yǔ)義類(lèi)別,而dorsal流負(fù)責(zé)推理抓取的幾何結(jié)構(gòu)。關(guān)鍵的是,ventral流可以包含由物體(不一定來(lái)自機(jī)器人)的標(biāo)記圖像組成的輔助數(shù)據(jù),而dorsal流可以包含不具有語(yǔ)義標(biāo)簽的輔助數(shù)據(jù),從而允許整個(gè)系統(tǒng)更有效地使用更大量的不同類(lèi)別的標(biāo)簽數(shù)據(jù)。以這種方式,可以將有限數(shù)量的人工標(biāo)記與大量自動(dòng)收集的機(jī)器人數(shù)據(jù)結(jié)合在一起,以便根據(jù)所需的語(yǔ)義類(lèi)別來(lái)抓取對(duì)象,如下面的視頻所示:

    https://youtu.be/WR5WUKXUQ8U

    未來(lái)的工作:

    實(shí)驗(yàn)顯示了有限的人工標(biāo)注語(yǔ)義標(biāo)簽數(shù)據(jù)可以與由機(jī)器人自動(dòng)收集和標(biāo)記的數(shù)據(jù)相結(jié)合,以使機(jī)器人能夠理解顯著事件,物體類(lèi)別以及用戶的演示。將來(lái),機(jī)器人系統(tǒng)可以通過(guò)用戶標(biāo)注的數(shù)據(jù)和不斷增加自主收集的數(shù)據(jù)集的組合進(jìn)行訓(xùn)練,提高機(jī)器人能力,并減輕設(shè)計(jì)自主機(jī)器人的工程負(fù)擔(dān)。此外,隨著機(jī)器人系統(tǒng)在現(xiàn)實(shí)世界中收集越來(lái)越多的自動(dòng)標(biāo)記的數(shù)據(jù),該數(shù)據(jù)不僅可以用于改進(jìn)機(jī)器人系統(tǒng),還可以用于改進(jìn)計(jì)算機(jī)視覺(jué),語(yǔ)音識(shí)別和自然語(yǔ)言處理系統(tǒng)等其他系統(tǒng),這些系統(tǒng)都可以從這樣大的輔助數(shù)據(jù)中得到改進(jìn)。

    當(dāng)然,這并不是研究者們第一次考慮機(jī)器人語(yǔ)義學(xué)。自然語(yǔ)言理解,機(jī)器人感知,抓取和模仿學(xué)習(xí)等的廣泛研究工作已經(jīng)考慮了如何在機(jī)器人系統(tǒng)中結(jié)合語(yǔ)義和行為,然而,谷歌的研究者在上面討論的這些實(shí)驗(yàn)可能指向未來(lái)在自主機(jī)器人系統(tǒng)結(jié)合自我監(jiān)督和人工標(biāo)注數(shù)據(jù)進(jìn)行工作的一個(gè)可行方向。

    致謝:本文中的實(shí)驗(yàn)由下列人員進(jìn)行Pierre Sermanet, Kelvin Xu, Corey Lynch, Jasmine Hsu, Eric Jang, Sudheendra Vijayanarasimhan, Peter Pastor, Julian Ibarz, 以及 Sergey Levine。同時(shí)也感謝Mrinal Kalakrishnan, Ali Yahya, and Yevgen Chebotar 在開(kāi)門(mén)任務(wù)中開(kāi)發(fā)的學(xué)習(xí)框架,以及 John-Michael Burke在語(yǔ)義抓取實(shí)驗(yàn)中進(jìn)行的實(shí)驗(yàn)設(shè)計(jì)。


    想要進(jìn)一步了解的讀者可以閱讀原文:Google Blog,或者閱讀文中所提到的論文:

    Unsupervised Perceptual Rewards for Imitation Learning

    Time-Contrastive Networks: Self-supervised Learning from Multi-View Observation

    更多人工智能學(xué)術(shù)新聞、近期 各大學(xué)術(shù)會(huì)議全方位報(bào)道,請(qǐng)繼續(xù)關(guān)注 雷鋒網(wǎng) AI 科技評(píng)論。

    看一遍人類(lèi)動(dòng)作就能模仿,能理解語(yǔ)義的谷歌機(jī)器人登上無(wú)監(jiān)督學(xué)習(xí)的新高度

    分享:
    相關(guān)文章
    當(dāng)月熱門(mén)文章
    最新文章
    請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
    姓名
    電話
    郵箱
    微信號(hào)
    作品鏈接
    個(gè)人簡(jiǎn)介
    為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
    您的郵箱還未驗(yàn)證,完成可獲20積分喲!
    請(qǐng)驗(yàn)證您的郵箱
    立即驗(yàn)證
    完善賬號(hào)信息
    您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
    立即設(shè)置 以后再說(shuō)
    主站蜘蛛池模板: 日韩丨亚洲丨制服|痴汉| 精品国产乱码久久久久乱码| 91精品久久久无码中文字幕少妇| 99久久精品美女高潮喷水| 成人年无码av片在线观看| aa中文化产品产二区在线| 国精品无码一区二区三区在线蜜臀| 亚洲精品一区二区二三区| 免费不卡一区二区av| 国产老女人精品免费视频| 成人免费午夜性大片| 国产精品午夜福利免费看| 国内性爱短视频精选不卡| 欧亚激情偷乱人伦小说专区| 精品无码av无码专区| 视频一区二区三区四区不卡| 亚洲成aⅴ人片久青草影院| 久久久久九九精品影院| 欧美freesex黑人又粗又大| 另类 专区 欧美 制服| www熟女com| 成全我在线观看免费第二季| 成年A级毛片免费观看秋霞| 99精品全国免费观看视频| 亚洲国产无套无码av电影| 无码少妇一区二区三区免费| 天堂av无码大芭蕉伊人av孕妇黑人| av免费网站| 在线免费观看毛片av| 99视频精品全部免费品| 精品无吗国产一区二区三区av| 午夜福利精品国产二区| 成人无码视频| 天天综合网永久入口| 国产成人精品午夜在线播放| 亚洲AV蜜桃永久无码精品 | 吉川爱美一区二区三区视频| 一区二区二区三区av| 欧美在线视频一区二区| 91精品国产一二三产区| 亚洲多毛视频|