• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
    此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
    人工智能 正文
    發(fā)私信給AI研習(xí)社-譯站
    發(fā)送

    1

    ICRA 2018 | 強(qiáng)化學(xué)習(xí)模擬水下穩(wěn)定性,潛水體15分鐘學(xué)會(huì)規(guī)則

    導(dǎo)語(yǔ):本論文中,我們將要學(xué)習(xí)基于模型值函數(shù)的強(qiáng)化學(xué)習(xí)方法。


    雷鋒網(wǎng)按:這里是,雷鋒字幕組編譯的 ICRA 2018 系列,帶你了解機(jī)器人與自動(dòng)化領(lǐng)域的最新研究成果。

    原標(biāo)題 :Reinforcement Learning of Depth Stabilization with a Micro Diving Agent

    翻譯 | 張哥華    整理 | 凡江

    強(qiáng)化學(xué)習(xí)是機(jī)器人在與環(huán)境交互中解決控制問(wèn)題的方法。本論文中,我們將要學(xué)習(xí)基于模型值函數(shù)的強(qiáng)化學(xué)習(xí)方法,這種方法適用于部分機(jī)器人和光嵌入式系統(tǒng)。

    ICRA 2018 | 強(qiáng)化學(xué)習(xí)模擬水下穩(wěn)定性,潛水體15分鐘學(xué)會(huì)規(guī)則

    一開(kāi)始,我們?cè)O(shè)計(jì)了一個(gè)潛水體,它利用強(qiáng)化學(xué)習(xí)來(lái)模擬水下的穩(wěn)定性。我們還利用試驗(yàn)來(lái)展示了一個(gè)小的潛水體對(duì)任務(wù)的學(xué)習(xí)能力,我們將這個(gè)潛水體設(shè)置成——它的狀態(tài)被取決于它的深度和速度。

    潛水體包含一個(gè)固定容量的的儲(chǔ)水倉(cāng)和一個(gè)可變?nèi)萘康膬?chǔ)水倉(cāng),后者用于驅(qū)動(dòng)本體。

    我們對(duì)其深度的穩(wěn)定性的目標(biāo)是,控制其可變儲(chǔ)水容量以維持一個(gè)期望的深度。通過(guò)強(qiáng)化學(xué)習(xí)方法來(lái)解決這個(gè)控制問(wèn)題,而不需要有系統(tǒng)先驗(yàn)知識(shí)或者是有驅(qū)動(dòng)器動(dòng)力知識(shí)。這種方法的挑戰(zhàn)在于未知的流體效應(yīng),以及緩慢的非線(xiàn)性變化的驅(qū)動(dòng)器動(dòng)力。體積調(diào)整的時(shí)間常數(shù)與系統(tǒng)的動(dòng)力匹配,可變?nèi)萘績(jī)?chǔ)水倉(cāng)相對(duì)于固定容量?jī)?chǔ)水倉(cāng)也是很小的,所以系統(tǒng)的最大控制力和最大約束力也是很小的。

    ICRA 2018 | 強(qiáng)化學(xué)習(xí)模擬水下穩(wěn)定性,潛水體15分鐘學(xué)會(huì)規(guī)則

    在狀態(tài)空間中包含了潛水體的深度和速度,這個(gè)圖表就展示了其狀態(tài)空間,在目標(biāo)深度附近的區(qū)域決定了算法學(xué)習(xí)的區(qū)域,在這個(gè)分布里包含了 101 個(gè)狀態(tài)。在此區(qū)域之外的每一個(gè)點(diǎn)都被當(dāng)做是終止?fàn)顟B(tài)。

    動(dòng)作空間包含了兩部分:一部分是減少可變儲(chǔ)水倉(cāng)的水量來(lái)提供浮力,另一部分增加可變儲(chǔ)水倉(cāng)的水量,來(lái)讓潛水體算法收到一個(gè)損失,這個(gè)損失會(huì)懲罰潛水體,讓其向期望的深度移動(dòng)。除此之外,如果潛水體到達(dá)終止?fàn)顟B(tài)的位置,為了通過(guò)試驗(yàn)驗(yàn)證強(qiáng)化學(xué)習(xí)算法,一個(gè)小潛水體被設(shè)計(jì)和制造了出來(lái)。它的運(yùn)行時(shí)間大約是 90 分鐘,非易失性?xún)?nèi)存是 512 KB。

    ICRA 2018 | 強(qiáng)化學(xué)習(xí)模擬水下穩(wěn)定性,潛水體15分鐘學(xué)會(huì)規(guī)則

    我們證明了在一個(gè)試驗(yàn)中,潛水體是能夠從零學(xué)習(xí)到關(guān)于自身穩(wěn)定性的規(guī)則。在左下角的圖表中顯示了潛水體在學(xué)習(xí)區(qū)域成功學(xué)習(xí)的運(yùn)動(dòng)軌跡。

    ICRA 2018 | 強(qiáng)化學(xué)習(xí)模擬水下穩(wěn)定性,潛水體15分鐘學(xué)會(huì)規(guī)則

    視頻鏈接:https://www.youtube.com/watch?v=F7g3K0PXWX4&t=5s

    ICRA 2018 | 強(qiáng)化學(xué)習(xí)模擬水下穩(wěn)定性,潛水體15分鐘學(xué)會(huì)規(guī)則

    雷鋒網(wǎng)雷鋒網(wǎng)

    雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知

    ICRA 2018 | 強(qiáng)化學(xué)習(xí)模擬水下穩(wěn)定性,潛水體15分鐘學(xué)會(huì)規(guī)則

    分享:
    相關(guān)文章

    知情人士

    AI研習(xí)社(yanxishe.com)譯站頻道,傳播前沿人工智能知識(shí),讓語(yǔ)言不再成為學(xué)習(xí)知識(shí)的門(mén)檻。(原雷鋒字幕組)
    當(dāng)月熱門(mén)文章
    最新文章
    請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
    姓名
    電話(huà)
    郵箱
    微信號(hào)
    作品鏈接
    個(gè)人簡(jiǎn)介
    為了您的賬戶(hù)安全,請(qǐng)驗(yàn)證郵箱
    您的郵箱還未驗(yàn)證,完成可獲20積分喲!
    請(qǐng)驗(yàn)證您的郵箱
    立即驗(yàn)證
    完善賬號(hào)信息
    您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
    立即設(shè)置 以后再說(shuō)
    主站蜘蛛池模板: 丁香五月天导航| 亚洲第一视频区| 91亚洲色图| 日韩狼人精品在线观看| 97精品超碰一区二区三区| 国产精品_国产精品_国产精品 | 成年女人喷潮免费视频| 亚洲欧美人妖另类激情综合区 | 日本无码中文| 精品人妻一区| 日韩精品无码不卡无码| 国产激情第一区二区三区| 国产二区三区不卡免费| 无码人妻一区二区三区四区AV| 国产成人a∨| WWW夜插内射视频网站| 亚洲欧洲日韩精品在线| 免费人成在线观看成人片| 1区2区3区4区产品不卡码网站 | 内射中出无码护士在线| 国产色青青视频在线观看撒| 亚洲人成网站在线观看播放不卡| 大屁股国产白浆一二区| 日韩av在线一区二区三区| 狠狠躁夜夜躁人人爽蜜桃| 黄龙县| 先锋影音最新色资源站| 狠狠综合| 亚洲国产欧美在线人成AAAA| 婷婷久香综合在线| 国产又色又爽又刺激在线观看| 中文字寞人妻中出| 久久无码人妻热线精品| 久久狼人大香伊蕉国产| 国产人与禽zoz0性伦多活几年| 欧美搡bbbbb搡bbbbb| 黑人无码视频| 成年无码av片在线| 国产精品xx| 欧美性爱视频免费观看| 人妻精品久久久久中文字幕青草|