• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
    此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
    人工智能 正文
    發(fā)私信給奕欣
    發(fā)送

    0

    OpenAI發(fā)布開源軟件Roboschool,模擬機(jī)器人的控制訓(xùn)練

    本文作者: 奕欣 2017-05-16 16:19
    導(dǎo)語:OpenAI 今日發(fā)布了一個(gè)用于模擬機(jī)器人的控制訓(xùn)練的開源軟件 Roboschool,根據(jù)介紹,其整合了前段時(shí)間發(fā)布的 OpenAI Gym。

    OpenAI發(fā)布開源軟件Roboschool,模擬機(jī)器人的控制訓(xùn)練

    雷鋒網(wǎng) AI 科技評論消息,OpenAI 今日發(fā)布了一個(gè)用于模擬機(jī)器人的控制訓(xùn)練的開源軟件 Roboschool,根據(jù)介紹,其整合了前段時(shí)間發(fā)布的 OpenAI Gym。

    OpenAI Gym 是一款研發(fā)與比較強(qiáng)化算法的工具包,此前用戶反饋的問題在于價(jià)格。雖然已經(jīng)向個(gè)人或有課程學(xué)習(xí)需要的學(xué)生免費(fèi)開放,但負(fù)責(zé)機(jī)器人控制的 MuJoCo 組件依然需要收費(fèi)。

    不過在基于 OpenAI Gym 環(huán)境的 Roboschool 里,用戶不必再擔(dān)心這一額外花費(fèi)。據(jù)雷鋒網(wǎng)了解,有八個(gè)模擬器可以作為 MoJoCo 組件的免費(fèi)替代品,還能進(jìn)行重新調(diào)試,以產(chǎn)生更多逼真的動(dòng)作。另外四個(gè)任務(wù)則提供了更具挑戰(zhàn)的任務(wù),比如類人直立行走的任務(wù),或是多玩家乒乓賽(multiplayer Pong)。

    這樣一來,Roboschool 得以讓用戶更方便地在同一個(gè)場景中同時(shí)訓(xùn)練多個(gè)智能體。OpenAI 表示,他們希望隨著時(shí)間推移,能夠獲得更多的集合拓展,此外也期待社區(qū)后續(xù)的產(chǎn)出貢獻(xiàn)。

    如視頻所示,你可以在 Roboschool 的界面上讓三個(gè)不同的機(jī)器人進(jìn)行跑步競賽。而在 agent_zoo/demo_race1.py. 上運(yùn)行此腳本時(shí),每次都會(huì)隨機(jī)出現(xiàn)不同的機(jī)器人

    OpenAI 團(tuán)隊(duì)已經(jīng)將 MuJoCo 上的一些模擬器移植到 Bullet 上,并做了逼真化的處理。下圖的三個(gè)模擬器都有了不同程度的改進(jìn)。比如 Walker2d 在緩慢走動(dòng)時(shí),細(xì)節(jié)更加真實(shí);而原有的螞蟻(Ant)變得更「重」了一些,這樣它就需要借助四條腿來前進(jìn);人類行走者甚至還借鑒了能量損耗原則(=轉(zhuǎn)矩×角速度),并以「跑偏」的形式顯現(xiàn)出來。

    OpenAI發(fā)布開源軟件Roboschool,模擬機(jī)器人的控制訓(xùn)練

    agent_zoo 文件夾中,你可以看到三個(gè)模擬器的不同訓(xùn)練原則;并在 demo_race 里找到他們?nèi)齻€(gè)的跑步比賽視頻 demoj 腳本

    此前的 OpenAI Gym 模擬器旨在掌握步行控制的要義,只需要學(xué)會(huì)簡單地前進(jìn)就夠了。但實(shí)際情況可能復(fù)雜許多,且有很多地方尚未被探索過,因此模擬器的單循環(huán)策略開始變得不管用, 可能輕輕推模擬器一把,都會(huì)讓機(jī)器人摔個(gè)狗啃泥而動(dòng)彈不得,更不要說完成任務(wù)了。

    為了解決這一問題,在全新的 Roboschool 中,OpenAI 的研究者設(shè)計(jì)了兩個(gè) 3D 類人的模擬器,而在訓(xùn)練任務(wù) HumanoidFlagrun 中,機(jī)器人需要朝著不斷變動(dòng)位置的旗子跑去,這一過程能夠訓(xùn)練機(jī)器人學(xué)會(huì)放緩速度并轉(zhuǎn)動(dòng)方向。

    而在「困難模式」的 HumanoidFlagrunHarder 中,機(jī)器人被賦予「跌倒」的權(quán)利,并嘗試用雙腿站起來。因此,任務(wù)的一開始,很可能機(jī)器人是躺在地上的。此外,機(jī)器人還要抵御不時(shí)的「攻擊」(見視頻),防止因?yàn)閬碜运拿姘朔皆襾淼男“讐K而摔倒。

    HumanoidFlagrunHumanoidFlagrunHarder 的訓(xùn)練策略也已經(jīng)在 GitHub 上開源。雖然機(jī)器人的步伐看上去并不那么快,形態(tài)也不像人般自然,但它所采取的策略已經(jīng)足以應(yīng)對非常多的狀況,也知道如何控制機(jī)器人。我們可以把這個(gè)策略當(dāng)作一個(gè)多層感知機(jī),甚于它沒有內(nèi)部狀態(tài),我們認(rèn)為,在某些情況下,智能體應(yīng)該是采用了自己的手臂存儲信息。

    就像雷鋒網(wǎng)在前文所提及的一樣,Roboschool 致力于讓用戶在同一模擬器上訓(xùn)練多個(gè)智能體,而 RoboschoolPong 就是一個(gè)很好的開始,與此同時(shí),還有一大波模擬器正在路上。

    通過「左右互博」的乒乓球賽,用戶得以在兩方同時(shí)訓(xùn)練同一個(gè)智能體,或是采用同樣的算法訓(xùn)練兩個(gè)不同的智能體,甚至,你也可以讓兩個(gè)獨(dú)立智能體自行訓(xùn)練(如下面視頻所示)。

    多智能體的設(shè)定也帶來了一些有意思的挑戰(zhàn)。如果你同時(shí)訓(xùn)練兩方玩家,你很可能會(huì)看到如下圖所示的曲線圖:

    OpenAI發(fā)布開源軟件Roboschool,模擬機(jī)器人的控制訓(xùn)練

    策略更新與策略梯度同時(shí)進(jìn)行

    將會(huì)呈現(xiàn)如下結(jié)果:

    • 智能體 1(綠線)學(xué)到在頂部可以成功回球,因此它經(jīng)常往頂部移動(dòng);

    • 智能體 2(紫線)發(fā)現(xiàn)對手經(jīng)常往頂部移動(dòng),因此會(huì)試著往底部回球;

    • 智能體 1 隨后也學(xué)會(huì)要往底部移動(dòng)才能成功回球,而且智能體 2 經(jīng)常往底部回球,因此它也經(jīng)常「駐守」底部了。

    經(jīng)歷這樣的循環(huán)后,策略開始震蕩,而經(jīng)歷了數(shù)小時(shí)的訓(xùn)練后,雙方都沒法再學(xué)到什么有用的內(nèi)容了。而在 GANs 中,在對抗性中進(jìn)行學(xué)習(xí)屢試不爽,而 OpenAI 團(tuán)隊(duì)的人認(rèn)為這是一個(gè)非常有意思的研究問題。即便是在簡單的環(huán)境中,雙方的交互也會(huì)產(chǎn)生復(fù)雜的策略,也能提供符合實(shí)際的借鑒。

    除了上文介紹的 Roboschool 外,OpenAI 團(tuán)隊(duì)也在 OpenAI Gym 中做了不少研究工作。詳情可以參考以下鏈接:

    Roboschool 的 GitHub 頁面:https://github.com/openai/roboschool

    OpenAI Gym 的 GitHub 頁面:https://github.com/openai/gym

    OpenAI發(fā)布開源軟件Roboschool,模擬機(jī)器人的控制訓(xùn)練

    分享:
    相關(guān)文章
    當(dāng)月熱門文章
    最新文章
    請?zhí)顚懮暾埲速Y料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個(gè)人簡介
    為了您的賬戶安全,請驗(yàn)證郵箱
    您的郵箱還未驗(yàn)證,完成可獲20積分喲!
    請驗(yàn)證您的郵箱
    立即驗(yàn)證
    完善賬號信息
    您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
    立即設(shè)置 以后再說
    主站蜘蛛池模板: 亚洲AV成人一区二区三区网站 | 精品亚洲没码中文字幕| 国产口爆| 免费无码一区无码东京热| 手机在线看永久AV片免费| 国产三级国产精品国产专| 不卡无码h在线观看| 欧美成人免费观看国产| 亚洲AV无码专区亚洲AV桃| 中国性欧美videofree精品| 9l国产精品久久久久尤物| 色欲色欲久久综合网| 亚洲精品中文av在线| 国产亚洲一区二区三区av| 国产人与zoxxxx另类| 加勒比HEZYO无码av| 永久免费观看美女裸体的网站| 亚洲欧美另类久久久精品播放的| 丰满人妻熟妇乱又伦精品视| 亚洲精品乱码久久久久久中文字幕| 久久久久无码精品国产h动漫| 日本亲近相奷中文字幕| 日韩精品久久久肉伦网站| 无码熟妇人妻AV在线影片免费 | 国产成人高清亚洲综合| 天天操夜夜撸| 真实国产老熟女无套中出| 欧美精品国产综合久久| 日本三级香港三级人妇99| 欧美自拍亚洲综合丝袜| 国产精品亚洲电影久久成人影院| 久热这里只有精品12| 一级做a爰片在线播放| 午夜宅男永久在线观看| 亚洲中文字幕无码av永久| 免费无码又爽又刺激高潮虎虎视频| 狠狠躁天天躁中文字幕无码| av网站可以直接看的| 久久av高潮av喷水av无码| 日韩精品av一区二区三区| 超碰aⅴ人人做人人爽欧美|