• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    業(yè)界 正文
    發(fā)私信給付靜
    發(fā)送

    0

    騰訊的 AI 進化了!王者榮耀「絕悟」升級,全英雄池解禁

    本文作者: 付靜 2020-11-28 17:29
    導語:這一升級的背后,是騰訊策略協(xié)作型 AI 算法能力的進一步提升。

    AI 王者「絕悟」升級了,能達到精通金庸武俠里所有武功的那種水平。

    今天,騰訊宣布,由騰訊 AI Lab 與王者榮耀聯(lián)合研發(fā)的策略協(xié)作型 AI「絕悟」推出升級版本“絕悟完全體”。

    這一升級的背后,則是騰訊策略協(xié)作型 AI 算法能力的進一步提升,與之相關的研究也已被 AI 頂級會議 NeurIPS 2020 與頂級期刊 TNNLS 收錄。

    騰訊的 AI 進化了!王者榮耀「絕悟」升級,全英雄池解禁

    英雄池完全解禁

    在王者榮耀中,若每個職業(yè)都有 4 個紫色熟練度英雄,就能解鎖“全能高手”稱號。但受到練習時間與精力限制,很少有人能精通所有英雄,但「絕悟」做到了。

    那么,王者再進化,將有多強?

    據了解,「絕悟」一年內掌握的英雄數從 1 增加到 100+,王者榮耀英雄池也實現了完全解禁,不但掌握了所有英雄的全部技能,能應對高達 10 的 15 次方的英雄組合數變化,甚至還“自帶軍師”,可做出最佳的英雄博弈策略選擇,綜合自身技能與對手情況等多重因素,派出最優(yōu)英雄組合。

    騰訊的 AI 進化了!王者榮耀「絕悟」升級,全英雄池解禁

    目前,“絕悟完全體”已在王者榮耀 App 限時開放,玩家都可與之對戰(zhàn),親身體驗 AI 在復雜策略、團隊協(xié)作與微觀操作方面的強大能力。

    11 月 14-30 日,「絕悟」在 20 個關卡的能力將不斷提升,最強的 20 級于 11 月 28 日開放,接受 5v5 組隊挑戰(zhàn)。

    AI 教練的田忌賽馬術

    AI+游戲研究,是騰訊攻克 AI 的終極研究難題,也是通用人工智能(AGI)的關鍵一步。

    騰訊技術團隊的長期目標不僅是讓“絕悟”學會所有英雄的技能,而且每個英雄都要達到頂尖水平,可以根據陣型排列組合打出制勝局。

    但難點就在于,「絕悟」的不同英雄會共享一個模型參數,從零學會單個陣容易如反掌,但面對多英雄組合時就難如登天。對戰(zhàn)中,因為地圖龐大且信息不完備,不同的 10 個英雄組合有不同的策略規(guī)劃、技能應用、路徑探索及團隊協(xié)作方式,這將使決策難度幾何級增加。

    同時不可忽略的是“災難性遺忘”問題,模型容易邊學邊忘,這也長期困擾著開發(fā)者。

    畢竟,一場比賽勝負的關鍵不僅在于擁有頂尖選手,排兵布陣的教練也非常重要。

    基于此,技術團隊為「絕悟」找了一個能排兵布陣的 AI 教練,也就是在游戲 BP 環(huán)節(jié)(禁選英雄)的最優(yōu)策略。

    騰訊的 AI 進化了!王者榮耀「絕悟」升級,全英雄池解禁

    【絕悟 vs 人類 BP 測試】

    受到圍棋 AI 算法的啟發(fā),研究團隊創(chuàng)新地采用了蒙特卡洛樹搜索(MCTS)和神經網絡結合的自動 BP 模型,能夠又快又準地選出具備最大長期價值的英雄。

    具體來講,先采用引入“老師分身”模型,每個 AI 老師在單個陣容上訓練至精通,再引入一個 AI 學生模仿學習所有的 AI 老師。

    最終,「絕悟」掌握了所有英雄的全部技能,正所謂“少林有七十二藝,功夫既有不同,練習之法,亦必各異。學者茍能盡之,則無敵于世矣。”

    「絕悟」手握強兵善用兵

    自然,團隊的長期目標,就是要讓「絕悟」手握強兵,且每個英雄都能達到頂尖水平,因此技術上有了三項重點突破:

    首先,團隊構建了一個最佳神經網絡模型,讓模型適配 MOBA 類任務、表達能力強、還能對英雄操作精細建模。

    模型綜合了大量 AI 方法的優(yōu)勢,如:

    • 在時序信息上引入長短時記憶網絡(LSTM)優(yōu)化部分可觀測問題;

    • 在圖像信息上選擇卷積神經網絡(CNN)編碼空間特征;

    • 用注意力(Attention)方法強化目標選擇;

    • 用動作過濾(Action Mask)方法提升探索效率;

    • 用分層動作設計加快訓練速度;

    • 用多頭值估計(Multi-Head Value)方法降低估計方差。

    騰訊的 AI 進化了!王者榮耀「絕悟」升級,全英雄池解禁

    其次,團隊研究出了拓寬英雄池,讓「絕悟」掌握所有英雄技能的訓練方法——CSPL(Curriculum Self-Play Learning,課程自對弈學習)。

    根據下圖可以看出,使用 CSPL 方法擴展英雄池有明顯優(yōu)勢。

    騰訊的 AI 進化了!王者榮耀「絕悟」升級,全英雄池解禁

    據悉,這是一種讓 AI 從易到難的漸進式學習方法——第一步是挑選多組覆蓋全部英雄池的陣容,在小模型下用強化學習訓練;第二步是蒸餾,把第一步得到的多個模型的能力遷移到同一個大模型中;第三步是隨機陣容的強化訓練,在蒸餾后的大模型里,隨機挑選陣容繼續(xù)強化訓練和微調。

    騰訊的 AI 進化了!王者榮耀「絕悟」升級,全英雄池解禁

    最后,團隊搭建了大規(guī)模訓練平臺騰訊開悟(aiarena.tencent.com),依托項目積累的算法經驗、脫敏數據及騰訊云的算力資源,為訓練所需的大規(guī)模運算保駕護航。

    2020 年 8 月,開悟平臺對 18 所高校開放,未來希望為更多科研人員提供技術與資源支持,深化課題研究。

    早在 2018 年 12 月的 KPL 秋季總決賽中,「絕悟」就曾公開亮相對戰(zhàn)人類玩家。

    當時,團隊研發(fā)了監(jiān)督學習(SL)方法,針對大局觀和微操策略同時建模,使得「絕悟」同時擁有優(yōu)秀的長期規(guī)劃和即時操作,達到了非職業(yè)玩家的頂尖水平。

    騰訊的 AI 進化了!王者榮耀「絕悟」升級,全英雄池解禁

    但其實,團隊對于監(jiān)督學習的研發(fā)一直在進行——今年 11 月 14 日起開放的絕悟第 1 到 19 級,就有多個關卡由監(jiān)督學習訓練而成。

    理論上,監(jiān)督學習訓練出的 AI 表現遜于強化學習的結果,但這一方向極具研究與應用價值,相關成果也入選了頂刊 TNNLS 。

    騰訊的 AI 進化了!王者榮耀「絕悟」升級,全英雄池解禁

    如今,「絕悟」前有強兵,后有軍師,不折不扣的一代宗師終于練成了。

    雷鋒網雷鋒網雷鋒網

    雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知

    分享:
    相關文章

    編輯

    關注前沿科技。
    當月熱門文章
    最新文章
    請?zhí)顚懮暾埲速Y料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說
    主站蜘蛛池模板: Jizz国产一区二区| 国产精一品亚洲二区在线播放| 国产精品无码免费播放| 亚洲人成色77777在线观看| 亚洲αⅴ无码乱码在线观看性色| 国产精品第七页| 无码人妻a?v| 少妇伦子伦精品无码styles| 无码小电影在线观看网站免费| 欧美人成精品网站播放| 中文字幕人妻中出制服诱惑| 亚洲线精品一区二区三区影音先锋| 国产精品成人久久电影| 亚洲色大成网站www永久一区 | 福利姬视频在线观看| 免费无遮挡无码永久视频| 国产成人综合在线观看不卡| 国产成人av综合色| 亚洲欧美日韩中文字幕一区二区| 综合偷自拍亚洲乱中文字幕| 午夜福利影院不卡影院| 亚洲国产精品免费一区| 国产日韩一区二区三区在线观看| 成熟女人特级毛片www免费| 久久热这里只有精品国产| 98在线视频噜噜噜国产| 日韩中文无码av超清| 国产精品线在线精品国语| 国产精品视频久久久| 醴陵市| 久久免费视亚洲无码视频| 国产福利深夜在线观看| 国产精品18| 精品综合久久久久久97| 国内精品久久久久久| 色翁荡熄又大又硬又粗又视频| 国产精品成人午夜久久| 亚洲AV成人无码一二三在线观看| 久久精品国产亚洲AV麻豆长发| 丁香五月天激情| 日韩精品区一区二区三vr|