<sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"><tfoot id="pqc61"></tfoot></sub><sub id="pqc61"></sub>

在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码

<cite id="0w1vf"><label id="0w1vf"></label></cite>

<p id="0w1vf"></p>

^{<blockquote id="0w1vf"></blockquote>}

您正在使用IE低版瀏覽器，為了您的雷峰網賬號安全和更好的產品體驗，強烈建議使用更快更安全的瀏覽器

此為臨時鏈接，僅用于文章預覽，將在時失效

人工智能開發者正文

發私信給任平

發送

0

DeepMind的智能體成精了，還學會“發脾氣”了？

本文作者：任平

2021-08-10 16:01

導語：我們能離真正的通用人工智能還有多遠？

DeepMind又造“小人”了！

DeepMind的智能體成精了，還學會“發脾氣”了？

這群小人就是英國人工智能實驗室造出的“智能體”，不過只可以在游戲中看到。之前以4：1力挫世界圍棋冠軍李世石的阿爾法狗，就是這家實驗室訓練的智能體。

但你可能不知道的是，DeepMind”還訓練過“象棋棋手”、“足球球員”、”電競玩家“，甚至提出“人工生命"的言論。

DeepMind的智能體成精了，還學會“發脾氣”了？

最近的這群智能體，竟然能直接跳過數據填食，在開放式的任務環境中自我進化。

此前的阿爾法狗和阿爾法star，能力再強，也只能在各自的游戲里釋放大招，超出自己的游戲范圍立馬“歇菜”。而這批小人卻能在不同的游戲里游刃有余地完成任務，展現出超強的泛化能力。難道人工智能要邁出泛化“頑疾”了嗎？

在一個搶奪高地金字塔的任務里，兩個不同顏色的小人能力值相當。都沒有跳躍功能的它們，開始“發脾氣"亂扔東西。混亂中，竟把其中一塊板子”扔“成了樓梯，長驅直入，任務完成！

多次實驗發現，這些小人可以復現這種方法，難道這群智能體有了記憶？

不僅如此，小人還學會了“相對運動”--我上不去，你下來--借助板子直接把目標扒拉下來了! 甚至為了贏得比賽，多個小人學會了打配合，團體成長力刷刷上漲。

這種在虛擬游戲中自我進化的智能體，僅僅需要人為搭建一個任務環境，設計大量的任務目標，利用加強深度學習的方法，一步一步打通關，最終成為一個“十八般武藝”的智能體。

DeepMind的智能體成精了，還學會“發脾氣”了？

沒有樣本，沒有經驗，這些智能體究竟如何進化，零樣本學習方式是否意味著這些智能體已經具備了基本的“自學意識”？

社會達爾文主義的訓練場

相比之前做出的Ai足球場，這批智能體的訓練場更像一個游戲“社會”，里面有無數個游戲房間，每個房間的游戲按照競爭性、平衡性、可選性、探索難度四個緯度進行區分。

DeepMind的智能體成精了，還學會“發脾氣”了？

不管是哪種任務，這批智能體都只能從最簡單的開始，一步步解鎖更復雜的游戲，這也導致整個游戲更像一個虛擬社會。

這些無需大數據集訓練出來的智能體，每玩一次游戲就成長一次，在與各種環境的互動和“獎勵”中，成長為一個更通用的智能體，也更類似于人工“生命”。

能讓智能體自我進化的關鍵在于正確設計初始智能和進化規則。一開始是非常簡單的，所有的復雜結構都是進化而來。就像嬰兒做不了生孩子的事，布置任務的核心是不要超出智能體自身的改進能力。

根據 DeepMind的說法，每個AI智能體會在4000 個游戲房間中玩了大約 70萬個獨特的游戲，并在 340 萬個任務中經歷了 2000 億個訓練步驟。1 億個步驟相當于大約 30 分鐘的訓練。按照這種訓練方法，41天就能訓練出一群“成年”智能體。

它還是不會思考

DeepMind表示，“單個AI智能體可以開發智能來實現多個目標，而不僅僅是一個目標。”

AI智能體新科技公司Pathmind 的CEO Chris Nicholson 也說到，“它學到的技能可以舉一反三。例如，智能體學習抓取和操縱物體，就能完成敲錘子或者鋪床的任務。而DeepMind 正在用編程為AI智能體在這個世界上設定目標，而這些AI智能體正在學習如何一一掌握它們。”

但是南加州大學計算機科學副教授 Sathyanaraya Raghavachary表示，這些智能體并不能定義為“生命”，尤其是關于智能體擁有身體感覺、時間意識以及理解目標的幾個結論。

“即使是我們人類也沒有完全意識到我們的身體，更不用說那些人工智能了。”

他講到，一個活躍的身體對于大腦不可或缺，大腦要放在合適的身體意識和空間位置里進化。如果AI智能體能夠理解它們的任務，何必需要 2000 億步的模擬訓練來達到最佳結果。總體而言，這個虛擬環境訓練出來的AI智能體只是和以往的“大同小異”。

從理論到現實的路還很長

狹義的人工智能是“復制人類行為的元素”，在計算機中執行某種任務。例如實現對圖像進行分類、定位照片中的對象、定義對象之間的邊界等等。

這些系統旨在執行特定任務，而不具有解決問題的一般能力。

相比之下，Deepmind使用的“通用人工智能”有時也被稱為人類級別的人工智能，因為它可以理解上下文、潛臺詞和社會線索，甚至被認為可能完全超過人類。

但是正如行為主義和認知主義之間的對抗，智能體是否具有解決問題的能力，并不能單純地考慮統計的結果。善于“事后解釋”任何觀察到的行為，在實驗室之外，都無法“預測”哪些行動即將發生。

編譯來源：

https://bdtechtalks.com/2021/08/02/deepmind-xland-deep-reinforcement-learning/

雷鋒網雷鋒網雷鋒網

雷峰網原創文章，未經授權禁止轉載。詳情見轉載須知。

1人收藏

分享：

相關文章

任平

作者

關注科技

掃描關注作者微信

發私信

當月熱門文章

最新文章

熱門搜索

人工智能移動互聯網 Android應用 iOS應用 Amazon 比亞迪開源 iPhone 6S LBS 智能音箱錘子手機

為了您的賬戶安全，請驗證郵箱

您的郵箱還未驗證,完成可獲20積分喲！

重發郵箱修改郵箱

請驗證您的郵箱

立即驗證

完善賬號信息

您的賬號已經綁定，現在您可以設置密碼以方便用郵箱登錄

立即設置 以后再說

主站蜘蛛池模板：精品无码人妻一区二区三区| 久久综合干| 日本人妻中文| 亚洲色在线播放| 黄色三级a片| 亚洲一区成人av在线| 99精品免费久久久久久久久日本 | 99热门精品一区二区三区无码| 精品熟人妻一区二区三区四区不卡| 亚洲AV无码成人精品区网页| 极品蜜臀黄色在线观看| 色色看片| 一本色道久久亚洲综合精品| 97久久精品人人槡人妻人人玩| 亚洲精品动漫免费二区| 亚洲天堂中文| 99re在线观看| 又色又爽又黄高潮的免费视频| 国产偷国产偷亚洲高清午夜| 日韩在线天堂| 精品久久伊人狠狠爱| 香蕉久草| 野外做受三级视频| 黑人videos特大hd粗暴| 国产tsAV| 精品日本一区二区视频| 国产亚洲天堂另类综合| yw尤物av无码国产在线观看| 国产精品美女久久久免费| 精品人妻无码一区二区色欲产成人| 午夜精品一区二区三区免费视频| 久久精品国产亚洲av天海翼 | 美女禁区a级全片免费观看| 四虎成人精品无码永久在线| 精品亚洲男人天堂av| 成年女人免费视频播放体验区| 国产av亚洲精品ai换脸电影| 国产真实野战在线视频| 国产亚洲人成网站在线观看l| 高跟熟女中文字幕在线亚洲| 97久久久亚洲综合久久|