計算機自學72小時，成為國際象棋大師

本文作者：思睿

2015-09-16 16:47

導語：Matthew Lai 開發了一個名為 Giraffe 的人工智能機器，它可以通過自學來判斷這步棋該怎么走，這種方式更像人類的思考方式，和傳統的國際象棋引擎具有完全不同的方式。

計算機自學72小時，成為國際象棋大師

Gary Kasparov Vs. 深藍

距離 IBM 的深藍超級計算機擊敗國際象棋世界冠軍加里·卡斯帕羅夫（Gary Kasparov），已經快過去20年了。從那以后，會下國際象棋的計算機又有了顯著增強，人類能夠戰勝計算機的可能性也越來越小。

不過，雖然計算機已經變得越來越快，但國際象棋引擎的工作原理并沒有改變。計算機嚴重依靠“暴力破解”，通過尋找一切可能的移動方式，走出最好的一步棋。

當然，在這方面沒有人能夠與計算機匹敵，甚至是望其項背。深藍計算機可以每秒思考2億步，而卡斯帕羅夫很可能每秒不超過五步。然而，他僅僅是在決勝局輸給了深藍，基本上兩者是在相同的水平上競技。因此，很顯然人類有一些技巧還沒有被計算機所掌握。

神經網絡

人類所擁有的技巧，主要是判斷國際象棋的擺放位置，縮小最有效走位的搜索范圍，這具有重要意義。如果計算機也學會了它，將大大簡化計算任務，并從計算所有的可能性，變成計算最高效的幾種。

計算機此前從不擅長這一技巧，但如今在倫敦帝國學院的 Matthew Lai 的研究下，情況會發生改變。Matthew Lai 開發了一個名為 Giraffe 的人工智能機器，它可以通過自學來判斷下步棋該怎么走，這種方式更像人類，和傳統的國際象棋引擎完全不同。

新型人工智能能與最優秀的傳統國際象棋引擎達到相同的水平。如果按照人類水平來評估，也就相當于FIDE（世界國際象棋聯合會）所評定的國際大師。

這一人工智能背后的技術就是神經網絡，它是受人類大腦構造所啟發，并用于計算機處理信息的一種方式，由多個節點層級所組成，系統會隨著人類對其不斷地訓練而提升。

在過去的幾年中，由于兩個技術的進展，神經網絡已經變得非常強大了。第一個是更好地了解了當它們進行學習時，如何微調神經網絡，這要部分歸功于更快的計算機；第二個是能夠利用大量的注釋數據集，來訓練神經網絡。因此，深度神經網絡能發現國際象棋的規律也就不足為奇了，而這正是 Matthew Lai 所采取的方法。

他的神經網絡由四個層級組成，能夠以三種不同方式共同思考棋盤上每一個位置。第一種著眼于國際象棋的全局狀態，例如每邊棋子的數量和類型，輪到哪一方移動，位置對換等；第二著眼于棋子的特性，例如雙方每個棋子的位置；最后就是映射出每個棋子的攻擊和防守。

計算機自學下棋

訓練這些機器通常采用的方法，是研究人員手動評估每一個位置，并用這些信息指導機器識別出哪些步數是有效的，哪些效果沒那么好。但是，Matthew Lai 的目標更加雄心勃勃，他想讓機器自學這些內容。

他采用了一個引導技術，讓人工智能 Giraffe 自己與自己對決，從而改善對未來下棋走位的預測。在比賽勝利、失敗或打平之后，會最終確定每一步的價值。以這種方式，計算機可以了解走哪個位置是有效的，哪些位置效果不好。

在 Giraffe 經過培訓之后，最后一步就是測試它的能力是否達標了。他用一個標準數據庫 Strategic Test Suite 來測試，這一數據庫可以測試改計算引擎識別不同的戰略構想的能力。他將對這項測試的結果進行評分，總分為15000。

計算機自學72小時，成為國際象棋大師

整個訓練過程中，他會測試機器的各個階段成績。當引導過程開始時，Giraffe 很快就達到了6000分的成績，僅在72小時就達到了9700分。9700分已經可以成為世界上最好的國際象棋引擎了。

Matthew Lai 接著使用相同種類的機器學習方法，確定對方一個特定的移動是否值得機器進行跟隨。這一點很重要，因為它可以防止不必要的搜索，極大提高計算效率。

結果表明，46％的情況下計算機所走的步數都是最好的一步，70％的時間都能走出排在前三名的好棋。因此，計算機并沒有收到對方的動作的影響。

這一方法代表著國際象棋引擎的工作方式發生了重大變革，不過它并不完美。Giraffe 的一個缺點是，神經網絡比其他類型的數據處理速度慢得多。Giraffe 花費的時間比以往的國際象棋引擎要多耗費約10倍。

但即使有此缺點，它仍然具有相當大的競爭力。相比現在的國際象棋引擎，Giraffe 不僅僅能計算出棋局未來的走勢，還能夠準確地判斷出最棘手的位置，并像人類一樣直觀地了解復雜的走位概念，這是國際象棋引擎很長一段時間以來一直難以捉摸的地方。

當然這一切僅僅是個開始。 Matthew Lai 表示，這一方法應該直接應用在其他類型的棋類中，最為突出的就是中國圍棋，圍棋相比國際象棋擁有更高的難度和更多不確定的因素。

via technologyreview

雷峰網原創文章，未經授權禁止轉載。詳情見轉載須知。

2人收藏

思睿

專業投稿

微信：ID_Travis

發私信

當月熱門文章