1.據Alpha Go團隊負責人大衛席爾瓦(david silva)介紹,AlphaGoZero使用新的強化學習方法使自己成為一名教師。一開始,係統甚至不知道圍棋是什麽,而是從單個神經網絡出發,通過神經網絡強大的搜索算法進行自我對弈。
2.隨著自我博弈的增加,神經網絡逐漸調整,提高對下一步的預測能力,最終贏得博弈。更重要的是,隨著訓練的深入,Alpha Go團隊發現AlphaGoZero也自主發現了遊戲規則,想出了新的策略,為圍棋這個古老的遊戲帶來了新的見解。
3.AlphaGo是第一個戰勝人類職業圍棋選手的人工智能機器人,也是第一個圍棋世界冠軍。它是由穀歌旗下的戴密斯哈薩比斯公司領導的團隊開發的。它的主要工作原理是“深度學習”。
本文到此結束,希望對大家有所幫助呢。