[1712.01815] Mastering Chess and Shogi by Self-Play with a General Reinforcement
Learning Algorithm
AlphaZero разбил лучшего в мире шахматиста за четыре часа | Журнал Популярная Механика
Теперь AlphaZero лучший игрок в шахматы на планете Земля. В турнире против Stockfish 8, лучшей программы для игры в шахматы, система, созданная компанией Deepmind, не проиграла не единой игры из 100 проведенных партий.
AlphaZero это модифицированная версия AlphaGo Zero, искусственного интеллекта, недавно выигравшего 100 раз подряд в го у знаменитого AlphaGo, того самого, что победил в го лучших человеческих игроков.
Система работает практически идентично с AlphaGo Zero, но вместо го машина запрограммирована играть в шахматы и сёги, еще одну японскую стратегическую игру. Свое мастерство AlphaZero приобрел без посторонней помощи, в отличие от всех предыдущих шахматных программ у него не было доступа к историческим базам шахматных партий. AlphaZero освоил шахматы с чистого листа, без малейшего участия шахматистов, просто 4 часа играя сам с собой.
Можно подумать, что AlphaZero научился играть в шахматы за четыре часа, но это не совсем точно. Скорее AlphaZero научился, как стать абсолютным чемпионом по шахматам за четыре часа. И дело здесь не в том, что AlphaZero просчитывает больше позиций. Система может обработать 800 000 позиций за секунду, тогда как Stockfish 8 может провести 70 миллионов ходов за секунду.
Затем он таким же образом за восемь часов сумел превзойти AlphaGo в го, и за два часа программу Elmo, которая раньше считалась неоспоримым чемпионом по игре в сёги.
Learning Algorithm
AlphaZero разбил лучшего в мире шахматиста за четыре часа | Журнал Популярная Механика
Теперь AlphaZero лучший игрок в шахматы на планете Земля. В турнире против Stockfish 8, лучшей программы для игры в шахматы, система, созданная компанией Deepmind, не проиграла не единой игры из 100 проведенных партий.
AlphaZero это модифицированная версия AlphaGo Zero, искусственного интеллекта, недавно выигравшего 100 раз подряд в го у знаменитого AlphaGo, того самого, что победил в го лучших человеческих игроков.
Система работает практически идентично с AlphaGo Zero, но вместо го машина запрограммирована играть в шахматы и сёги, еще одну японскую стратегическую игру. Свое мастерство AlphaZero приобрел без посторонней помощи, в отличие от всех предыдущих шахматных программ у него не было доступа к историческим базам шахматных партий. AlphaZero освоил шахматы с чистого листа, без малейшего участия шахматистов, просто 4 часа играя сам с собой.
Можно подумать, что AlphaZero научился играть в шахматы за четыре часа, но это не совсем точно. Скорее AlphaZero научился, как стать абсолютным чемпионом по шахматам за четыре часа. И дело здесь не в том, что AlphaZero просчитывает больше позиций. Система может обработать 800 000 позиций за секунду, тогда как Stockfish 8 может провести 70 миллионов ходов за секунду.
Затем он таким же образом за восемь часов сумел превзойти AlphaGo в го, и за два часа программу Elmo, которая раньше считалась неоспоримым чемпионом по игре в сёги.
Комментарий