Группа ученых из группы DeepMind и Институтского института в Лондоне разработала систему искусственного ума, способную самообучаться игре и совершенствованию в 3-х сложных настольных играх. В собственной работе, размещенной в журнальчике Science, ученые обрисовывают свою новейшую систему и разъясняют, почему считают, что она представляет собой большенный шаг в направлении развития будущих систем ИИ.
Прошло наиболее 20 лет с того времени, как суперкомпьютер Deep Blue одолел чемпиона мира по шахматам Гари Каспарова и показал миру, как далековато продвинулись вычисления в сфере ИИ. С того времени компы становились все умнее и сейчас одолевают людей в таковых играх, как шахматы, сёги и го. Но любая из схожих программ настраивалась специально, чтоб стать мастером в отдельной игре. В собственной новейшей работе ученые обрисовали создание искусственного ума, который не только лишь неплох в нескольких играх, да и учится этому совершенствованию без помощи других.
AlphaZero: новейший мастер
Новенькая система под заглавием AlphaZero представляет собой систему обучения с подкреплением, другими словами учится, неоднократно играя в игру и учась на собственном опыте. Это, очевидно, весьма похоже на процесс обучения людей. Задается базисный набор правил и комп играет в игру — сам с собой. Ему даже партнеры не необходимы. Он играет сам с собой много раз, отмечая отличные и победные ходы. С течением времени он становится все лучше и лучше, превосходит не только лишь людей, да и остальные системы ИИ, разработанные для настольных игр. Данная система также употребляла способ поиска «древа поиска Монте-Карло». Совмещение 2-ух технологий позволило системе научиться совершенствованию в игре. Ученые опробовали силы программки, обеспечив ее большенный мощностью — 5000 тензорных микропроцессоров, работающих в паре с огромным суперкомпьютером.
На текущий момент AlphaZero освоил шахматы, сёги и го. Последующим шагом станут пользующиеся популярностью видеоигры. Что касается производительности ИИ, то в го, к примеру, AlphaZero обыграл знаменитого AlphaGo уже через 30 часов.