Top.Mail.Ru
Общество
Северная Америка
0

Искусственный интеллект Pluribus обыграл в покер 5 профессиональных игроков

Покерный бот Pluribus впервые победил в «Техасском покере», предусматривающего одновременное участие 6 игроков-противников.
Покерный бот Pluribus впервые победил в «Техасском покере», предусматривающего одновременное участие 6 игроков-противников.

ВАШИНГТОН, 14 июля, ФедералПресс. Покерный бот Pluribus впервые победил в «Техасском покере», предусматривающего одновременное участие 6 игроков-противников.

Команда Pluribus ранее создала Искусственный интеллект (ИИ) под названием Libratus, который победил профессиональных игроков в варианте игры для двух игроков. Обновив Libratus, они построили Pluribus и создали бота, которому для игры требуется гораздо меньше вычислительной мощности, чем в аналогичных разработках. За 12-дневную серию игр Pluribus обыграл 15 лучших игроков.

Ноам Браун и Туомас Сандхольм из технического Университета Карнеги-Меллона в Питтсбурге (CPU), которые разработали Pluribus, рассказали Nature, что ключевым прорывом была разработка алгоритма, с помощью которого ИИ выбирает выигрышный сценарий уже после нескольких ходов игроков.

Покер – игра, где на каждом ходу требуется просчитывать варианты разворачивающихся сценариев при недостатке информации. Игровые боты Libratus и DeepMind научились побеждать в матчах с нулевой суммой для двух игроков. В этих сценариях всегда есть один победитель и один проигравший, и теория игр предлагает четко определенную стратегию для победы. Но сложность, вносимая дополнительными игроками, делает эту тактику непрактичной. Большинство ИИ, специализирующихся на играх, ищут в сохраненных алгоритмах наилучшее решение в данной ситуации. Такой метод использовали DeepMind при создании ИИ AlphaZero (ИИ, используя этот метод, обыграл чемпионов по игре в шахматы).

Для игры с несколькими противниками был использован другой метод. Pluribus – самообучаемая система. После каждой игры ИИ анализирует свои действия, и просчитывает варианты, как можно сделать ходы эффективнее. ИИ проигрывает триллионы ситуаций и просчитывает их эффективность. Pluribus обучается без участия человека и разрабатывает свою собственную базовую стратегию, которую игроки-люди не склонны использовать. Это и есть залог победы.

Как говорит команда разработчиков, эти решения могут быть применены при разработке приложений по обнаружению мошенничеств или вождению беспилотных автомобилей. Сейчас ученые хотят заняться другой задачей. Все ИИ, разрабатываемые до этого, специализировались в одной игре или сфере. Разработка ИИ, способного к решению задач из разных сфер, требующих разных способностей - такая задача будет следующим этапом в развитии ИИ.

Фото: pxhere.com

Подписывайтесь на наш канал в Дзене, чтобы быть в курсе новостей дня.