Фото №1 - Искусственный интеллект обыграл человека и в покер

Первыми были шахматы. Это самая популярная логическая игра за Западе, там же разработали компьютер и искусственный интеллект. Гроссмейстеры долго не сдавались, но 10 февраля 1996 года Каспаров уступил IBM Deep Blue.

В Азии главная головоломка другая: она называется «го» в Японии, «вэйци» в Китае, или «падук» в Корее. Ее мастера держались намного дольше — до 18 октября 2017 года, но алгоритм AlphaGo Zero от той же IBM положил на лопатки 18-кратного чемпиона мира Ли Си-Дола.

На прошлой неделе публикацией научной работы в журнале Science закончилась еще одна эпоха — правда, стараниями лаборатории ИИ Facebook. На протяжении недели двенадцать ведущих игроков в техасский холдем тягались с алгоритмом с красивым названием Pluribis. 10 тысяч сдач спустя организаторы зафиксировали сокрушительное поражение команды из костей и мяса.

Преимущество ИИ составило около $5 на сдачу, или около $1000 в час — немыслимые показатели на «человеческих» матчах.

В научной работе разработчики ИИ подчеркивают, что реализовать алгоритм оказалось сложнее, чем в случае с шахматами, го, Starcraft II и Dota. В случае с техасским покером самой большой сложностью были две скрытые у каждого игрока карты, и искусственный интеллект при помощи машинного обучения выработал некоторый аналог интуиции. Не все ходы в матче подчинялись только математическому ожиданию комбинации.

ИИ уже обыгрывал живого игрока один на один, но игра вшестером за одним столом многократно повышает сложность алгоритма. Чтобы оптимизировать программу, разработчики применили «самокопирование» интеллекта. Это что-то вроде компьютерной системы естественного отбора: алгоритм сам снимает с себя копии, играет сам с собой, а потом уничтожает неудачливые версии самого себя.

Со стороны звучит ужасающе, поэтому мы, существа из крови, плоти и только что съеденного обеда, все еще настаиваем на том, чтобы ИИ не снабжали пока руками, ногами и плазменной винтовкой. Пускай лучше в покер играет.