Руководство по искусственному интеллекту в Facebook Poker — онлайн-покер мертв?

Мы станем свидетелями конца онлайн-покера в том виде, в каком мы его знаем? Facebook создал покерный ИИ под названием Pluribus, который сумел победить 12 покерных профессионалов, играя против 6 из них одновременно.

Этого не удавалось делать ни одному другому ИИ раньше. Означает ли это, что рынок онлайн-покера никогда не будет прежним?

В этой статье я расскажу вам все, что вам нужно знать о Pluribus, и постараюсь ответить на все животрепещущие вопросы. Некоторые из тем, которые я затрону, включают:

Имея перед вами все эти важные вопросы, я уверен, что вы тоже хотите узнать ответы. Без лишних слов, давайте начнем с изучения того, что на самом деле представляет собой Pluribus.

Что такое ИИ Pluribus Poker?

Pluribus AI — новейшее достижение Facebook в области технологий искусственного интеллекта. Этому ИИ удалось сделать то, что было невозможно представить всего несколько лет назад — победить противников-людей в безлимитном техасском холдеме на шесть игроков.

Этот ИИ — результат сотрудничества между Facebook и Университет Карнеги-Меллона . Pluribus — это, по сути, улучшенная версия Libratus, его младшего брата, который в прошлом достиг невероятных результатов. Однако победа над элитными игроками в полноценной игре в покер с несколькими оппонентами была вехой, которой недоставало долгое время.

Эта важная веха важна не только для покерной индустрии. Это имеет значение для всего мира, поскольку Pluribus можно использовать в различных сценариях, например, для улучшения условий движения.

Более того, Pluribus особенный, потому что ему удалось достичь этого достижения самостоятельно. Это искусственный интеллект для самостоятельной игры, который не требует участия людей для улучшения своих навыков, за исключением первоначальных рекомендаций по правилам игры, в которую он играет.

Libratus: где все начиналось

Libratus — это « старый » покерный искусственный интеллект, также созданный Университетом Карнеги-Меллона в 2017 году. время, он стал важной вехой, выиграв в Техасском холдеме для двух игроков против людей-людей, чего раньше не делали.

Однако вычислительные ограничения Libratus означали, что он мог хорошо работать только в играх с двумя соперниками или двумя командами и в соревнованиях с нулевой суммой. Некоторые игры, в которых этот ИИ проявлял особые успехи, включают шахматы, шашки, го, Dota 2, Starcraft 2 и покер для двух игроков .

Чтобы увеличить свои шансы на победу над игроками-людьми, Libratus использовал две стратегии, называемые равновесие по Нэшу и противодействие минимизации сожалений . Эти стратегии используются в играх с неполной информацией, чтобы заполнить пробелы.

Однако эти стратегии очень сложно использовать и вычислить, когда в игре участвует более одного противника. Требования к вычислениям растут по экспоненте по мере добавления новых противников.

Например, если Libratus столкнется с 5 противниками-людьми, ему потребуется 10 000-кратная вычислительная мощность, необходимая только для одного противника. С другой стороны, Pluribus требуется лишь небольшая часть этой мощности при минимальной стоимости, что делает его гораздо более практичным, эффективным и экономичным.

Как работает Pluribus?

Artificial Intelligence Thinking

Ученые из Университета Карнеги-Меллона придумали несколько невероятно умных решений, которые сделают Pluribus намного более способным и умным, чем Libratus.

Причина, по которой Libratus нуждался в гораздо большей вычислительной мощности, заключалась в том, что ему приходилось смотреть намного дальше вперед.

Поэтому ему приходилось выполнять больше вычислений, прежде чем делать ход, иногда предсказывая ходы и результат всей игры.

С другой стороны, секрет Pluribus заключается в том, что ему нужно заглянуть на несколько шагов вперед, прежде чем сделать ход. Это означает, что для этого требуется минимальная вычислительная мощность, которую может обеспечить даже стандартный процессор, установленный в наших домах.

К сожалению (и к счастью), Facebook не раскрыл подробно, как работает Pluribus. Мы знаем, что он использует новый, более быстрый алгоритм самостоятельной игры для навигации по играм с несовершенной информацией, но мы еще не знаем, что это на самом деле.

Это и хорошо, и плохо. С одной стороны, мы находимся в темноте, и поэтому нам любопытно узнать, что происходит за закрытыми дверями. С другой стороны, мошенники не смогут воссоздать Pluribus без полной информации из Facebook. По крайней мере на некоторое время.

Что такого особенного в Pluribus?

Pluribus особенный и отличается от все, что мы видели раньше, разными способами.

Было бы недооценкой сказать, что это революция в исследованиях искусственного интеллекта.

ИИ для самостоятельной игры

Прежде всего, Pluribus — это ИИ для самостоятельной игры. Это означает, что он не требовал участия людей в виде реальных примеров из покерных игр. Это также означает, что он не учился на играх, завершенных людьми. Вместо этого он учился сам.

Pluribus получил руководство по правилам безлимитного покера Техасского Холдема и затем принялся играть против самого себя, пока не достиг совершенства. По сути, он учился, повторяя ошибки снова и снова и выясняя, какой была бы идеальная стратегия.

Это может показаться долгим процессом, но на самом деле это пугающе быстро. Самостоятельно тренируясь, Pluribus может превзойти среднюю человеческую производительность в покере всего за 400 минут (~ 7 часов). Требуется еще 800 минут, чтобы превзойти максимальную производительность человека, и еще 1400 минут, чтобы исключить хромоту из его производительности.

Требуется мало памяти

Поскольку Pluribus не требует участия людей, это означает, что его требования к памяти довольно низкие. Фактически, это первоначальное достижение было достигнуто с использованием всего 512 ГБ оперативной памяти. Более того, в процессе не использовались графические процессоры.

Это означает, что, если мы рассмотрим типичную стоимость облачных вычислений, разработка Pluribus будет стоить около 150 долларов . Это лишь небольшая часть денег, которые требовались даже для того, чтобы подумать о создании предыдущих покерных ИИ, таких как Libratus.

Невероятно быстро

Во время игры в покер Pluribus работает на двух процессорах. Для сравнения, AlphaGO потребовалось 1920 процессоров и 280 графических процессоров для выполнения поиска в реальном времени в 2016 году.

Помимо того, что Pluribus требует меньше ресурсов обработки, он также намного быстрее своих предшественников. Чтобы выполнить поиск в одной подигре, Pluribus требуется от 1 до 33 секунд, в зависимости от конкретной ситуации.

В среднем Pluribus играет в два раза быстрее, чем самые быстрые профессиональные игроки в покер.

Почему покер так сложен для ИИ?

bender playing poker

Poker — самая сложная игра в мире для ИИ.

Самой сложной пока что является безлимитный техасский холдем на шесть игроков. Три основных причины, почему эта игра так сложна для искусственного интеллекта:

  • необходимость иметь дело с неполной информацией.
  • Достичь равновесия по Нэшу сложно.
  • Психологические навыки, например блеф, необходимы для победы.

Несовершенная информация

Покер определяется как игра с несовершенной информацией, потому что игроки никогда не имеют полного представления об игре. Есть некоторые игры, которые также содержат несовершенную информацию, но ни одна из них не в такой степени, как покер.

В покере игроки знают только, какие карты у них есть, но не знают карт своих оппонентов. Следовательно, им необходимо принимать решения, основанные на прогнозах, а не на фактах. Это полностью отличается от, например, шахмат, где вы получаете всю информацию с доски. Это позволяет решить конец игры, не зная каких-либо предыдущих ходов и стратегий.

В покере основная проблема заключается в том, что невозможно создать идеальную стратегию для конкретной ситуации, которая отличается от предыдущей. общая стратегия покера.

Проблемы равновесия по Нэшу

Равновесие по Нэшу — это стратегия, разработанная некоторое время назад математиком по имени Джон Нэш. Эта стратегия применима в играх с нулевой суммой с двумя игроками, и ее довольно сложно реализовать в играх с несколькими игроками, таких как покер.

Равновесие Нэша — это стратегия, которая гарантирует выигрыш для игрока независимо от ходы его оппонентов. Например, в игре камень-ножницы-бумага стратегия равновесия Нэша рекомендует случайным образом выбирать камень, бумагу или ножницы , поскольку все три хода имеют равную вероятность выигрыша.

Libratus успешно применил стратегию равновесия Нэша в игре Texas Hold’em для двух игроков. Однако реализовать эту стратегию в игре с шестью игроками просто невозможно с вычислительной точки зрения.

Психология человека и блеф

Как мы ни старались, мы до сих пор не создали ИИ, который мог бы успешно имитировать сложную психологию человека. В покере человеческую психологию лучше всего можно наблюдать в блефе — учиться лгать своим оппонентам и обманывать их, говоря, что у вас лучшая рука, чем на самом деле.

До создания Pluribus это было невозможно сделать в больших масштабах. Основная цель блефа — сделать вашу стратегию блефа непредсказуемой. Следовательно, вы не можете блефовать, используя простые, заранее усвоенные правила. Вам нужно изменить свой подход и постоянно заново изучать то, что вы знали раньше.

Учитывая, что Pluribus удалось победить 12 элитных игроков в покер, мы можем с уверенностью сказать, что ему удалось овладеть психологией человека, по крайней мере, в контекст покера.

Что такое стратегия Blueprint от Pluribus?

Стратегия Blueprint, которую использует Pluribus AI это грубая стратегия, которая помогла ему выиграть у элитных игроков в покер. Из-за сложности и размеров безлимитного техасского холдема на шесть игроков более детальная стратегия не сработает. Для каждой ситуации существует слишком много возможных исходов.

Таким образом, Pluribus улучшает более крупнозернистую стратегию Blueprint в реальном времени и уточняет ее для каждой ситуации. Таким образом, его игровой процесс остается непредсказуемым, и он может лучше адаптироваться к различным задачам.

Поиск в реальном времени не новость в исследованиях ИИ. Многочисленные ИИ использовали поиск в реальном времени в играх с точной информацией, чтобы побеждать людей. ИИ обычно смотрит вперед на определенное количество ходов, пока не достигнет листового узла.

Однако эти методы поиска невозможны в играх с неполной информацией, таких как покер Техасский холдем. Это потому, что ИИ не может с уверенностью предсказать, что будут делать игроки. Люди-игроки могут в любой момент изменить свою стратегию за пределы листового узла и использовать жесткую стратегию ИИ.

Более того, в покере невозможно создать идеальную стратегию, основанную исключительно на правилах игры. Другой важный фактор — то, какую стратегию используют оппоненты и каково их восприятие игры. Например, если игрок никогда не блефует, мы можем уверенно фолдить, когда он делает рейз, и наша рука слабая, потому что мы можем быть уверены, что у него сильная рука. Это большая проблема для искусственного интеллекта.

Pluribus чрезвычайно дешево производить

Помимо Научные и технологические достижения Pluribus знаменуют собой еще один огромный прорыв в исследованиях искусственного интеллекта. А именно, этот ИИ невероятно дешев в изготовлении. Это полностью противоположно тому, что было всего несколько лет назад, когда вам требовались сотни тысяч или миллионы долларов для достижения аналогичных результатов.

Причина того, что Pluribus настолько дешев, заключается в том, что он требует очень мало памяти, как мы уже упоминали. Если у вас есть необходимые знания и время для написания кода алгоритма Pluribus, все, что вам нужно, — это около 150 долларов, чтобы купить около 512 ГБ хранилища облачных вычислений.

Это означает, что любой желающий будет иметь средства для этого. Это одна из основных причин, по которой Facebook не раскрыл всю информацию о коде и алгоритмах, кроме того факта, что они хотят сохранить свою технологию при себе.

Более того, если бы кто-то создал Pluribus и использовал его для игры в покер в онлайн-казино, их рентабельность инвестиций была бы огромной очень быстро. Этот ИИ способен переиграть большинство обычных игроков в покер всего за 7 часов самостоятельной игры и изолированной практики.

До появления Pluribus среди экспертов по ИИ было общее мнение, что будущее ИИ находится в руках огромных команд инженеров, в распоряжении которых есть миллионы долларов. Однако это достижение показывает, что любой, обладающий нужными знаниями и правильным подходом, может раздвинуть границы искусственного интеллекта, каким мы его знаем сегодня.

У Human Pro нет шансов противостоять Pluribus

Возможности Pluribus в том, что касается игры в безлимитный техасский холдем на шесть игроков, не тестировались против среднего игрока. Он играл против ведущих профессионалов индустрии, трое из которых были Крис « Хесус » Фергюсон, Грег Мерсон и Даррен Элиас , которые выиграли крупные чемпионаты мира по покеру. несколько раз.

Более того, все игроки, столкнувшиеся с Pluribus, выиграли более 1 миллиона долларов, профессионально играя в покер, а многие из них намного больше, чем 10 миллионов долларов. Как видите, ИИ нелегко расколоть орешек. В тот момент он играл против лучших игроков мира.

Университет Карнеги-Меллона

Даже в этом случае у игроков-людей не было шансов против ИИ. Во время тестов в игры играли в двух форматах: один ИИ против 5 игроков-людей и 5 ИИ против одного игрока-человека. В начале каждой игры каждый игрок начинал с 10 000 фишек на столе с большими-малыми блайндами 50/100.

В конце игры, учитывая, что каждая фишка стоила доллар, Pluribus будет выиграли около 5 долларов за руку и 1000 долларов за час. В мире профессионального покера это считается решающей победой.

По словам Даррена Элиаса, главной сильной стороной Pluribus было умение использовать разные стратегии для победы. Люди-игроки этого делать не могут. Люди стараются максимально упростить свои стратегии, чтобы иметь возможность делать меньше ошибок. Это то, о чем этому ИИ не нужно беспокоиться, поэтому он может часто менять свой стиль игры.

Почему Facebook разработал этот покерный AI?

Facebook

Несмотря на то, что это достижение Facebook и ученых из Университета Карнеги-Меллона было протестировано в В играх в покер последствия использования этой технологии намного больше.

Большинство проблем, которые нам нужно решить с помощью ИИ, связаны с неполной информацией. Таким образом, этот этап важен, поскольку он позволит нам начать использовать искусственный интеллект во многих различных условиях реального мира.

Несмотря на то, что Pluribus не идеален и существует множество многоагентных настроек, в которых этот ИИ не справится, это самый продвинутый ИИ, который у нас есть в этой сфере сегодня.

Некоторые реальные сценарии, в которых этот ИИ может помочь нам, включают мошенничество, кибербезопасность, а также работу с вредоносным контентом. Все эти ситуации могут быть представлены ИИ как настройки неполной информации, чтобы он мог использовать свои стратегии для достижения наилучшего результата.

Pluribus также можно использовать в управлении дорожным движением для прогнозирования пробок.

Таким образом, можно будет лучше планировать обслуживание дорог с минимальными последствиями для качества жизни жителей города. .

Приложения огромны и ограничены только тем, что мы, люди, можем себе представить. Но поскольку Pluribus не основан на алгоритме с открытым исходным кодом, еще неизвестно, что Facebook будет с ним делать.

Какие риски создает Pluribus Pose для индустрии покера?

Неудивительно, что последние достижения в области исследований в области искусственного интеллекта вызвали огромный резонанс в индустрии онлайн-покера.

Мы видели, как многие эксперты сомневались, может ли Pluribus полностью разрушить рынок онлайн-покера.

Одна из основных проблем этого ИИ заключается в том, что его код может попасть в чужие руки. Онлайн-казино и онлайн-покер-румы уже сталкиваются с покер-ботами на своих сайтах. Ими управляют люди, которые используют их в мошеннических целях, чтобы заработать деньги.

К счастью, эти ИИ все еще не так сложны, как Pluribus. Таким образом, официальные лица веб-сайта могут распознать закономерности в своей игре и наложить санкции на такие аккаунты.

Однако с последним AI ситуация иная. Его стратегия намного сложнее, чем все, что когда-либо видела сцена онлайн-покера. Поэтому, если мошенник откроет несколько счетов и будет использовать реалистичный выигрышный подход, поймать их будет очень сложно.

И последнее, но не менее важное: мы не должны забывать, что Pluribus можно сделать всего за 150 долларов. Любой человек, обладающий достаточными знаниями и средними компьютерными навыками, может создать этот ИИ и выпустить его в онлайн-покер-руме.

Доживает ли онлайн-покер последние дни?

Если Pluribus будет выпущен и обнародован, то да, покер будет на последнем издыхании. Однако этого не происходит именно по этой причине. Это означает, что онлайн-покер по-прежнему безопасен, по крайней мере, на данный момент.

Но в ближайшем будущем мы, безусловно, можем ожидать, что сложные искусственные интеллекты заполнят новые покер-румы онлайн. Единственный способ предотвратить это — оснастить покерные сайты другими ИИ, способными распознавать компьютерную игру.

Если бы такие компьютеры, как Pluribus, сидели за столами для онлайн-покера, у людей просто не было бы шансов. Покерные комнаты по-прежнему будут приносить прибыль, поэтому для них это не будет большим ударом. Однако среднему игроку в покер в такой ситуации не место.

Заключение

Научное сообщество невероятно рада последним достижениям, связанным с исследованиями искусственного интеллекта. Однако сообщество онлайн-покера, хотя и увлеченно, становится все более нервным.

Pluribus по-прежнему не представляет опасности для наших любимых покер-румов, но это, безусловно, может измениться в ближайшем прошлом. В таком случае дни индустрии онлайн-покера, как мы ее знаем, будут сочтены.

Что вы думаете об этом ИИ? Как вы думаете, представляет ли это реальную угрозу онлайн-покеру? Вы можете поделиться своими вопросами и мнениями ниже.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *