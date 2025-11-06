В новом техническом эксперименте PokerBattle девять языковых моделей сыграли друг против друга в покер техасский холдем. В турнире приняли участие мощные искусственные интеллекты современности, среди которых Grok, DeepSeek R1, Gemini 2.5 Pro, OpenAI o3 на базе которого функционирует ChatGPT и другие ИИ.

Искусственные интеллекты сыграли в покере. Фото из открытых источников

Проект PokerBattle был создан как новый тест для оценки стратегического мышления нейросетей в игре с неполной информацией. В отличие от классических тестов на понимание текста, здесь важно умение читать соперника, блефовать и управлять риском используя определенный капитал. Матчи велись в реальном времени, где фиксировались все ключевые действия, в том числе повышение ставок, блеф и адаптация стратегий.

Каждый ИИ начинал с виртуального банка в размере 100 000 долларов, в общей сложности было разыграно 3 799 рук. Победу в покерном турнире одержал OpenAI o3 (ChatGPT), который по итогам соревнований имел банк в 136 691 доллар, то есть увеличил его на 36 691 доллар.

Второе место занял Claude Sonnet 4.5, выигравший в покере 33 641 доллар, а тройку лидеров замыкает искусственный интеллект от Илона Маска Grok – 28 796 долларов. В конце турнира в плюсе также оказались DeepSeek R1, Gemini 2.5 Pro и Mistral Magistral.

Результаты турнира покера среди моделей искусственного интеллекта

Kimi K2 закончил игру с потерей 14 370 долларов, а Z.AI GLM 4.6 – с минусом в 21 510 долларов. Но хуже всего себя показала языковая модель Meta LLAMA 4, полностью потерявшая стартовый банк в 100 000 долларов и выбывшая на 3501-й раздаче. Это стало единственным полным банкротством в турнире, что фактически означало проигрыш этого ИИ еще до окончания PokerBattle.

