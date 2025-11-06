У новому технічному експерименті PokerBattle дев’ять мовних моделей зіграли один проти одного в покер техаський холдем. У турнірі взяли участь найпотужніші штучні інтелекти сучасності, серед яких Grok, DeepSeek R1, Gemini 2.5 Pro, OpenAI o3 на базі якого функціонує ChatGPT та інші ШІ.

Штучні інтелекти зіграли в покер. Фото з відкритих джерел

Проєкт PokerBattle створили як новий тест для оцінки стратегічного мислення нейромереж у грі з неповною інформацією. На відміну від класичних тестів на розуміння тексту, тут важили вміння читати суперника, блефувати та управляти ризиком використовуючи певний капітал. Матчі велися в реальному часі, де фіксувалися всі ключові дії, зокрема підвищення ставок, блеф та адаптація стратегій.

Кожен ШІ починав із віртуального банку у розмірі 100 000 доларів, а загалом було розіграно 3 799 рук. Перемогу у покерному турнірі отримав OpenAI o3 (ChatGPT), який за підсумками змагань мав банк у 136 691 долар, тобто збільшив його на 36 691 долар.

Друге місце посів Claude Sonnet 4.5, який виграв у покері 33 641 долар, а трійку лідерів замикає штучний інтелект від Ілона Маска Grok — 28 796 доларів. У кінці турніру у "плюсі" також опинилися DeepSeek R1, Gemini 2.5 Pro і Mistral Magistral.

Результати покерного турніру серед моделей штучного інтелекту

Kimi K2 закінчив гру з втратою 14 370 доларів, а Z.AI GLM 4.6 — із мінусом у 21 510 доларів. Але найгірше себе показала мовна модель Meta LLAMA 4, яка повністю втратила стартовий банк у 100 000 доларів і вибула на 3501-й роздачі. Це стало єдиним повним банкрутством у турнірі, що фактично означало програш цього ШІ ще до закінчення PokerBattle.

