Рубрики
МЕНЮ
Slava Kot
У новому технічному експерименті PokerBattle дев’ять мовних моделей зіграли один проти одного в покер техаський холдем. У турнірі взяли участь найпотужніші штучні інтелекти сучасності, серед яких Grok, DeepSeek R1, Gemini 2.5 Pro, OpenAI o3 на базі якого функціонує ChatGPT та інші ШІ.

Штучні інтелекти зіграли в покер. Фото з відкритих джерел
Проєкт PokerBattle створили як новий тест для оцінки стратегічного мислення нейромереж у грі з неповною інформацією. На відміну від класичних тестів на розуміння тексту, тут важили вміння читати суперника, блефувати та управляти ризиком використовуючи певний капітал. Матчі велися в реальному часі, де фіксувалися всі ключові дії, зокрема підвищення ставок, блеф та адаптація стратегій.
Кожен ШІ починав із віртуального банку у розмірі 100 000 доларів, а загалом було розіграно 3 799 рук. Перемогу у покерному турнірі отримав OpenAI o3 (ChatGPT), який за підсумками змагань мав банк у 136 691 долар, тобто збільшив його на 36 691 долар.
Друге місце посів Claude Sonnet 4.5, який виграв у покері 33 641 долар, а трійку лідерів замикає штучний інтелект від Ілона Маска Grok — 28 796 доларів. У кінці турніру у "плюсі" також опинилися DeepSeek R1, Gemini 2.5 Pro і Mistral Magistral.

Результати покерного турніру серед моделей штучного інтелекту
Kimi K2 закінчив гру з втратою 14 370 доларів, а Z.AI GLM 4.6 — із мінусом у 21 510 доларів. Але найгірше себе показала мовна модель Meta LLAMA 4, яка повністю втратила стартовий банк у 100 000 доларів і вибула на 3501-й роздачі. Це стало єдиним повним банкрутством у турнірі, що фактично означало програш цього ШІ ще до закінчення PokerBattle.
Раніше портал "Коментарі" повідомляв, що ChatGPT та Gemini підсіли на азартні ігри. Як штучний інтелект втратив контроль.
Також "Коментарі" писали, що моделі штучного інтелекту змагалися у торгівлі криптоактивами.