Аналитика

Claude, Gemini и Grok не сумели получить прибыль в ставках на спорт

ИИ ведущих технологических компаний продемонстрировал неспособность стабильно зарабатывать на спортивных ставках, потеряв весь виртуальный капитал в ходе моделирования сезона английской Премьер-лиги.

Стартап General Reasoning провёл масштабное исследование KellyBench, в рамках которого протестировал восемь передовых моделей искусственного интеллекта от крупнейших разработчиков — включая решения от OpenAI, Google, Anthropic и xAI. Итоги эксперимента были опубликованы на платформе Habr со ссылкой на данные Financial Times.

Целью исследования стало моделирование поведения ИИ в реальной среде, приближенной к условиям неопределенности и динамики. В качестве тестовой площадки был выбран сезон английской Премьер-лиги 2023–2024 годов — один из наиболее непредсказуемых турниров в мировом футболе.

Моделям предоставили исторические данные по командам, статистику матчей и базовую информацию об игроках. При этом доступ к интернету был полностью отключен, что исключало возможность получения актуальных новостей или изменений в составах команд.

Как работали ИИ-агенты

Каждой модели было поручено разработать стратегию ставок, направленную на максимизацию прибыли с учётом управления рисками. Алгоритмы должны были самостоятельно определять:

исход матчей,
количество забитых голов,
распределение капитала по ставкам.

Каждому ИИ-агенту предоставлялось три попытки для достижения положительного финансового результата. Таким образом, исследование оценивало не только точность прогнозов, но и способность адаптироваться к изменяющимся условиям по ходу сезона.

Результаты: убытки у всех моделей

Несмотря на высокий уровень развития современных ИИ-систем, ни одна из них не смогла продемонстрировать устойчивую прибыльность.

Наиболее успешным оказался Claude Opus 4.6 от Anthropic — его средний убыток составил 11 %, при этом в одной из попыток результат оказался близким к безубыточности. Однако даже этот показатель не позволил выйти в плюс.

Другие модели показали ещё более слабые результаты:

Grok 4.20 от xAI быстро потерял весь капитал и фактически обанкротился уже на раннем этапе;
Gemini 3.1 Pro от Google продемонстрировал прибыль в 34 % в первой попытке, однако затем полностью потерял средства во второй;
остальные системы также завершили симуляции с отрицательным балансом.

В совокупности все протестированные ИИ не только не смогли обыграть рынок, но и в большинстве случаев проиграли быстрее, чем это сделал бы человек с базовыми знаниями о футболе.

Почему ИИ проиграл: ограниченность моделей

Авторы исследования подчёркивают, что ключевая проблема заключается в неспособности ИИ эффективно работать в условиях высокой неопределенности. В отличие от задач программирования или анализа текста, спортивные события включают множество трудноформализуемых факторов:

текущая форма игроков,
психологическое состояние команд,
травмы и кадровые изменения,
тактические решения тренеров.

Кроме того, модели были лишены доступа к актуальной информации, что ещё больше снизило их адаптивность. Однако даже при наличии исторических данных ИИ не смог выстроить стратегию, способную конкурировать с коэффициентами букмекеров.

Выводы для рынка ИИ

Результаты KellyBench ставят под сомнение распространённые ожидания относительно универсальности искусственного интеллекта. Несмотря на впечатляющие успехи в генерации текста и написании кода, ИИ остаётся ограниченным инструментом при работе с динамическими системами реального мира.

Исследование также демонстрирует, что классические бенчмарки, используемые для оценки моделей, не отражают реальную сложность внешней среды. Они опираются на статичные условия, тогда как реальный мир характеризуется хаотичностью и постоянными изменениями.

Таким образом, утверждения о скором вытеснении человека из сложных аналитических задач выглядят преждевременными. На текущем этапе развития ИИ не способен эффективно конкурировать даже в такой узкой области, как спортивный трейдинг.

Перспективы и ограничения

Авторы эксперимента подчёркивают: несмотря на неудачи, потенциал ИИ остаётся высоким, однако его применение требует чёткого понимания границ возможностей. Наиболее эффективные сценарии использования по-прежнему связаны с задачами, где структура данных стабильна и хорошо формализована.

В то же время попытки перенести эти модели в сферы с высокой степенью неопределенности — такие как финансовые рынки или ставки на спорт — требуют принципиально новых подходов и архитектур.

Мнение ИИ

С точки зрения машинного анализа данных подобные эксперименты напоминают ранние попытки алгоритмического трейдинга на финансовых рынках, где модели также демонстрировали переобучение на исторических данных и теряли эффективность в условиях реального времени. Ситуация показывает, что отсутствие онлайн-обновлений и ограниченность входных параметров превращают даже продвинутые ИИ-системы в статические модели, тогда как спортивные события по своей природе ближе к стохастическим (случайным) процессам с высокой долей шума.

Ситуация демонстрирует и более широкий технологический риск: современные языковые модели не оптимизированы для принятия решений с жёсткими финансовыми ограничениями и управлением капиталом. Их архитектура ориентирована на генерацию вероятностно правдоподобных ответов, а не на минимизацию потерь в долгосрочной перспективе. Возникает вопрос — станет ли следующий этап развития ИИ связан с гибридными системами, где генеративные модели дополняются специализированными алгоритмами управления риском?

«`

Источник: cryptonews.net