Sztuczna inteligencja wykazała niską skuteczność w zakładach sportowych, straciła wszystkie pieniądze na meczach Premier League Anglii.

Sztuczna inteligencja wykazała niską skuteczność w zakładach sportowych, straciła wszystkie pieniądze na meczach Premier League Anglii.

2 hardware

Krótko o wyniku eksperymentu

Startup *General Reasoning* przeprowadził test pod nazwą KellyBench, w którym ocenił osiem czołowych systemów AI (Google Gemini 3.1 Pro, OpenAI ChatGPT‑4, Anthropic Claude Opus 4.6, xAI Grok 4.20 i inne) na zdolność obstawiania podczas sezonu angielskiej Premier League 2023–2024.

Każdemu agentowi udostępniono pełny opis statystyczny wszystkich drużyn i poprzednich meczów, ale dostęp do internetu był zabroniony – modele mogły korzystać tylko z danych otrzymanych wcześniej.

Jak przebiegał test

1. Trzy próby: każda system mógł wykonać trzy serie zakładów na sezon.
2. Zakłady: na wyniki meczów (wygrana/ remis/ przegrana) i liczbę goli.
3. Cel: maksymalizacja zysku przy zarządzaniu ryzykiem.

Kto wygrał, a kto przegrał

System AIŚredni wynikUwagi
Anthropic Claude Opus 4.6-11 % (prawie bezstratność w jednej próbie)Najbardziej „uczciwy” uczestnik, ale mimo to stracił pieniądze
Google Gemini 3.1 Pro+34 % w pierwszej próbie, potem bankrutNa początku zysk, później strata
xAI Grok 4.20Bankrut od razu, nie ukończył dwóch kolejnych próbNajsłabszy ze wszystkich

W rezultacie każdy model stracił pieniądze przez cały sezon, a kilka nawet całkowicie „zawiodło”. Potwierdza to wnioski badaczy: nawet najbardziej zaawansowane systemy AI mają trudności z długoterminowym prognozowaniem w rzeczywistym świecie.

Co to oznacza dla przyszłości AI

- Obawy o zastąpienie człowieka wydają się przerośnięte.
- Obecne benchmarki często korzystają z „statycznych” warunków, które nie odzwierciedlają chaosu i złożoności prawdziwego życia.
- Chociaż AI już skutecznie rozwiązuje zadania takie jak pisanie kodu, w większości innych obszarów działalności ludzkiej pozostaje ograniczone.

W ten sposób eksperyment KellyBench pokazuje, że AI nie jest jeszcze gotowe do konkurencji z człowiekiem w dynamicznych, nieprzewidywalnych zadaniach, takich jak prognozy sportowe.

Komentarze (0)

Podziel się swoją opinią — prosimy o uprzejmość i trzymanie się tematu.

Nie ma jeszcze komentarzy. Zostaw komentarz i podziel się swoją opinią!

Aby dodać komentarz, zaloguj się.

Zaloguj się, aby komentować