AI-bott slo 500+ menneskelige spåmenn i prediksjonskamp
Mantic AI plasserte seg som nummer 4 av over 500 deltakere i Metaculus-turneringen — og slo det menneskelige gjennomsnittet. Eksperter mener vi nærmer oss «supermenneskelige prediksjoner».
I flere år har eliteprognostikere konkurrert mot hverandre i turneringer der de svarer på spørsmål om fremtidige hendelser — alt fra kupp i ustabile land til hvor mange Taylor Swift-sanger som vil toppe strømmelistene.
Nå deltar AI-botter i disse turneringene. Og de er i ferd med å vinne.
Fra 100. til 4. plass på ett år
Så sent som i slutten av 2024 hadde ingen AI klart å plassere seg blant topp 100 i de store konkurransene. Men utviklingen har vært eksplosiv.
Under Metaculus Summer Cup 2025 sendte London-baserte Mantic inn sin AI-prediksjonsmotor. Botten måtte svare på 60 spørsmål — fra kamplinjer i Ukraina til Oscar-vinnere og Elon Musks Twitter-oppførsel.
«Det var et uventet gjennombrudd.»
— Toby Shevlane, CEO i Mantic (tidl. Google DeepMind)
AI-en plasserte seg på 8. plass av over 500 deltakere. Men Mantic stoppet ikke der. I Fall Cup gikk en forbedret versjon helt til 4. plass — og slo en vektet gjennomsnitt av alle menneskelige prediksjoner.
Nøkkeltall
- 8. plass i Summer Cup 2025 (500+ deltakere)
- 4. plass i Fall Cup 2025 — ny rekord
- Slo det vektede gjennomsnittet av alle mennesker
- Bruker flere LLM-er i et «stillasje»-system
Hvorfor AI er så god til å spå
Mantic-motoren kombinerer flere store språkmodeller (LLM-er) med ulike styrker. Én modell kan spesialisere seg på valgdata, en annen på værmønstre, en tredje på box office-tall.
Fordelen er åpenbar: For å gjette vinneren av Tour de France må en menneskelig prognostiker bruke timer på å bygge regresjonsmodeller, lese skaderapporter og følge ekspertkommentarer. En AI kan gjøre alt dette på sekunder.
«De har alle ulike prediksjonspersonligheter.»
— Haifeng Xu, professor ved University of Chicago
Xu har bygget en benchmarking-tjeneste som evaluerer AI-enes prediksjoner fortløpende. ChatGPT er konservativ — kanskje for konservativ. Grok og Gemini ligger foran på hans leaderboard.
AI som spesialist: Trump-botten
Selskapet Lightning Rod Labs har tatt en annen tilnærming: De har bygget en AI som er spesialisert på å forutsi Trump-administrasjonens oppførsel.
Modellen ble trent på over 2000 prediksjonsspørsmål med kjente utfall. Deretter testet de den på nye spørsmål — som om Trump ville møte Xi Jinping personlig, eller delta på Army-Navy-kampen.
Resultatet? Den lille, spesialiserte modellen slo OpenAIs mest avanserte generelle modeller.
Hva betyr dette?
AI har allerede bevist at den kan gjøre «supermenneskelige» prediksjoner innenfor begrensede kontekster — som brettspill. Nå nærmer vi oss et punkt der AI kan forutsi fremtiden i vår virkelige, rotete verden bedre enn mennesker.
Mantic har allerede sendt inn sin nyeste motor til Metaculus Spring Cup 2026. Den har fått spørsmål om alt fra hvor mange Oscar-priser «Sinners» vil vinne til om USA snart vil angripe Iran.
Svarene kommer i mai.