En UFC-fan bygde en maskinlæringsmodell som forutsier kampvinnere med 71,6 prosents nøyaktighet – og bruker AI til å forklare hvorfor. Prosjektet dukket nylig opp på Reddit og fikk god oppmerksomhet i ML-miljøet, og jeg synes det er et godt eksempel på hva en nysgjerrig hobbyist kan få til med riktig verktøykasse.

Modellen er bygd på XGBoost – en klassisk og velprøvd gradient boosting-algoritme – og kombinerer kampstatistikk med en AI-drevet forklaringsmotor. Det er ikke bare en svart boks som sier «fighter A vinner». Den forteller deg også hvorfor modellen lander på den konklusjonen.

71,6 prosent er faktisk ganske bra for UFC-prediksjon. Kampsport er notorisk uforutsigbar – en fighter kan dominere i fire runder og tape på et enkelt slag i den femte. At en maskinlæringsmodell klarer å ligge konsekvent over 70 prosent, sier noe om at det faktisk er mønstre i dataene som lar seg fange opp.

Hva er XGBoost, og hvorfor passer det her?

XGBoost (eXtreme Gradient Boosting) er en av de mest brukte algoritmene innen maskinlæring for strukturerte data – altså tabelldata med rader og kolonner. Den vant bokstavelig talt hundrevis av Kaggle-konkurranser da den kom, og brukes fortsatt aktivt i produksjon hos mange store selskaper.

For UFC-prediksjon er det et naturlig valg. Dataene du jobber med er nettopp strukturerte: vinstrate, knockdowns, submission-forsøk, rekkevidde, alder, streaks. Ingen bilder, ingen video – bare tall og statistikk. XGBoost spiser slik data til frokost.

Det spesielt interessante her er at utvikleren justerte algoritmen til å ta hensyn til hvilken vektklasse kampen foregår i. Hver vektklasse i UFC har en dominerende kampstil – lettervekter er ofte raskere og mer striking-fokuserte, mens tungtvekkere er mer knockout-orienterte. Modellen gir en liten fordel til fighters som matcher sin vektklasses dominerende stil. Det er en elegant måte å håndtere den biologiske og stilistiske variasjonen på.

Hvordan fungerer AI-forklaringen?

Det er her prosjektet skiller seg fra de fleste akademiske UFC-prediksjonsprosjekter. I stedet for å bare levere en sannsynlighet, bruker appen en AI-modell til å generere en naturlig språkforklaring av prediksjonen.

Tenk deg at du spør: «Hvem vinner mellom fighter A og fighter B?» I stedet for å få «Fighter A: 67%», får du noe i retning av: «Fighter A har bedre striking accuracy over de siste fem kampene, og Fighter B har tapt tre av sine fire kamper mot southpaw-stances. Stilforskjellen gir Fighter A en klar fordel her.»

Dette er et godt eksempel på det som kalles explainable AI – en retning innen maskinlæring der målet er å gjøre modellenes beslutninger forståelige for mennesker, ikke bare nøyaktige. Det er noe jeg synes vi ser altfor lite av i kommersielle produkter. De fleste AI-verktøy gir deg et svar. Dette prosjektet gir deg svaret og resonneringen.

Teknisk sett kombinerer dette to systemer: prediksjonsmodellen (XGBoost) og en LLM som bruker modellens output-data som kontekst. LLM-en oversetter tall og feature importances til noe et menneske faktisk kan bruke og forstå.

ML-pipelinen bak

For de som er interessert i det tekniske: Kjernen er en XGBoost binary classifier med binary:logistic som objektiv – den forutsier altså om fighter A vinner (1) eller taper (0). Det er en standard binær klassifisering, men det interessante er feature-engineering-delen.

Typiske features i slike modeller inkluderer:

  • Striking-statistikk: Significant strikes landed per minutt, striking accuracy, defensiv rate
  • Grappling-statistikk: Takedown accuracy, submission forsøk, ground control time
  • Kamphistorikk: Vinstreak, tap mot spesifikke stiler, form de siste fem kampene
  • Fysiske attributter: Rekkevidde, høyde, alder, vektklasse
  • Stilistisk matching: Tilpasset vektklassens dominerende kampstil

Det interessante tilskuddet her er vektklasse-justeringen. I stedet for å behandle alle vektklasser likt, analyserte utvikleren hvilken kampstil som statistisk dominerer i hver divisjon, og la dette inn som en feature. Det er ikke et stort tillegg, men den typen domenekunnskapen er ofte det som skiller en 65-prosentmodell fra en 71-prosentmodell.

Infografik som viser dataflyten i XGBoost UFC-prediksjonsmodellen fra kampdata til AI-forklaring
ML-pipelinen: Kampdata (striking, takedowns, rekkevidde) inn i XGBoost-modellen, ut kommer prediksjon og AI-generert forklaring.

Hva er 71,6 prosents nøyaktighet egentlig verdt?

La oss ta det litt ned på jorda. 71,6 prosent høres kanskje ikke imponerende ut sammenlignet med AI-systemer som spiller sjakk eller Go der nøyaktigheten er nær perfekt. Men kampsport er fundamentalt annerledes.

Bookmakers – altså spillselskaper med millioner i datainnsamling og profesjonelle analytikere – ligger typisk på 60-65 prosent nøyaktighet på UFC-kamper justert for odds-marginene sine. En hobbyist med spare time og en god XGBoost-implementasjon som slår bookmakers med fem til ti prosentpoeng? Det er faktisk ganske rått.

Men det er viktig å forstå hva dette måler. Modellen er trent og testet på historiske kamper. Ekte prediksjon av fremtidige kamper – der fighterne har hemmelige treningsuker, skader som ikke er kjent, og psykologiske faktorer – er vanskeligere. 71,6 prosent på testsettet er et godt tegn, men bør valideres over tid mot faktiske fremtidige kamper.

Hva kan du lære av dette prosjektet?

Det som fascinerer meg mest her er ikke UFC-aspektet spesifikt. Det er framgangsmåten. En person med interesse for et domene (MMA) + litt fritid + tilgjengelige verktøy (XGBoost, Python, en LLM-API) = et fungerende produkt med reell verdi. Ingen bedrift, ingen team, ingen investorer.

Dette er mønsteret for «praktisk AI-læring» i 2026. Du velger et domene du faktisk bryr deg om, finner offentlige data, bygger noe konkret – og du lærer ti ganger mer enn du ville gjort ved å ta et online kurs. AI-verktøyene som trengs for noe slikt er gratis eller billige.

XGBoost er gratis og åpen kildekode. Historiske UFC-kampdata finnes på ufcstats.com. LLM-API for forklaringsteksten koster noen øre per prediksjonsforespørsel. Infrastrukturen for noe slikt kan bygges på en helg.

Selv bruker jeg Claude Code til mye av kodingen min, og det er fascinerende å se hvordan verktøykassen for «en person med en idé» har eksplodert de siste to-tre årene. Prosjekter som dette ville krevd et lite team og måneder med arbeid for fem år siden.

Er dette starten på noe større?

UFC er et interessant testcase fordi sporten er så datadrevet allerede. Ufcstats.com samler kampstatistikk helt tilbake til tidlig UFC, og UFC-organisasjonen er åpen om tall på en måte som for eksempel fotball ikke alltid er.

Men modellen peker på noe som er mye større enn UFC. Explainable AI kombinert med domene-spesifikk prediksjon er en av de mest nyttige AI-arkitekturene du kan bygge. Samme tilnærming fungerer for medisinsk diagnose, juridisk risikovurdering, finansiell analyse – alt der «hvorfor» er like viktig som «hva».

Modeller som bare leverer en sannsynlighet uten kontekst er vanskelige å stole på. Modeller som sier «her er svaret, og her er grunnen» – det er noe folk faktisk kan bruke. UFC-prediksjon er en morsom og lavrisiko arena å eksperimentere med denne tilnærmingen. Hva tenker du – er dette et mønster du ser mer av fremover?

Prosjektet er ikke publisert som åpen kildekode (i hvert fall ikke ennå ifølge Reddit-tråden), men tilnærmingen er godt dokumentert for de som vil bygge noe lignende. Startpunktet er dette GitHub-repoet med XGBoost og ELO-ratings for UFC, eller se etter ufcstats.com-datasett på Kaggle for å komme i gang.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

Meld deg på nyhetsbrevet

Få oppdateringer om AI nyhetene rett i inboxen!

Du liker kanskje denne også
Jan Sverre arbeider med Suno AI musikk-generering på datamaskinen, kreativt workspace med hodetelefoner

Suno AI – 150 Låter Testet: Hva Funker og Hva Er Bortkastet Tid

Jeg testet 150 Suno-låter og fant tydelige mønstre. Her er hva som faktisk gir kvalitet, og hva som bare kaster bort tid.
Jan Sverre med headphones og lydmikser i boardroom-møte med forvirrede executives

Suno AI Copyright 2026 – Opphavsrett og Rettigheter for AI-Musikk

Kan du tjene penger på Suno-musikk? Her er en praktisk gjennomgang av rettigheter, risiko og hva du bør avklare før publisering.
Jan Sverre riding a dinosaur in safari outfit, photorealistic AI-generated image demonstrating Nano Banana Pro capabilities

Jeg testet Nano Banana Pro: AI som faktisk skriver norsk i bilder

Endelig! En AI som kan generere norsk tekst i bilder med 94% nøyaktighet. Jeg testet Nano Banana Pro grundig – her er resultatene.
Jan Sverre sitter ved sitt kraftige AI-workstation oppsett med ultrawide skjerm og flere PC-er som kjører Ollama og lokale LLM-modeller

Ollama Guide – Kjør AI Gratis og Lokalt på Din Egen PC (2026)

Komplett guide til Ollama og lokale LLM-er på RTX 4090. Lær quantisering, Hugging Face import, beste modeller (Gemma 3, Qwen 3), GDPR-fordeler og full kostnadskontroll.