UFC-prediksjon med maskinlæring – 71,6 prosent nøyaktighet med XGBoost og AI-forklaring

Innhold Vis

En UFC-fan bygde en maskinlæringsmodell som forutsier kampvinnere med 71,6 prosents nøyaktighet – og bruker AI til å forklare hvorfor. Prosjektet dukket nylig opp på Reddit og fikk god oppmerksomhet i ML-miljøet, og jeg synes det er et godt eksempel på hva en nysgjerrig hobbyist kan få til med riktig verktøykasse.

Modellen er bygd på XGBoost – en klassisk og velprøvd gradient boosting-algoritme – og kombinerer kampstatistikk med en AI-drevet forklaringsmotor. Det er ikke bare en svart boks som sier «fighter A vinner». Den forteller deg også hvorfor modellen lander på den konklusjonen.

71,6 prosent er faktisk ganske bra for UFC-prediksjon. Kampsport er notorisk uforutsigbar – en fighter kan dominere i fire runder og tape på et enkelt slag i den femte. At en maskinlæringsmodell klarer å ligge konsekvent over 70 prosent, sier noe om at det faktisk er mønstre i dataene som lar seg fange opp.

Hva er XGBoost, og hvorfor passer det her?

XGBoost (eXtreme Gradient Boosting) er en av de mest brukte algoritmene innen maskinlæring for strukturerte data – altså tabelldata med rader og kolonner. Den vant bokstavelig talt hundrevis av Kaggle-konkurranser da den kom, og brukes fortsatt aktivt i produksjon hos mange store selskaper.

For UFC-prediksjon er det et naturlig valg. Dataene du jobber med er nettopp strukturerte: vinstrate, knockdowns, submission-forsøk, rekkevidde, alder, streaks. Ingen bilder, ingen video – bare tall og statistikk. XGBoost spiser slik data til frokost.

Det spesielt interessante her er at utvikleren justerte algoritmen til å ta hensyn til hvilken vektklasse kampen foregår i. Hver vektklasse i UFC har en dominerende kampstil – lettervekter er ofte raskere og mer striking-fokuserte, mens tungtvekkere er mer knockout-orienterte. Modellen gir en liten fordel til fighters som matcher sin vektklasses dominerende stil. Det er en elegant måte å håndtere den biologiske og stilistiske variasjonen på.

Hvordan fungerer AI-forklaringen?

Det er her prosjektet skiller seg fra de fleste akademiske UFC-prediksjonsprosjekter. I stedet for å bare levere en sannsynlighet, bruker appen en AI-modell til å generere en naturlig språkforklaring av prediksjonen.

Tenk deg at du spør: «Hvem vinner mellom fighter A og fighter B?» I stedet for å få «Fighter A: 67%», får du noe i retning av: «Fighter A har bedre striking accuracy over de siste fem kampene, og Fighter B har tapt tre av sine fire kamper mot southpaw-stances. Stilforskjellen gir Fighter A en klar fordel her.»

Dette er et godt eksempel på det som kalles explainable AI – en retning innen maskinlæring der målet er å gjøre modellenes beslutninger forståelige for mennesker, ikke bare nøyaktige. Det er noe jeg synes vi ser altfor lite av i kommersielle produkter. De fleste AI-verktøy gir deg et svar. Dette prosjektet gir deg svaret og resonneringen.

Teknisk sett kombinerer dette to systemer: prediksjonsmodellen (XGBoost) og en LLM som bruker modellens output-data som kontekst. LLM-en oversetter tall og feature importances til noe et menneske faktisk kan bruke og forstå.

ML-pipelinen bak

For de som er interessert i det tekniske: Kjernen er en XGBoost binary classifier med binary:logistic som objektiv – den forutsier altså om fighter A vinner (1) eller taper (0). Det er en standard binær klassifisering, men det interessante er feature-engineering-delen.

Typiske features i slike modeller inkluderer:

Striking-statistikk: Significant strikes landed per minutt, striking accuracy, defensiv rate
Grappling-statistikk: Takedown accuracy, submission forsøk, ground control time
Kamphistorikk: Vinstreak, tap mot spesifikke stiler, form de siste fem kampene
Fysiske attributter: Rekkevidde, høyde, alder, vektklasse
Stilistisk matching: Tilpasset vektklassens dominerende kampstil

Det interessante tilskuddet her er vektklasse-justeringen. I stedet for å behandle alle vektklasser likt, analyserte utvikleren hvilken kampstil som statistisk dominerer i hver divisjon, og la dette inn som en feature. Det er ikke et stort tillegg, men den typen domenekunnskapen er ofte det som skiller en 65-prosentmodell fra en 71-prosentmodell.

Infografik som viser dataflyten i XGBoost UFC-prediksjonsmodellen fra kampdata til AI-forklaring — ML-pipelinen: Kampdata (striking, takedowns, rekkevidde) inn i XGBoost-modellen, ut kommer prediksjon og AI-generert forklaring.

Hva er 71,6 prosents nøyaktighet egentlig verdt?

La oss ta det litt ned på jorda. 71,6 prosent høres kanskje ikke imponerende ut sammenlignet med AI-systemer som spiller sjakk eller Go der nøyaktigheten er nær perfekt. Men kampsport er fundamentalt annerledes.

Bookmakers – altså spillselskaper med millioner i datainnsamling og profesjonelle analytikere – ligger typisk på 60-65 prosent nøyaktighet på UFC-kamper justert for odds-marginene sine. En hobbyist med spare time og en god XGBoost-implementasjon som slår bookmakers med fem til ti prosentpoeng? Det er faktisk ganske rått.

Men det er viktig å forstå hva dette måler. Modellen er trent og testet på historiske kamper. Ekte prediksjon av fremtidige kamper – der fighterne har hemmelige treningsuker, skader som ikke er kjent, og psykologiske faktorer – er vanskeligere. 71,6 prosent på testsettet er et godt tegn, men bør valideres over tid mot faktiske fremtidige kamper.

Hva kan du lære av dette prosjektet?

Det som fascinerer meg mest her er ikke UFC-aspektet spesifikt. Det er framgangsmåten. En person med interesse for et domene (MMA) + litt fritid + tilgjengelige verktøy (XGBoost, Python, en LLM-API) = et fungerende produkt med reell verdi. Ingen bedrift, ingen team, ingen investorer.

Dette er mønsteret for «praktisk AI-læring» i 2026. Du velger et domene du faktisk bryr deg om, finner offentlige data, bygger noe konkret – og du lærer ti ganger mer enn du ville gjort ved å ta et online kurs. AI-verktøyene som trengs for noe slikt er gratis eller billige.

XGBoost er gratis og åpen kildekode. Historiske UFC-kampdata finnes på ufcstats.com. LLM-API for forklaringsteksten koster noen øre per prediksjonsforespørsel. Infrastrukturen for noe slikt kan bygges på en helg.

Selv bruker jeg Claude Code til mye av kodingen min, og det er fascinerende å se hvordan verktøykassen for «en person med en idé» har eksplodert de siste to-tre årene. Prosjekter som dette ville krevd et lite team og måneder med arbeid for fem år siden.

Er dette starten på noe større?

UFC er et interessant testcase fordi sporten er så datadrevet allerede. Ufcstats.com samler kampstatistikk helt tilbake til tidlig UFC, og UFC-organisasjonen er åpen om tall på en måte som for eksempel fotball ikke alltid er.

Men modellen peker på noe som er mye større enn UFC. Explainable AI kombinert med domene-spesifikk prediksjon er en av de mest nyttige AI-arkitekturene du kan bygge. Samme tilnærming fungerer for medisinsk diagnose, juridisk risikovurdering, finansiell analyse – alt der «hvorfor» er like viktig som «hva».

Modeller som bare leverer en sannsynlighet uten kontekst er vanskelige å stole på. Modeller som sier «her er svaret, og her er grunnen» – det er noe folk faktisk kan bruke. UFC-prediksjon er en morsom og lavrisiko arena å eksperimentere med denne tilnærmingen. Hva tenker du – er dette et mønster du ser mer av fremover?

Prosjektet er ikke publisert som åpen kildekode (i hvert fall ikke ennå ifølge Reddit-tråden), men tilnærmingen er godt dokumentert for de som vil bygge noe lignende. Startpunktet er dette GitHub-repoet med XGBoost og ELO-ratings for UFC, eller se etter ufcstats.com-datasett på Kaggle for å komme i gang.

UFC-prediksjon med maskinlæring – 71,6 prosent nøyaktighet med XGBoost og AI-forklaring

Neste

Poolside AI lanserer Laguna XS.2 og M.1 – spesialiserte agentic coding-modeller

Skribent

Jan Sverre Bauge

tagger

Del artikkel

Innhold Vis

Hva er XGBoost, og hvorfor passer det her?

Hvordan fungerer AI-forklaringen?

ML-pipelinen bak

Hva er 71,6 prosents nøyaktighet egentlig verdt?

Hva kan du lære av dette prosjektet?

Er dette starten på noe større?

Legg igjen en kommentar Avbryt svar

Suno AI – 150 Låter Testet: Hva Funker og Hva Er Bortkastet Tid

Suno AI Copyright 2026 – Opphavsrett og Rettigheter for AI-Musikk

Claude AI – pris, funksjoner og norsk guide (2026)

Jeg testet Nano Banana Pro: AI som faktisk skriver norsk i bilder

Afroman vant – politiet krevde 4 millioner, juryen ga dem null

PewDiePie AI Council – Da Supreme Leader ble forrÅdt av sine egne

Suno AI – 150 Låter Testet: Hva Funker og Hva Er Bortkastet Tid

Suno AI Copyright 2026 – Opphavsrett og Rettigheter for AI-Musikk

Claude AI – pris, funksjoner og norsk guide (2026)

Kaffegrut i Hagen – Slik Bruker Du Det som Gjødsel og Skadedyrbekjemper

Sterk Chili Kaffe

Stekt Kylling i Airfryer

Kaffekaramell

UFC-prediksjon med maskinlæring – 71,6 prosent nøyaktighet med XGBoost og AI-forklaring

Neste

Skribent

tagger

Del artikkel

Innhold Vis

Hva er XGBoost, og hvorfor passer det her?

Hvordan fungerer AI-forklaringen?

ML-pipelinen bak

Hva er 71,6 prosents nøyaktighet egentlig verdt?

Hva kan du lære av dette prosjektet?

Er dette starten på noe større?

Legg igjen en kommentar Avbryt svar

Meld deg på nyhetsbrevet

Du liker kanskje denne også