Moonshot AI har sluppet Kimi K2.5 — en åpen kildemodell som dominerer benchmarks og koster en brøkdel av konkurrentene.

Kimi K2.5 er nå offisielt ute, og resultatene er oppsiktsvekkende. Den kinesiske AI-modellen slår både GPT 5.2, Claude 4.5 Opus og Gemini 3 Pro på flere viktige benchmarks — spesielt når det gjelder agentoppgaver.

Hva er Kimi K2.5?

Kimi K2.5 er en åpen kildemodell fra det kinesiske selskapet Moonshot AI. Den er trent på omtrent 15 billioner tokens med blandet visuelt og tekstlig innhold, og er designet for å være spesielt god på:

  • Koding — konkurransedyktig med de beste modellene
  • Visuelle oppgaver — natively multimodal
  • Agent swarms — kan koordinere opptil 100 sub-agenter parallelt

Benchmarks som imponerer

Det som virkelig skiller Kimi K2.5 fra konkurrentene er ytelsen på agentoppgaver:

BrowseComp (nettsurfing-benchmark): 74.9% — langt foran GPT 5.2 og Claude 4.5 Opus som ligger rundt 50-60%.

Deep Search QA: Slår alle toppmodellene.

SWE Verified (koding): 76.8% — tett bak Claude (80.9%) og GPT 5.2 (80%), men foran Gemini 3 Pro.

På visuelle oppgaver som videoforståelse og OCR er modellen helt i toppsjiktet, og slår faktisk Claude 4.5 Opus på flere benchmarks.

Agent Swarms — det virkelig interessante

Den mest spennende funksjonen er kanskje agent swarm-kapasiteten. Kimi K2.5 kan:

  • Dele opp komplekse oppgaver i mindre deler
  • Delegere til opptil 100 sub-agenter
  • Koordinere opptil 1500 tool calls parallelt
  • Redusere kjøretiden med opptil 80% sammenlignet med en enkelt agent

Dette er trent inn i modellen gjennom det de kaller «Parallel Agent Reinforcement Learning» (PARL). I praksis betyr det at modellen kan orkestrere et helt team av spesialiserte agenter — en AI-forsker, en fakta-sjekker, en webutvikler — og koordinere arbeidet deres.

Prisen er sjokkerende lav

Her kommer det virkelig interessante. Kimi K2.5 koster $0.60 per million input-tokens og $3.00 per million output-tokens. Til sammenligning koster Claude 4.5 Opus henholdsvis $15 og $75 per million tokens.

Kimi K2.5 koster altså en brøkdel av konkurrentene — og slår dem på flere benchmarks.

Haken: Størrelse og tilgjengelighet

Modellen er på omtrent 1 billion parametre og krever rundt 632 GB VRAM for å kjøre lokalt. Det betyr at de aller fleste må bruke API-et til Moonshot AI — som betyr at dataene dine sendes til kinesiske servere.

For de som er opptatt av personvern, er dette et viktig moment. Quantiserte versjoner vil sannsynligvis komme fra community-en, noe som kan gjøre det mulig å kjøre modellen lokalt på kraftige Mac Studios eller lignende.

Min vurdering

Kimi K2.5 representerer et betydelig fremskritt for åpne AI-modeller. At en kinesisk aktør nå leverer bedre ytelse enn både OpenAI og Anthropic på agentoppgaver — til en brøkdel av prisen — er bemerkelsesverdig.

Spesielt agent swarm-funksjonaliteten er interessant. For de som bruker verktøy som Clawdbot eller lignende, kan dette potensielt være en game-changer for komplekse arbeidsflyter.

Men spørsmålet om datasikkerhet og kinesiske servere er noe man må ta stilling til selv. For sensitive oppgaver ville jeg ventet på quantiserte versjoner som kan kjøres lokalt.

Uansett: Konkurransen i AI-markedet har aldri vært hardere — og det er vi brukere som vinner på det.

2 kommentarer
Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

Meld deg på nyhetsbrevet

Få oppdateringer om AI nyhetene rett i inboxen!

Du liker kanskje denne også
Jan Sverre styrer et digitalt kontrollpanel omgitt av Claude AI-symboler og glødende lysstriper i et mørkt rom

Claude AI – pris, funksjoner og norsk guide (2026)

Alt om Claude AI i 2026 – priser i norske kroner, Claude Pro vs Max, Claude Code, og ærlig sammenligning med ChatGPT. Komplett norsk guide fra en som bruker Claude daglig.
Gpt53 codex

OpenAI svarer med GPT-5.3 Codex — selvforbedrende AI som bygget seg selv

Innhold Vis Hva er GPT-5.3 Codex?Fra kodeskriver til digital arbeiderKappløpet intensiveresMer drama…
Jan Sverre Bauge holder en gammel stovete eske med gulnede dikt fra sin tipp-tipp-oldefar Gustav Johan Carlen

Min tipp-tipp-oldefars glemte dikt – funnet i en støvete eske

Min søster fant 33 håndskrevne dikt i en støvete eske i garasjen. Forfatteren var Gustav Johan Carlen – vår tipp-tipp-oldefar, en norsk tater som levde på 1800-tallet. Hans ord gir et sjeldent innblikk i livet som reisende i Norge.
Jan Sverre Bauge jobber med LTX Video 2 AI-videogenerering i sitt hjemmestudio

LTX Video 2: Den lokale video-AI-modellen som faktisk fungerer

LTX Video 2 er en open source video-AI som kjører lokalt på forbruker-hardware. Jeg testet den ved å lage en komplett AI-generert skrekkhistorie.