North Mini Code kjører på én GPU – det er hele poenget

Innhold Vis

North Mini Code 1.0 er Coheres første rene kodingsmodell, og den er laget for å kjøre uten en hel serverpark. Med 30 milliarder totale parametre, men bare 3 milliarder aktive per token, passer den på én enkelt H100 – noe som åpner for selvhosting på et realistisk budsjett.

Cohere kaller det en «sovereign AI»-modell, som er en fancy måte å si at du ikke trenger å sende koden din til OpenAI eller Anthropic for å få noe skikkelig ut av AI-assistert utvikling. Modellen er tilgjengelig på Hugging Face under Apache 2.0-lisens, og kan også nås via OpenRouter, Coheres eget API og Model Vault.

Men hva betyr dette i praksis for deg som faktisk skal bruke den? La oss gå gjennom det som faktisk er interessant her.

Hva er Mixture-of-Experts, og hvorfor er det viktig her?

North Mini Code er bygget på en sparse Mixture-of-Experts-arkitektur (MoE). Det betyr at modellen har 128 eksperter totalt, men bare 8 av dem aktiveres per token under inferens. Resultatet er at den totale modellvekten på 30B parametre aldri brukes på én gang – bare 3B er aktive i hvert steg.

For deg som vil hoste modellen selv betyr dette én ting konkret: du trenger én H100 i FP8-presisjon, ikke en cluster av dem. Det er fortsatt ikke billig maskinvare, men det er et realistisk mål for bedrifter som vil unngå å sende sensitiv kode til tredjeparts-APIer.

Kontekstvinduet på 256K tokens – og maks generering på 64K tokens – er heller ikke søtt. Det betyr at modellen kan holde store kodebaser i hodet under en samtale, noe som er kritisk for agentic coding-oppgaver der den skal forstå arkitektur på tvers av filer.

Illustrasjon av sparse Mixture-of-Experts arkitektur der bare 8 av 128 noder er aktive samtidig — MoE-arkitektur: bare 8 av 128 eksperter aktiveres per token – det er nøkkelen til effektiviteten

Hva mener Cohere med «agentic coding»?

North Mini Code er ikke bare en kode-autofullfører. Cohere har designet den spesifikt for tre ting: kodegenerering, agentic software engineering og terminal-oppgaver. Modellen støtter native tool use og «interleaved thinking» – den kan altså tenke gjennom et problem og bruke verktøy underveis.

I praksis betyr det at modellen er laget for å fungere som en sub-agent i en større pipeline. Du kan la den håndtere en spesifikk del av en utviklingsoppgave – si, kartlegge arkitekturen i et repository, flagge potensielle problemer i en pull request, eller kjøre og feilsøke kommandolinjeskript.

Det er dette som skiller den fra generelle modeller. En Claude eller GPT-4o kan også skrive kode, men de er ikke optimalisert for å leve i et agent-system der de mottar og utfører oppgaver automatisk. North Mini Code er bygget for den arbeidsflaten fra start.

Hvis du allerede bruker verktøy som Cog for vedvarende minne i Claude Code, er dette typen modell som ville passe naturlig inn som en billigere, selvhostet sub-agent for rutinemessige kodeoppgaver.

Hva koster det, og hvem er det for?

Selve modellvektene er gratis under Apache 2.0-lisens – du kan laste dem ned, bruke dem kommersielt, og endre dem. Hugging Face har lagt til ikke-kommersielle restriksjoner på sin versjon av distribusjonen, så sjekk lisensvilkårene der hvis det er aktuelt for deg.

Via OpenRouter kan du teste modellen via API uten å sette opp din egen infrastruktur. Det er en grei vei inn hvis du vil evaluere den opp mot for eksempel Zed og OpenRouter som alternativ til Claude Code Max.

For selvhosting er hardware-kravet det reelle kostnadspunktet. En H100 kan leies via skyleverandører for alt fra noen hundre til over tusen dollar i måneden avhengig av bruksmønster. For en bedrift som allerede behandler sensitiv kode og har compliance-krav, kan det regnestykket gå opp.

NVIDIA H100 GPU med teal-blå glow, produktfotografi, representerer minimumskravet for å kjøre North Mini Code lokalt — Én H100 er minimumet – krevende, men langt mer realistisk enn en hel GPU-cluster

Hva er det faktisk ikke bra til?

North Mini Code er en ren tekstmodell – ingen bilder, ingen multimodalitet. Det betyr at UI-relatert koding, der du vil at modellen skal se et skjermbilde og skrive CSS for det, ikke er i kortene.

Modellen er heller ikke laget for generell bruk. Spør den om å skrive en rapport, hjelpe med markedsføring, eller resonnere om politikk – og du vil ikke få den beste opplevelsen. Det er en spesialistmodell, og den er ærlig om det.

For de fleste vanlige brukere er den nok ikke riktig verktøy. Hvis du skriver kode innimellom og ikke har behov for selvhosting, vil du få mer ut av Claude Sonnet via API eller en ferdig kodingsassistent. North Mini Code er for utviklingsmiljøer og bedrifter som faktisk bygger agentpipelines.

Det er verdt å nevne at Poolside AI lanserte sine egne agentic coding-modeller tidligere i år, og konkurransen i dette segmentet hardner til. North Mini Code er Coheres svar på den trenden – og det at de slipper vektene åpent er et klart signal om hvem de vil nå.

Sammenhengen med Coheres Command A+ og hva det sier om strategien

Cohere har en interessant posisjon i AI-landskapet. De har Command A+ 218B som flaggskip og Cohere Transcribe for transkribering. North Mini Code passer inn i det som ser ut som en tydelig strategi: enterprise-kunder som vil hoste alt selv, i jurisdiksjoner der data ikke kan forlate landet.

Det er smart posisjonering. De store modellene fra OpenAI og Anthropic er kraftige, men de kjører bare i USA og hos europeiske underleverandører. For bank, helse og forsvar er det et reelt hinder. En Apache 2.0-lisensiert kodingsmodell som passer på én GPU gir disse kundene et reelt alternativ.

Spørsmålet er om 3B aktive parametre er nok til at resultatene faktisk holder mål i produksjon. Det vet vi ikke før noen tester det skikkelig. Cohere oppgir tall fra egne evalueringer, men jeg tar dem med en klype salt – vi har sett kompakte modeller overraske positivt før, og vi har sett dem skuffe like overraskende.

Ofte stilte spørsmål

Kan jeg bruke North Mini Code gratis?

Modellvektene er gratis under Apache 2.0-lisens og kan lastes ned fra Hugging Face. Du kan også teste den gratis via OpenCode og Hugging Face Space. For API-bruk via Coheres eget API eller OpenRouter gjelder egne priser.

Trenger jeg en H100 for å kjøre North Mini Code?

Cohere oppgir én H100 i FP8-presisjon som minimum for selvhosting. Det er high-end maskinvare, men bare én GPU – noe som er langt mer tilgjengelig enn modeller som krever hele clusters. Skybasert H100-leie finnes fra flere leverandører.

Er North Mini Code bedre enn Claude eller GPT-4o til koding?

Det er ikke det riktige sammenligningspunktet. North Mini Code er laget spesifikt for agentic coding i selvhostede miljøer. For enkle kodeoppgaver vil Claude Sonnet eller GPT-4o gjerne gjøre det minst like bra. Styrken her er selvhosting, 256K kontekst og native tool use i agent-pipelines.

Hva er forskjellen på North Mini Code og vanlige kodingsassistenter?

En vanlig kodingsassistent hjelper deg mens du skriver. North Mini Code er designet for å fungere som en autonom agent – den kan motta oppgaver, utforske en kodebase, kjøre kommandoer og levere resultater uten at et menneske sitter og styrer hvert steg. Det er et annet bruksmønster enn GitHub Copilot-lignende verktøy.

North Mini Code kjører på én GPU – det er hele poenget

Skribent

Jan Sverre Bauge

tagger

Del artikkel

Innhold Vis

Hva er Mixture-of-Experts, og hvorfor er det viktig her?

Hva mener Cohere med «agentic coding»?

Hva koster det, og hvem er det for?

Hva er det faktisk ikke bra til?

Sammenhengen med Coheres Command A+ og hva det sier om strategien

Ofte stilte spørsmål

Legg igjen en kommentar Avbryt svar

Suno AI Copyright 2026 – Opphavsrett og Rettigheter for AI-Musikk

Claude AI – pris, funksjoner og norsk guide (2026)

Google NotebookLM

GPT-5.2: Jeg testet OpenAIs nyeste modell – her er hva som faktisk fungerer

Afroman vant – politiet krevde 4 millioner, juryen ga dem null

PewDiePie AI Council – Da Supreme Leader ble forrÅdt av sine egne

Suno AI – 150 Låter Testet: Hva Funker og Hva Er Bortkastet Tid

Suno AI Copyright 2026 – Opphavsrett og Rettigheter for AI-Musikk

Claude AI – pris, funksjoner og norsk guide (2026)

Kaffegrut i Hagen – Slik Bruker Du Det som Gjødsel og Skadedyrbekjemper

Sterk Chili Kaffe

Stekt Kylling i Airfryer

Kaffekaramell

North Mini Code kjører på én GPU – det er hele poenget

Skribent

Jan Sverre Bauge

tagger

Del artikkel

Innhold Vis

Hva er Mixture-of-Experts, og hvorfor er det viktig her?

Hva mener Cohere med «agentic coding»?

Hva koster det, og hvem er det for?

Hva er det faktisk ikke bra til?

Sammenhengen med Coheres Command A+ og hva det sier om strategien

Ofte stilte spørsmål

Legg igjen en kommentar Avbryt svar

Meld deg på nyhetsbrevet

Du liker kanskje denne også

Afroman vant – politiet krevde 4 millioner, juryen ga dem null

PewDiePie AI Council – Da Supreme Leader ble forrÅdt av sine egne

Suno AI – 150 Låter Testet: Hva Funker og Hva Er Bortkastet Tid

Suno AI Copyright 2026 – Opphavsrett og Rettigheter for AI-Musikk

Claude AI – pris, funksjoner og norsk guide (2026)