Google lanserte Gemini 3 Flash i desember 2025, og prisene får konkurrentene til å se dyre ut. For 50 cent per million tokens får du en AI-modell som faktisk slår dyrere konkurrenter på koding. Claude Sonnet 4.5 koster $3.00 – seks ganger mer. GPT-5.2? 3.5 ganger dyrere.

Dette er ikke bare en billig modell. Gemini 3 Flash scorer 78% på SWE-bench Verified, en benchmark som måler hvor godt AI løser faktiske GitHub-issues. Det er bare 2.9 prosentpoeng bak Claude Opus 4.5 (80.9%) – men koster en brøkdel.

Og her kommer det interessante: Flash slår sin egen storebror, Gemini 3 Pro, på koding. Pro koster fire ganger mer og scorer 76.2% på samme benchmark. Billigere modell. Bedre på koding.

Prisrevolusjonen som endrer reglene

La oss være helt konkrete om hva disse prisene betyr i praksis.

Gemini 3 Flash koster $0.50 per million input tokens. Det høres kanskje abstrakt ut, men tenk på det sånn: Du kan sende inn cirka 750,000 ord for en halv dollar. Det er omtrent ti bøker verdt med tekst.

Claude Sonnet 4.5 tar $3.00 for samme mengde. GPT-5.2 koster $1.75. Gemini 3 Pro ligger på $2.00.

Prissammenligning AI-modeller - Gemini 3 Flash vs Claude Sonnet vs GPT-5.2

For utviklere som bruker AI daglig blir dette betydelig. Hvis du kjører hundre forespørsler om dagen med komplekse kodesamtaler – si 10,000 tokens per samtale – bruker du én million tokens på ti dager.

Med Flash: $0.50 per ti dager = $1.50 per måned.
Med Claude Sonnet: $3.00 per ti dager = $9.00 per måned.
Med GPT-5.2: $1.75 per ti dager = $5.25 per måned.

Og det er bare input-tokens. Output-kostnader kommer i tillegg, men Flash holder samme prisfordel der også.

Men greia er – pris betyr ingenting hvis kvaliteten er dårlig. Så hvordan presterer Flash egentlig?

Koding på høyt nivå

SWE-bench Verified er industry standard for å måle AI-modellers evne til å løse faktiske programmeringsproblemer. Ikke teoretiske oppgaver. Faktiske GitHub-issues fra open source-prosjekter.

Resultatene:

Claude Opus 4.5: 80.9%
GPT-5.2: 80.0%
Gemini 3 Flash: 78.0%
Gemini 3 Pro: 76.2%

Flash ligger to prosentpoeng bak GPT-5.2, men koster 71% mindre. Den ligger 2.9 prosentpoeng bak Claude Opus, men koster 83% mindre.

Og den slår Gemini 3 Pro – som koster fire ganger mer.

Dette er ikke den eneste benchmarken hvor Flash imponerer. MMMU Pro (multimodal reasoning) viser 81.2%, state of the art. GPQA Diamond, som tester PhD-level forståelse, gir 90.4%. Humanity’s Last Exam, designet for å være ekstremt vanskelig, gir 33.7%.

På de fleste benchmarks matcher eller slår Flash sin egen storebror Pro.

Logan Kilpatrick fra Google sa det sånn: «Gemini 3 Flash is the new default for vibe coding.» Han hevder den slår in-house modeller fra Cursor, Windsurf, og Devon – verktøy bygget spesifikt for koding.

Jeg har ikke testet alle disse påstandene selv, men tallene fra uavhengige benchmarks bekrefter i hvert fall at Flash ikke er en budsjettmodell med budsjettytelse. Dette er en seriøs kodingsmodell til budsjettpriser.

Hastighet som faktisk betyr noe

Pris og kvalitet er viktig. Men hastighet? Det påvirker hvordan du faktisk jobber.

Google hevder Flash er tre ganger raskere enn Gemini 2.5 Pro. I praktiske tester bygde Flash en weather app på 24 sekunder. Pro brukte 67 sekunder. En 3D terrain-app? Flash: 15 sekunder. Pro: 45 sekunder.

Det er ikke bare rå prosesseringshastighet. Flash bruker også 30% færre tokens enn 2.5 Pro for samme oppgave. Færre tokens betyr lavere kostnader og raskere respons.

Når du sitter og prototyper, itererer, tester ideer – da merker du forskjellen mellom 15 sekunder og 45 sekunder. Det høres kanskje lite ut, men over hundre iterasjoner sparer du 50 minutter. Over tusen iterasjoner? Åtte timer.

Utvikler som bruker Gemini 3 Flash for rask koding med AI-assistanse

Hastighet endrer flyten i arbeidet. Med treg respons tenker du «skal jeg virkelig vente på dette?». Med rask respons bare kjører du. Terskelen for å teste noe forsvinner.

Det er der Flash skinner – i rapid prototyping, iterativ utvikling, eksperimentering.

Tilgjengelighet for alle

Her blir det enda bedre. Gemini 3 Flash er gratis i Gemini-appen.

Ikke «gratis med begrensninger». Ikke «gratis i to uker». Bare gratis. Globalt tilgjengelig. Flash er nå standardmodellen i Gemini-appen, den som erstattet Gemini 2.5 Flash.

Du finner den også i:

  • AI Studio (Googles eksperimenteringsplattform)
  • Gemini CLI (kommandolinje-verktøy)
  • Android Studio (for Android-utvikling)
  • Google AI Mode i Search

For utviklere betyr dette at du kan teste Flash gratis før du betaler for API-tilgang. For hobbyister og studenter betyr det at du får tilgang til en av de beste kodingsmodellene uten kredittkort.

Claude Sonnet 4.5? $20/måned for Pro-abonnement, eller API-kostnader.
GPT-5.2? ChatGPT Plus til $20/måned, eller API.
Gemini 3 Flash? Gratis. Akkurat nå.

Dette senker terskelen dramatisk for folk som vil lære AI-assistert koding.

Hvem bør bruke Gemini 3 Flash?

Flash er ikke beste valg for alle situasjoner. Men den er perfekt for flere bruksområder.

Kostnadseffektivitet: Hvis du kjører høyfrekvente workflows – mange forespørsler daglig – sparer Flash deg betydelige beløp. Startups, hobbyprosjekter, studenter.

Multimodale oppgaver: Flash scorer state of the art på MMMU Pro. Den håndterer kombinasjoner av tekst, kode, og visuelle inputs bedre enn de fleste konkurrenter.

Rapid prototyping: Hastigheten gjør Flash ideell når du skal teste konsepter raskt. Build, test, iterer, repeat. Lav responstid holder flyten oppe.

Iterativ utvikling: Når du trenger mange små justeringer, mange forespørsler, lav kostnad per forespørsel – Flash vinner.

Hvor passer Flash ikke?

Lange agent-kjøringer: Claude Sonnet 4.5 er bedre for langvarige, komplekse refaktoreringer hvor modellen må holde kontekst over tid.

Frontend/UI-kode: GPT-5.2 scorer fortsatt høyere på visse UI-oppgaver, og noen utviklere foretrekker dens tilnærming til frontend-kode.

Sikkerhetskritisk kode: Hvis du trenger ekstremt høy presisjon på sikkerhet, kan de dyreste modellene fortsatt være verdt ekstra kostnaden.

Men for de aller fleste utviklere, de aller fleste oppgaver? Flash leverer 90-95% av kvaliteten til 15-20% av prisen.

Konklusjon

Google har endret spillet med Gemini 3 Flash. Ikke ved å lage den beste AI-modellen på markedet – Claude Opus 4.5 scorer fortsatt høyest på SWE-bench. Men ved å levere 96% av ytelsen til 17% av prisen.

78% på SWE-bench Verified er imponerende. State of the art på multimodal reasoning er imponerende. Tre ganger raskere enn forgjengeren er imponerende.

Men 50 cent per million tokens – det er revolusjonerende.

For norske utviklere, studenter, hobbyister, små bedrifter – dette åpner dører. Du trenger ikke lenger velge mellom kvalitet og kostnad. Du får begge deler.

Jeg sier ikke at Flash er perfekt. Claude Sonnet har sine styrker. GPT-5.2 også. Men hvis du skal velge én modell å starte med, én modell å bruke som daily driver for koding – Gemini 3 Flash er vanskelig å slå akkurat nå.

Gratis i Gemini-appen. Billigst på API. Rask. God på koding. Multimodal.

Tallene lyver i hvert fall ikke.

Les: Google Gemini – komplett norsk guide (2026).

1 kommentar
Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

Meld deg på nyhetsbrevet

Få oppdateringer om AI nyhetene rett i inboxen!

Du liker kanskje denne også
Jan Sverre arbeider med Suno AI musikk-generering på datamaskinen, kreativt workspace med hodetelefoner

Suno AI – 150 Låter Testet: Hva Funker og Hva Er Bortkastet Tid

Jeg testet 150 Suno-låter og fant tydelige mønstre. Her er hva som faktisk gir kvalitet, og hva som bare kaster bort tid.
Jan Sverre med headphones og lydmikser i boardroom-møte med forvirrede executives

Suno AI Copyright 2026 – Opphavsrett og Rettigheter for AI-Musikk

Kan du tjene penger på Suno-musikk? Her er en praktisk gjennomgang av rettigheter, risiko og hva du bør avklare før publisering.
Jan Sverre riding a dinosaur in safari outfit, photorealistic AI-generated image demonstrating Nano Banana Pro capabilities

Jeg testet Nano Banana Pro: AI som faktisk skriver norsk i bilder

Endelig! En AI som kan generere norsk tekst i bilder med 94% nøyaktighet. Jeg testet Nano Banana Pro grundig – her er resultatene.
Jan Sverre sitter ved sitt kraftige AI-workstation oppsett med ultrawide skjerm og flere PC-er som kjører Ollama og lokale LLM-modeller

Ollama Guide – Kjør AI Gratis og Lokalt på Din Egen PC (2026)

Komplett guide til Ollama og lokale LLM-er på RTX 4090. Lær quantisering, Hugging Face import, beste modeller (Gemma 3, Qwen 3), GDPR-fordeler og full kostnadskontroll.