Mellum2 jetbrains featured v2

Mellum2 fra JetBrains – hva er det og trenger du det som utvikler?

JetBrains har sluppet Mellum2 – en 12B MoE-modell laget for rask kodeassistanse og multi-modell workflows. Her er det du trenger å vite.
Jan Sverre stirrer på OpenRouter-rangeringer dominert av det mystiske Hy3 fra Tencent

Hva er Hy3 – og hvorfor topper den OpenRouter-rangeringene uten at noen snakker om det?

Hy3 fra Tencent topper OpenRouter-rangeringene i mai 2026 med over 50 prosent margin over Claude – men ingen vet hvem som bruker den. Her er det vi vet om mysteriet.
Jan Sverre sammenligner priser på frontier-AI versus lokal AI

Er frontier-AI for dyrt? Slik beregner du om lokal AI lønner seg

Prisen på GPT-5.5 er tredoblet på åtte måneder. Her er regnestykket som avgjør om lokal AI og open source er verdt overgangen for deg.
Memo ai jan sverre minnemodell

Kan AI lære nytt uten å glemme det gamle? MEMO har et svar

MEMO er et rammeverk som lar AI-modeller lære ny kunnskap uten dyre omtreninger eller at de glemmer det de kan fra før. Her er hva det betyr.
Jan Sverre i tolkeboks med sanntidsoversettelse på skjerm - Qwen3.5-LiveTranslate-Flash

Qwen3.5-LiveTranslate-Flash – sanntidsoversettelse på 2,8 sekunder

Alibabas Qwen3.5-LiveTranslate-Flash oversetter tale og video på 2,8 sekunder på tvers av 60 språk – med stemmekloning, leppeavlesning og domenespesifikk terminologi.
Jan Sverre i et futuristisk kontrollrom med flytende AI-agent-noder fra Google Antigravity 2.0

Google Antigravity 2.0 – agent-plattformen som erstatter Gemini CLI

Google lanserte Antigravity 2.0 på I/O 2026 – en standalone agent-plattform med CLI, SDK og Managed Agents basert på Gemini 3.5 Flash. Her er hva det faktisk innebærer og hva det koster.
Jan Sverre ved skrivebordet sent på kvelden, studerer Needle 26M modellen på skjermen mens en liten chip-illustrasjon lyser opp rommet

Needle – 26M parameter modell distillerer Gemini tool calling til forbrukerhardware

Needle er en 26 millioner parameter modell fra Cactus Compute som distillerer Gemini 3.1 tool calling ned i en «Simple Attention Network». Kjører 6 000 tokens per sekund på forbrukerhardware. MIT-lisens, open source.
Mann i hettegenser som systematisk bygger opp en prompting-struktur med JSON-kode og sjekklister rundt seg

Systematisk prompting – fem teknikker for pålitelige AI-svar

Fem teknikker som gjør AI-svar pålitelige nok for produksjonssystemer: rolle-spesifikk prompting, negativ prompting, JSON-strukturerte svar, ARQ og verbalized sampling. Ingen modelltrening nødvendig – alt skjer i prompten.
Jan Sverre utforsker IBM Granite 4.1 sine tre open source AI-modeller på 3B, 8B og 30B parametere

IBM Granite 4.1 – open source AI-modeller i 3B, 8B og 30B

IBM Granite 4.1 er tre nye open source AI-modeller (3B, 8B og 30B) med Apache 2.0-lisens, 512K tokens kontekstvindu og FP8-kvantisering. 8B-modellen matcher tidligere 32B MoE-modell – og kjører på vanlig gaming-GPU.
Vs alien

GPT Images 2 testet – pris, kvalitet og sammenligning (2026)

Test av OpenAIs nye bildemodell GPT Images 2: pris per bilde, typografi-kvalitet, content policy og ærlig sammenligning mot Nano Banana 2, Flux og Midjourney.