Mellum2 jetbrains featured v2

Mellum2 fra JetBrains – hva er det og trenger du det som utvikler?

JetBrains har sluppet Mellum2 – en 12B MoE-modell laget for rask kodeassistanse og multi-modell workflows. Her er det du trenger å vite.
Jan Sverre ser på visualisering av MiniMax M3 sparse attention-arkitektur med 1 million tokens kontekst

MiniMax M3 – er dette den beste åpen-vekt-modellen for lang kontekst og AI-koding?

MiniMax M3 lover 1 million tokens kontekst, 59% på SWE-Bench og innebygd multimodalitet. Her er hva det faktisk betyr for deg.
Jan Sverre i robotikklaboratorium med NVIDIA Cosmos 3 AI-modell

Hva er NVIDIA Cosmos 3 – og hva betyr det for robotikk?

NVIDIA Cosmos 3 er den første åpne omni-modellen for Physical AI. Her er hva den faktisk kan gjøre for robotikk og autonome systemer – og hvorfor det er interessant.
Jan Sverre stirrer på OpenRouter-rangeringer dominert av det mystiske Hy3 fra Tencent

Hva er Hy3 – og hvorfor topper den OpenRouter-rangeringene uten at noen snakker om det?

Hy3 fra Tencent topper OpenRouter-rangeringene i mai 2026 med over 50 prosent margin over Claude – men ingen vet hvem som bruker den. Her er det vi vet om mysteriet.
Jan Sverre Bauge ser på Anthropic Opus 4.8 og Dynamic Workflows-lanseringen

Anthropic henter 65 milliarder og slipper Opus 4.8 – hva betyr det for deg?

Anthropic henter 65 milliarder dollar og lanserer Claude Opus 4.8 med Dynamic Workflows. Her er hva som faktisk er nytt – og hva det koster.
Jan Sverre lent tilbake i stolen med 91 millioner sparte Claude-tokens på skjermen

Slik sparer du Claude-tokens uten å gjøre noe

Claude Code har innebygd prompt caching som sparer 90% på tokens automatisk. Her er hva som faktisk skjer, og tre vaner som gjør det enda bedre.
Jan Sverre med Claude Opus 4.8 dynamic workflows og fast mode i Claude Code

Claude Opus 4.8: hva betyr dynamic workflows og fast mode for deg?

Claude Opus 4.8 er ute i research preview med dynamic workflows og fast mode. Her er hva du faktisk kan bruke det til – og hva det koster.
Jan Sverre sammenligner priser på frontier-AI versus lokal AI

Er frontier-AI for dyrt? Slik beregner du om lokal AI lønner seg

Prisen på GPT-5.5 er tredoblet på åtte måneder. Her er regnestykket som avgjør om lokal AI og open source er verdt overgangen for deg.
Memo ai jan sverre minnemodell

Kan AI lære nytt uten å glemme det gamle? MEMO har et svar

MEMO er et rammeverk som lar AI-modeller lære ny kunnskap uten dyre omtreninger eller at de glemmer det de kan fra før. Her er hva det betyr.
Jan Sverre ser på ytelsestall fra BeeLlama DFlash på RTX 3090 - 177 tokens per sekund

Slik får du nesten 5x raskere lokal AI på én RTX 3090 – BeeLlama v0.2.0 forklart

BeeLlama v0.2.0 gir opptil 4,9x raskere tekstgenerering med Gemma 4 31B og Qwen3.6 27B på én enkelt RTX 3090 – uten ekstra maskinvare.