Jan Sverre Bauge ser på Anthropic Opus 4.8 og Dynamic Workflows-lanseringen

Anthropic henter 65 milliarder og slipper Opus 4.8 – hva betyr det for deg?

Anthropic henter 65 milliarder dollar og lanserer Claude Opus 4.8 med Dynamic Workflows. Her er hva som faktisk er nytt – og hva det koster.
Jan Sverre ser på ytelsestall fra BeeLlama DFlash på RTX 3090 - 177 tokens per sekund

Slik får du nesten 5x raskere lokal AI på én RTX 3090 – BeeLlama v0.2.0 forklart

BeeLlama v0.2.0 gir opptil 4,9x raskere tekstgenerering med Gemma 4 31B og Qwen3.6 27B på én enkelt RTX 3090 – uten ekstra maskinvare.
Jan Sverre undersøker MiniCPM5-1B som kjører lokalt på en liten ARM-enhet

MiniCPM5-1B – reasoning og tool use på 1 milliard parametere

MiniCPM5-1B er en 1B-modell med hybrid reasoning, 131 000 tokens kontekst og tool use – og kjører lokalt via Ollama. Her er hva den faktisk kan.
Jan Sverre ved skrivebordet med Claude AI-chat på skjermen

Hva er Claude AI? Komplett guide for nybegynnere (2026)

Hva er Claude AI? En enkel og ærlig guide: hvem som laget det, hvilke versjoner som finnes, hva det koster, og hvordan du kommer i gang i dag.
Jan Sverre studerer bildegenerering-benchmark med fem AI-modeller på skjermvegg

Klein-4B, SANA 1.5, Qwen Image og Z-Image Turbo – hvem vinner bildeduellen?

Detaljert sammenligning av fem bildegenererings-modeller på 192 prompts: Klein-4B, Nucleus-Image, Z-Image Turbo, SANA 1.5 og Qwen Image. Hvem leverer best kvalitet, hastighet og verdi i 2026?
Jan Sverre undersøker AMD RDNA3 GPU-hardware med hipEngine benchmark-resultater på skjermen

hipEngine – ROCm-native inference engine for AMD RDNA3 og Strix Halo

hipEngine er et nytt open source inference engine for AMD RDNA3-GPUer – kjører Qwen3.6 35B på 103 tok/s på RX 7900 XTX uten PyTorch-overhead. 120+ egenskrevne HIP-kjerner, 50% raskere prefill enn llama.cpp ved 128K kontekst.
Jan Sverre ser på en nettleser som styres autonomt av Microsofts Fara1.5 AI-agent

Fara1.5 – Microsofts nettleser-AI slår OpenAI Operator med 14 prosentpoeng

Microsoft Research har sluppet Fara1.5 – en familie med nettleser-AI i tre størrelser (4B/9B/27B) som scorer 72% på Online-Mind2Web og slår OpenAI Operator med 14 prosentpoeng. Her er hva du trenger å vite om treningsdataen, FaraGen1.5-pipelinen og tilgjengeligheten.
Jan Sverre ser på holografisk Qwen3-display i verkstedet - skeptisk men nysgjerrig blikk

Qwen3 open weight er ute – og LocalLLaMA kaller det ny toppmodell

Alibabas Qwen3 open weight-modell er tilgjengelig for lokal kjøring. Apache 2.0-lisens, 256K kontekst, thinking mode – og LocalLLaMA-fellesskapet er begeistret.
Jan Sverre i tolkeboks med sanntidsoversettelse på skjerm - Qwen3.5-LiveTranslate-Flash

Qwen3.5-LiveTranslate-Flash – sanntidsoversettelse på 2,8 sekunder

Alibabas Qwen3.5-LiveTranslate-Flash oversetter tale og video på 2,8 sekunder på tvers av 60 språk – med stemmekloning, leppeavlesning og domenespesifikk terminologi.
Jan Sverre undersøker holografisk visualisering av Nemotron-Labs-Diffusion sine tre dekodingsmodus i NVIDIA serverrom

Nemotron-Labs-Diffusion – NVIDIAs språkmodell med 6× gjennomstrøm

NVIDIA har sluppet Nemotron-Labs-Diffusion – en språkmodell som kombinerer tre dekodingsmodus i én arkitektur og leverer 6× høyere gjennomstrøm enn Qwen3-8B.