Zamba2-VL er en rask vision-language-modell du kan kjøre lokalt – her er hva den faktisk gjør
Zyphra har sluppet Zamba2-VL, en hybrid Mamba2/Transformer-modell som analyserer bilder og tekst. Praktisk guide til hva den gjør og om den er verdt å kjøre lokalt.
12. juni 2026
25 visninger
5 minutter lesetid
North Mini Code kjører på én GPU – det er hele poenget
Coheres nye kodingsmodell North Mini Code er en 30B MoE-modell med bare 3B aktive parametre – laget for å kjøre på én H100 og håndtere agentic coding.
11. juni 2026
22 visninger
5 minutter lesetid
DiffusionGemma er raskere enn Gemma 4 – men ikke klar for produksjon
DiffusionGemma er Googles 26B eksperimentelle modell som genererer tekst 4x raskere enn Gemma 4 – men med lavere kvalitet. Her er hva du bør vite.
11. juni 2026
26 visninger
4 minutter lesetid
Gemma 4 12B – nå kan du kjøre multimodal AI gratis på din egen laptop
Gemma 4 12B er Googles nye open weights-modell som forstår bilder, lyd og tekst – og kjører på en vanlig 16GB laptop. Apache 2.0, gratis, ingen skytjeneste.
6. juni 2026
49 visninger
6 minutter lesetid
Mellum2 fra JetBrains – hva er det og trenger du det som utvikler?
JetBrains har sluppet Mellum2 – en 12B MoE-modell laget for rask kodeassistanse og multi-modell workflows. Her er det du trenger å vite.
2. juni 2026
44 visninger
4 minutter lesetid
Hva er NVIDIA Cosmos 3 – og hva betyr det for robotikk?
NVIDIA Cosmos 3 er den første åpne omni-modellen for Physical AI. Her er hva den faktisk kan gjøre for robotikk og autonome systemer – og hvorfor det er interessant.
1. juni 2026
49 visninger
5 minutter lesetid
MiniCPM5-1B – reasoning og tool use på 1 milliard parametere
MiniCPM5-1B er en 1B-modell med hybrid reasoning, 131 000 tokens kontekst og tool use – og kjører lokalt via Ollama. Her er hva den faktisk kan.
26. mai 2026
54 visninger
4 minutter lesetid
Klein-4B, SANA 1.5, Qwen Image og Z-Image Turbo – hvem vinner bildeduellen?
Detaljert sammenligning av fem bildegenererings-modeller på 192 prompts: Klein-4B, Nucleus-Image, Z-Image Turbo, SANA 1.5 og Qwen Image. Hvem leverer best kvalitet, hastighet og verdi i 2026?
26. mai 2026
47 visninger
5 minutter lesetid
MiniCPM-V 4.6 på Orange Pi – C++ inferensmotor til 1 500 kr
En utvikler bygde en C++ inferensmotor fra bunnen for å kjøre MiniCPM-V 4.6 på Orange Pi AIPro med Ascend 310B NPU. Resultatet: 5,90 tokens per sekund, ingen PyTorch, åpen kildekode – for 1 500 kroner.
25. mai 2026
51 visninger
4 minutter lesetid
Z-Image 6B – Tencents VAE-frie bildegenerator med 1K oppløsning
Z-Image 6B fra Tencent genererer bilder direkte i pikselrom uten VAE. L2P-metoden gir 97% raskere 4K-generering og støtter 8K zero-shot.