Jan Sverre peker på ett glødende nevron i et holografisk nevralt nettverk - illustrasjon av CNA-metoden

CNA – Nous Research finner hjernecellene som styrer LLM-atferd

Nous Research lanserer CNA – en metode som finner og slår av eksakte nevroner i LLM-er for å styre atferd. Ingen SAE-trening, ingen vektmodifisering, full benchmark-ytelse beholdt.
Jan Sverre ser på en stor lysende Apple Silicon-chip med nevrale nettverksforbindelser - Command A+ 218B MoE

Command A+ 218B – Coheres kraftigste modell kjører nå på Apple Silicon

Command A+ (218B MoE, 25B aktive) kjører nå på Apple Silicon via MLX. Apache 2.0, 128K kontekst, cohere2_moe-implementasjon. Her er hva du trenger å vite.
NuExtract3 - Jan Sverre ved skrivebordet med dokumenter og holografisk JSON-ekstraksjon

NuExtract3 – open source 4B VLM for OCR og strukturert dokumentekstraksjon

NuExtract3 er en 4B open-weight VLM fra Numind som slår Qwen3.5-9B på strukturert dokumentekstraksjon. Apache 2.0-lisens, gratis demo på HuggingFace.
SANA-WM NVIDIAs open source videomodell - kamerakontroll og 720p video generering

SANA-WM – NVIDIAs open source videomodell lager 60 sekunder 720p på én GPU

NVIDIA slipper SANA-WM – en 2,6 milliarder parameter open source videomodell som genererer 60 sekunder 720p-video med presis kamerakontroll på én GPU. Det er 36 ganger raskere enn konkurrentene.
Jan Sverre utforsker Lance, ByteDances 3B multimodale AI-modell for bilde og video

Lance – ByteDances 3B-modell for bilde og video i ett system

Lance er ByteDances nye 3B open source-modell som håndterer bildegenerering, videogenerering og bilderedigering i ett system. Apache 2.0-lisens, 40GB VRAM.
Jan Sverre i serverrom med blågrønt lys fra racks, tablet viser AI-genererte videorammer fra Alice v1

Alice v1 – open source videomodell som utfordrer Sora og Veo

Alice v1 er en 14-milliarder parameter open source videomodell fra Mirage med Apache 2.0-lisens. Bruker rCM-destillasjon og MoE-arkitektur for å generere 720p video på 4 inferenstrinn – og hevder å slå lukkede modeller som Sora og Veo.
Jan Sverre ser på en AI-generert cinematic film laget av en open source pipeline med FLUX.2 og Wan2.2

Open source video pipeline – én prompt til ferdig film med FLUX.2 og Wan2.2

En open source pipeline tar én setning og leverer ferdig cinematic MP4 med karakterer, musikk og voice-over på 9 språk – alt på én AMD Instinct MI300X GPU på 45 minutter. FLUX.2 klein for keyframes, Wan2.2-I2V for animering, Vision Critic med auto-retry for kvalitetskontroll. Alle modeller Apache 2.0 eller MIT.
Jan Sverre studerer et Mixture of Experts-nettverksdiagram som viser ZAYA1-8B sin selektive parameteraktivering med AMD-hardware i bakgrunnen

ZAYA1-8B – Zyphra sin MoE-modell slår modeller 15 ganger større

ZAYA1-8B fra Zyphra aktiverer bare 760 millioner parametere per inferens, men slår modeller med 119 milliarder parametere på matematikk-benchmarks. Trent ende-til-ende på AMD Instinct MI300x og tilgjengelig under Apache 2.0-lisens.
Jan Sverre utforsker Gemma-4-31B-it-DFlash og spekulativ dekoding med DFlash-teknikken

Gemma-4-31B-it-DFlash – spekulativ dekoding for Googles åpne modell

Gemma-4-31B-it-DFlash er en ny variant av Googles Gemma 4 31B utgitt av Z Lab, med DFlash spekulativ dekoding som kan gi opptil 8x raskere inferens. Llama.cpp-støtte er under utvikling via PR #22105.
Jan Sverre utforsker IBM Granite 4.1 sine tre open source AI-modeller på 3B, 8B og 30B parametere

IBM Granite 4.1 – open source AI-modeller i 3B, 8B og 30B

IBM Granite 4.1 er tre nye open source AI-modeller (3B, 8B og 30B) med Apache 2.0-lisens, 512K tokens kontekstvindu og FP8-kvantisering. 8B-modellen matcher tidligere 32B MoE-modell – og kjører på vanlig gaming-GPU.