Alt jeg har skrevet om

AI-Modeller

91 innlegg

Her tester og vurderer jeg AI-modellene som faktisk betyr noe. Fra Claude og GPT til Gemini, Llama og lokale modeller du kan kjøre på din egen maskin. Ingen PR-prat – bare ærlige erfaringer fra en som bruker disse verktøyene hver eneste dag. Hva funker, hva funker ikke, og hva er bare hype?

Mann i hettegenser utforsker alternativ historievisualisering med Qwen Image AI-oppsett og ComfyUI på skjerm

Qwen Image og alternativ historie – slik lager du fotorealistiske bilder fra tidslinjer som aldri skjedde

Qwen Image er Alibabas open source AI-modell for bildegenerering og -redigering. Her er hvordan den brukes til å lage fotorealistiske bilder fra alternative historiske tidslinjer – med ComfyUI-oppsett og GGUF-varianter ned til 8 GB VRAM.

4. mai 2026
27 visninger
4 minutter lesetid

Jan Sverre sammenligner Qwen 3 VL og Gemma 4 vision-modeller lokalt med benchmaxing-vinkel

Qwen 3 VL vs Gemma 4 – hvem vinner egentlig på vision-oppgaver?

Offisielle benchmarks peker mot Qwen 3 VL 32B som vinner over Gemma 4 31B på vision-oppgaver. Men side-om-side-testing med vLLM og FP8 lokalt avslører et annet bilde: Gemma 4 vinner i praksis. Her er hva benchmaxing faktisk betyr for deg som vil kjøre vision-AI lokalt.

4. mai 2026
25 visninger
5 minutter lesetid

Jan Sverre utforsker Gemma-4-31B-it-DFlash og spekulativ dekoding med DFlash-teknikken

Gemma-4-31B-it-DFlash – spekulativ dekoding for Googles åpne modell

Gemma-4-31B-it-DFlash er en ny variant av Googles Gemma 4 31B utgitt av Z Lab, med DFlash spekulativ dekoding som kan gi opptil 8x raskere inferens. Llama.cpp-støtte er under utvikling via PR #22105.

1. mai 2026
49 visninger
4 minutter lesetid

Jan Sverre analyserer DeepSeek V4 Pro og Flash - kinesiske open source AI-modeller med 1,6 billiarder parametere

DeepSeek V4 Pro og Flash – 1,6 billiarder parametere og Huawei Ascend-støtte

DeepSeek V4 Pro og Flash er lansert med 1,6 billiarder parametere, MIT-lisens og støtte for Huawei Ascend-chips. Modellen er god men ikke lenger benchmarks-leder – her er hva du trenger å vite.

1. mai 2026
30 visninger
5 minutter lesetid

Jan Sverre utforsker IBM Granite 4.1 sine tre open source AI-modeller på 3B, 8B og 30B parametere

IBM Granite 4.1 – open source AI-modeller i 3B, 8B og 30B

IBM Granite 4.1 er tre nye open source AI-modeller (3B, 8B og 30B) med Apache 2.0-lisens, 512K tokens kontekstvindu og FP8-kvantisering. 8B-modellen matcher tidligere 32B MoE-modell – og kjører på vanlig gaming-GPU.

30. april 2026
34 visninger
6 minutter lesetid

SenseNova-U1 modellen kombinerer bildeforståelse og generering i én samlet arkitektur uten VAE eller visuell encoder

SenseNova-U1 – nativ multimodal AI uten VAE og diffusion

SenseNova-U1 er en ny åpen kildekode-modell fra SenseTime som genererer bilder uten VAE, visuell encoder eller diffusion-prosess. NEO-Unify-arkitekturen behandler tekst og piksler nativt i én modell – og åpner for tekstrendering og infografikk der diffusion-modeller tradisjonelt mislykkes.

30. april 2026
28 visninger
5 minutter lesetid

Mistral Medium 3.5 128B lansering - mann i hettegenser engasjert med ny kraftig AI-modell fra Frankrike

Mistral Medium 3.5 128B lansert – open weights, 256k kontekst og sterk kodeytelse

Mistral AI lanserte Medium 3.5 29. april 2026 – en 128 milliarder parameter tett modell med 256k kontekstvindu, open weights under modifisert MIT-lisens og sterk ytelse på koding og agentic oppgaver. API-pris $1,50/$7,50 per million tokens.

30. april 2026
38 visninger
4 minutter lesetid

Jan Sverre undersøker FlashQLA - Qwens nye bibliotek for raskere lineær oppmerksomhet på GPU

FlashQLA – Qwen lanserer 2-3x raskere lineær attention-kjerner

FlashQLA er Qwens nye bibliotek for lineær attention-kjerner bygget på TileLang. Det leverer 2-3 ganger raskere forward-pass og 2 ganger raskere backward-pass på NVIDIA Hopper-GPU-er – og er rettet mot agentic AI på personlige enheter.

29. april 2026
31 visninger
4 minutter lesetid

Mann som dykker ned i en digital pool av kode og AI-agenter - Poolside AI Laguna lansering

Poolside AI lanserer Laguna XS.2 og M.1 – spesialiserte agentic coding-modeller

Poolside AI lanserte 28. april 2026 sine to første offentlige modeller: Laguna M.1 (225B/23B aktive parametere) og Laguna XS.2 (33B/3B aktive, Apache 2.0). Begge er bygget for agentic coding og lange autonome kodingssessjoner – og begge er gratis via API og OpenRouter nå.

29. april 2026
31 visninger
5 minutter lesetid

Jan Sverre utforsker Chaperone-Thinking-LQ-1.0, den medisinske AI-modellen som scorer 84% på legeeksamen-benchmarket MedQA og kjører lokalt på 20GB

Chaperone-Thinking-LQ-1.0 – medisinsk AI som scorer 84% på legeeksamen og kjører på 20GB

Chaperone-Thinking-LQ-1.0 er en open source medisinsk AI-modell basert på DeepSeek-R1-Distill-Qwen-32B, kvantisert til ~20GB via GPTQ og finjustert med QLoRA på medisinske korpus. Modellen scorer 84% på MedQA-benchmarket og kan kjøres lokalt på en RTX 3090 eller 4090.

28. april 2026
29 visninger
5 minutter lesetid

ZAYA1-8B – Zyphra sin MoE-modell slår modeller 15 ganger større

Claude Dreams – slik rydder AI-agenter opp i sine egne minner

MTPLX – 2,24 ganger raskere MTP-inferens for Apple Silicon

torch-nvenc-compress – NVENC-silikon som PCIe-båndbreddemultiplikator

AI-Modeller

Qwen Image og alternativ historie – slik lager du fotorealistiske bilder fra tidslinjer som aldri skjedde

Qwen 3 VL vs Gemma 4 – hvem vinner egentlig på vision-oppgaver?

Gemma-4-31B-it-DFlash – spekulativ dekoding for Googles åpne modell

DeepSeek V4 Pro og Flash – 1,6 billiarder parametere og Huawei Ascend-støtte

IBM Granite 4.1 – open source AI-modeller i 3B, 8B og 30B

SenseNova-U1 – nativ multimodal AI uten VAE og diffusion

Mistral Medium 3.5 128B lansert – open weights, 256k kontekst og sterk kodeytelse

FlashQLA – Qwen lanserer 2-3x raskere lineær attention-kjerner

Poolside AI lanserer Laguna XS.2 og M.1 – spesialiserte agentic coding-modeller

Chaperone-Thinking-LQ-1.0 – medisinsk AI som scorer 84% på legeeksamen og kjører på 20GB

Afroman vant – politiet krevde 4 millioner, juryen ga dem null

PewDiePie AI Council – Da Supreme Leader ble forrÅdt av sine egne

Suno AI – 150 Låter Testet: Hva Funker og Hva Er Bortkastet Tid

Suno AI Copyright 2026 – Opphavsrett og Rettigheter for AI-Musikk

Jeg testet Nano Banana Pro: AI som faktisk skriver norsk i bilder

Kaffegrut i Hagen – Slik Bruker Du Det som Gjødsel og Skadedyrbekjemper

Sterk Chili Kaffe

Stekt Kylling i Airfryer

Kaffekaramell