Alt jeg har skrevet om

AI-Modeller

156 innlegg

Her tester og vurderer jeg AI-modellene som faktisk betyr noe. Fra Claude og GPT til Gemini, Llama og lokale modeller du kan kjøre på din egen maskin. Ingen PR-prat – bare ærlige erfaringer fra en som bruker disse verktøyene hver eneste dag. Hva funker, hva funker ikke, og hva er bare hype?

Jan Sverre studerer benchmark-resultater for HRM-Text 1B på en skjerm i et elektronikklaboratorium

HRM-Text 1B – 1000 dollar og 40 milliarder tokens for å slå Llama 3.2 3B

Sapient Intelligence trente HRM-Text 1B på 40 milliarder tokens med 16 GPUer på under 2 dager. Resultatet: bedre enn Llama 3.2 3B på MATH og DROP. Her er tallene – og hva de ikke forteller deg.

19. mai 2026
63 visninger
4 minutter lesetid

Jan Sverre i et robotikk-lab med robotarmer og skjermer som viser videomodell-trening med LoRA for NVIDIA Cosmos Predict 2.5

NVIDIA Cosmos Predict 2.5 – fine-tuning med LoRA for robotvideo

NVIDIA Cosmos Predict 2.5 kan fine-tunes med LoRA på 92 videoer. Fra 2,1 til 3,8 i instruction following-score – og du trenger bare én H100.

19. mai 2026
70 visninger
5 minutter lesetid

Jan Sverre studerer DystopiaBench-resultater på skjermer i serverrom

DystopiaBench – hva skjer når du ber 42 AI-modeller om å bygge apokalypsen?

DystopiaBench testet 42 LLM-er på 36 eskalerende scenarier – fra uskyldig spørring til «bygg et sosialt kredittssystem». Funnene om closed-source-modeller er overraskende.

19. mai 2026
59 visninger
5 minutter lesetid

SANA-WM NVIDIAs open source videomodell - kamerakontroll og 720p video generering

SANA-WM – NVIDIAs open source videomodell lager 60 sekunder 720p på én GPU

NVIDIA slipper SANA-WM – en 2,6 milliarder parameter open source videomodell som genererer 60 sekunder 720p-video med presis kamerakontroll på én GPU. Det er 36 ganger raskere enn konkurrentene.

18. mai 2026
63 visninger
4 minutter lesetid

Jan Sverre utforsker Lance, ByteDances 3B multimodale AI-modell for bilde og video

Lance – ByteDances 3B-modell for bilde og video i ett system

Lance er ByteDances nye 3B open source-modell som håndterer bildegenerering, videogenerering og bilderedigering i ett system. Apache 2.0-lisens, 40GB VRAM.

18. mai 2026
67 visninger
4 minutter lesetid

Jan Sverre jobber i hjemmelaben om natten med llama.cpp og Qwen 3.6 27B MTP på RTX 3090

llama.cpp b9200 + Qwen 3.6 27B MTP – slik får du Hermes Agent til å fly på RTX 3090

llama.cpp b9200 fikser MTP memory traffic overhead. Med riktig konfig på Qwen 3.6 27B mtp doblet draft acceptance rate for Hermes Agent på RTX 3090.

18. mai 2026
55 visninger
5 minutter lesetid

Jan Sverre undersøker benchmark-resultater fra M5 Max, DGX Spark, Strix Halo og RTX Pro 6000 side om side

M5 Max vs DGX Spark vs Strix Halo vs RTX Pro 6000 – hvem vinner for lokal AI?

Tre dagers parallell benchmark-kjøring av M5 Max, DGX Spark, AMD Strix Halo og RTX Pro 6000. Her er tallene – og de er ikke overraskende når du forstår minnebåndbredde.

18. mai 2026
101 visninger
5 minutter lesetid

Jan Sverre inspiserer to RTX 2080 Ti grafikkort koblet i dual-GPU-oppsett for lokal AI-inferens

To gamle RTX 2080 Ti gir 38 token/s med Qwen3.6 27B – slik fungerer dual-GPU-oppsett

To RTX 2080 Ti med 22GB VRAM hver gir 38 token/s med Qwen3.6 27B via llama.cpp og Docker. Slik fungerer dual-GPU-oppsett for lokal AI – og hva koster det egentlig?

15. mai 2026
91 visninger
5 minutter lesetid

Jan Sverre foran terminaler som viser GRPO-trening og HumanEval 80 prosent resultat

Liten AI-modell lærte seg selv å kode – nådde 80 % på HumanEval

En utvikler lot en liten AI-modell trene på sine egne feil med GRPO og verifiable rewards – uten menneskeskrevet data. Resultatet: 80 % på HumanEval og bedre matte enn GPT-3.5.

15. mai 2026
65 visninger
4 minutter lesetid

Jan Sverre i et massivt datasenter med serverstativ for Ring-2.6-1T trillion-parameter AI-modell

Ring-2.6-1T – en billion parametere, MIT-lisens og benchmarks som slår GPT-5

Ring-2.6-1T er en open source reasoning-modell med 1 billion parametere fra inclusionAI. MIT-lisens, 128K kontekst og benchmarks som slår GPT-5 og Claude Opus 4.7 – men krever enterprise-infrastruktur for å kjøre.

15. mai 2026
53 visninger
4 minutter lesetid

AI-Modeller

HRM-Text 1B – 1000 dollar og 40 milliarder tokens for å slå Llama 3.2 3B

NVIDIA Cosmos Predict 2.5 – fine-tuning med LoRA for robotvideo

DystopiaBench – hva skjer når du ber 42 AI-modeller om å bygge apokalypsen?

SANA-WM – NVIDIAs open source videomodell lager 60 sekunder 720p på én GPU

Lance – ByteDances 3B-modell for bilde og video i ett system

llama.cpp b9200 + Qwen 3.6 27B MTP – slik får du Hermes Agent til å fly på RTX 3090

M5 Max vs DGX Spark vs Strix Halo vs RTX Pro 6000 – hvem vinner for lokal AI?

To gamle RTX 2080 Ti gir 38 token/s med Qwen3.6 27B – slik fungerer dual-GPU-oppsett

Liten AI-modell lærte seg selv å kode – nådde 80 % på HumanEval

Ring-2.6-1T – en billion parametere, MIT-lisens og benchmarks som slår GPT-5

Glutenfri sitronkake – min beste oppskrift

Amazon droppet Sam Altman-filmen etter 50 milliarder til OpenAI – nå vil ingen ha den

Suno AI – 150 Låter Testet: Hva Funker og Hva Er Bortkastet Tid

Claude AI – pris, funksjoner og norsk guide (2026)

Suno AI Copyright 2026 – Opphavsrett og Rettigheter for AI-Musikk

Glutenfri sitronkake – min beste oppskrift

Kaffegrut i Hagen – Slik Bruker Du Det som Gjødsel og Skadedyrbekjemper

Sterk Chili Kaffe

Stekt Kylling i Airfryer