Jan Sverre studerer benchmark-resultater for HRM-Text 1B på en skjerm i et elektronikklaboratorium

HRM-Text 1B – 1000 dollar og 40 milliarder tokens for å slå Llama 3.2 3B

Sapient Intelligence trente HRM-Text 1B på 40 milliarder tokens med 16 GPUer på under 2 dager. Resultatet: bedre enn Llama 3.2 3B på MATH og DROP. Her er tallene – og hva de ikke forteller deg.
Jan Sverre i et robotikk-lab med robotarmer og skjermer som viser videomodell-trening med LoRA for NVIDIA Cosmos Predict 2.5

NVIDIA Cosmos Predict 2.5 – fine-tuning med LoRA for robotvideo

NVIDIA Cosmos Predict 2.5 kan fine-tunes med LoRA på 92 videoer. Fra 2,1 til 3,8 i instruction following-score – og du trenger bare én H100.
Jan Sverre studerer DystopiaBench-resultater på skjermer i serverrom

DystopiaBench – hva skjer når du ber 42 AI-modeller om å bygge apokalypsen?

DystopiaBench testet 42 LLM-er på 36 eskalerende scenarier – fra uskyldig spørring til «bygg et sosialt kredittssystem». Funnene om closed-source-modeller er overraskende.
SANA-WM NVIDIAs open source videomodell - kamerakontroll og 720p video generering

SANA-WM – NVIDIAs open source videomodell lager 60 sekunder 720p på én GPU

NVIDIA slipper SANA-WM – en 2,6 milliarder parameter open source videomodell som genererer 60 sekunder 720p-video med presis kamerakontroll på én GPU. Det er 36 ganger raskere enn konkurrentene.
Jan Sverre utforsker Lance, ByteDances 3B multimodale AI-modell for bilde og video

Lance – ByteDances 3B-modell for bilde og video i ett system

Lance er ByteDances nye 3B open source-modell som håndterer bildegenerering, videogenerering og bilderedigering i ett system. Apache 2.0-lisens, 40GB VRAM.
Jan Sverre jobber i hjemmelaben om natten med llama.cpp og Qwen 3.6 27B MTP på RTX 3090

llama.cpp b9200 + Qwen 3.6 27B MTP – slik får du Hermes Agent til å fly på RTX 3090

llama.cpp b9200 fikser MTP memory traffic overhead. Med riktig konfig på Qwen 3.6 27B mtp doblet draft acceptance rate for Hermes Agent på RTX 3090.
Jan Sverre undersøker benchmark-resultater fra M5 Max, DGX Spark, Strix Halo og RTX Pro 6000 side om side

M5 Max vs DGX Spark vs Strix Halo vs RTX Pro 6000 – hvem vinner for lokal AI?

Tre dagers parallell benchmark-kjøring av M5 Max, DGX Spark, AMD Strix Halo og RTX Pro 6000. Her er tallene – og de er ikke overraskende når du forstår minnebåndbredde.
Jan Sverre inspiserer to RTX 2080 Ti grafikkort koblet i dual-GPU-oppsett for lokal AI-inferens

To gamle RTX 2080 Ti gir 38 token/s med Qwen3.6 27B – slik fungerer dual-GPU-oppsett

To RTX 2080 Ti med 22GB VRAM hver gir 38 token/s med Qwen3.6 27B via llama.cpp og Docker. Slik fungerer dual-GPU-oppsett for lokal AI – og hva koster det egentlig?
Jan Sverre foran terminaler som viser GRPO-trening og HumanEval 80 prosent resultat

Liten AI-modell lærte seg selv å kode – nådde 80 % på HumanEval

En utvikler lot en liten AI-modell trene på sine egne feil med GRPO og verifiable rewards – uten menneskeskrevet data. Resultatet: 80 % på HumanEval og bedre matte enn GPT-3.5.
Jan Sverre i et massivt datasenter med serverstativ for Ring-2.6-1T trillion-parameter AI-modell

Ring-2.6-1T – en billion parametere, MIT-lisens og benchmarks som slår GPT-5

Ring-2.6-1T er en open source reasoning-modell med 1 billion parametere fra inclusionAI. MIT-lisens, 128K kontekst og benchmarks som slår GPT-5 og Claude Opus 4.7 – men krever enterprise-infrastruktur for å kjøre.