Jan Sverre med to maskiner koblet via ethernet som kjører FLUX 2 delt over to GPUer

FLUX 2 over Ethernet – slik spreader du modellen på to GPUer uten NVLink

En utvikler har bygget en NVENC encoder bridge som lar deg splitte FLUX 2-modellen over to GPUer via Ethernet – uten NVLink. 4,4 sekunder per bilde med 5090 og laptop-4090 på to separate maskiner. Testet over WiFi og Tailscale VPN.
Jan Sverre ved skrivebordet med llama.cpp-terminaler som viser MTP-aktivert inferens

MTP merget inn i llama.cpp – nå kan alle kjøre det

PR 22673 er merget inn i llama.cpp master. MTP-støtte gir 1,9x til 2,5x raskere inferens lokalt – her er hva du trenger å vite og hvordan du aktiverer det.
Jan Sverre i lydstudio ser på holografisk visning av adskilte stemmebølger for identitet og emosjon

Scenema Audio – zero-shot stemmekloning med emosjonell prompting

Scenema Audio lar deg klone en stemme fra 10-20 sekunder audio og styre emosjon via tekstprompt. Open source, MIT-lisens, 16 GB VRAM.
Jan Sverre inspiserer to RTX 2080 Ti grafikkort koblet i dual-GPU-oppsett for lokal AI-inferens

To gamle RTX 2080 Ti gir 38 token/s med Qwen3.6 27B – slik fungerer dual-GPU-oppsett

To RTX 2080 Ti med 22GB VRAM hver gir 38 token/s med Qwen3.6 27B via llama.cpp og Docker. Slik fungerer dual-GPU-oppsett for lokal AI – og hva koster det egentlig?
Jan Sverre ser opp på militær drone i norsk vinterlandskap med termisk bilde på nettbrett

Forsvaret bruker AI for å finne savnede raskere

Forsvarets nye AI-senter på Kjeller bruker computer vision og droner til å analysere bilder raskere enn menneskelige øyne. Slik fungerer teknologien som finner savnede raskere i norsk terreng.
Jan Sverre foran terminaler som viser GRPO-trening og HumanEval 80 prosent resultat

Liten AI-modell lærte seg selv å kode – nådde 80 % på HumanEval

En utvikler lot en liten AI-modell trene på sine egne feil med GRPO og verifiable rewards – uten menneskeskrevet data. Resultatet: 80 % på HumanEval og bedre matte enn GPT-3.5.
Jan Sverre kjører LoRA-trening med Anima TrainFlow på hjemme-PC med GPU

Anima TrainFlow – LoRA-trening på én side med 6GB VRAM

Anima TrainFlow er et gratis LoRA-treningsverktøy som samler alle viktige innstillinger på én side. Kjører på 6GB VRAM, portabelt, og basert på MIT-lisens.
Jan Sverre i et massivt datasenter med serverstativ for Ring-2.6-1T trillion-parameter AI-modell

Ring-2.6-1T – en billion parametere, MIT-lisens og benchmarks som slår GPT-5

Ring-2.6-1T er en open source reasoning-modell med 1 billion parametere fra inclusionAI. MIT-lisens, 128K kontekst og benchmarks som slår GPT-5 og Claude Opus 4.7 – men krever enterprise-infrastruktur for å kjøre.
Jan Sverre sitter i et hjemmelaboratorium omgitt av GPU-er og benchmarkgrafer på skjermen

RTX 5090 og lokal LLM – hva skjer med ytelse når du skrur ned strømmen?

Detaljert benchmark av RTX 5090 ved ulike strømnivåer: prompt parsing, token-generering og strøm-effektivitet for lokal LLM-kjøring. Hvor er sweet spot?
Jan Sverre ved skrivebordet med lokale AI-dokumenter og privat kunnskapsbase på skjermen

Lokal LLM som personlig kunnskapsbase – slik gjør du det privat

Bruk en lokal LLM med dine egne notater, PDF-er og dokumenter som en privat kunnskapsbase. Her er oppsettene som faktisk fungerer i 2026.