Gemini 3.5 Flash – Googles raskeste frontiermodell er her
Gemini 3.5 Flash er lansert – 4x raskere enn andre frontiermodeller, og bygget for agentic workflows. Her er hva som er nytt og hva det betyr i praksis.
20. mai 2026
23 visninger
4 minutter lesetid
HRM-Text 1B – 1000 dollar og 40 milliarder tokens for å slå Llama 3.2 3B
Sapient Intelligence trente HRM-Text 1B på 40 milliarder tokens med 16 GPUer på under 2 dager. Resultatet: bedre enn Llama 3.2 3B på MATH og DROP. Her er tallene – og hva de ikke forteller deg.
19. mai 2026
30 visninger
4 minutter lesetid
DystopiaBench – hva skjer når du ber 42 AI-modeller om å bygge apokalypsen?
DystopiaBench testet 42 LLM-er på 36 eskalerende scenarier – fra uskyldig spørring til «bygg et sosialt kredittssystem». Funnene om closed-source-modeller er overraskende.
19. mai 2026
26 visninger
5 minutter lesetid
SmallCode – coding agent som faktisk fungerer med lokale modeller
SmallCode er en coding agent bygget fra bunnen for små lokale modeller. Resultatet: 87% benchmark-score med Gemma 4 på kun 4B aktive parametere – mot OpenCodes 75% med 14B-modeller.
18. mai 2026
28 visninger
3 minutter lesetid
Lance – ByteDances 3B-modell for bilde og video i ett system
Lance er ByteDances nye 3B open source-modell som håndterer bildegenerering, videogenerering og bilderedigering i ett system. Apache 2.0-lisens, 40GB VRAM.
18. mai 2026
31 visninger
4 minutter lesetid
M5 Max vs DGX Spark vs Strix Halo vs RTX Pro 6000 – hvem vinner for lokal AI?
Tre dagers parallell benchmark-kjøring av M5 Max, DGX Spark, AMD Strix Halo og RTX Pro 6000. Her er tallene – og de er ikke overraskende når du forstår minnebåndbredde.
18. mai 2026
37 visninger
5 minutter lesetid
Liten AI-modell lærte seg selv å kode – nådde 80 % på HumanEval
En utvikler lot en liten AI-modell trene på sine egne feil med GRPO og verifiable rewards – uten menneskeskrevet data. Resultatet: 80 % på HumanEval og bedre matte enn GPT-3.5.
15. mai 2026
38 visninger
4 minutter lesetid
Ring-2.6-1T – en billion parametere, MIT-lisens og benchmarks som slår GPT-5
Ring-2.6-1T er en open source reasoning-modell med 1 billion parametere fra inclusionAI. MIT-lisens, 128K kontekst og benchmarks som slår GPT-5 og Claude Opus 4.7 – men krever enterprise-infrastruktur for å kjøre.
15. mai 2026
28 visninger
4 minutter lesetid
RTX 5090 og lokal LLM – hva skjer med ytelse når du skrur ned strømmen?
Detaljert benchmark av RTX 5090 ved ulike strømnivåer: prompt parsing, token-generering og strøm-effektivitet for lokal LLM-kjøring. Hvor er sweet spot?
14. mai 2026
37 visninger
5 minutter lesetid
TML-Interaction-Small – Thinking Machines Labs modell for sanntids AI-samtale
Thinking Machines Lab lanserer TML-Interaction-Small, en 276B MoE-modell som hører og snakker samtidig – uten VAD og uten frysing under generering. På FD-bench v1.5 scorer den 77,8 mot Geminis 54,3.