Jan Sverre utforsker DFlash spekulativ dekoding - parallell token-generering visualisert som lysstrømmer i et serverrom

DFlash: slik kan spekulativ dekoding gi deg opptil 6x raskere AI-inferens

DFlash fra UC San Diego bruker block diffusion og KV injection for å generere hele token-blokker parallelt – og rapporterer opptil 6x lossless speedup på Qwen3-8B. Her er hva det betyr i praksis.
Jan Sverre ser skeptisk på holografiske AI-modell-kort som svever rundt ham ved skrivebordet

Fugu Ultra lover Fable-ytelse – men er det egentlig en ny modell?

Sakana Fugu Ultra kapret overskriftene med ville benchmark-tall. Men under panseret finner du ikke en ny modell – du finner Claude Opus 4.8 og GPT-5.5 innpakket i et orkestrerings-skall. Tre uavhengige tester viser det samme: tregere, dyrere, sjelden bedre.
Jan Sverre ser på dokumenter som forvandles til strukturert JSON-data

lift: Datalab slipper åpen 9B-modell som gjør PDF om til strukturert JSON

lift er en åpen 9B vision-modell fra Datalab som trekker strukturert JSON ut av PDF-er og bilder basert på ditt eget schema. Selvhostbar via vLLM, Apache 2.0-kode, og trent til å returnere null i stedet for å hallusinere felt den ikke finner.
Jan Sverre studerer et dokument med annoterte bounding boxes og strukturert OCR-output

Mistral OCR 4 lansert: dokumenter som vet hvor hvert ord sitter – klar for RAG

Mistral OCR 4 gir deg ikke bare tekst fra dokumenter – den forteller deg nøyaktig hvor på siden hvert ord sitter, hvor sikker den er, og hva slags blokk det er. Det forandrer ganske mye for RAG og agentic pipelines.
Jan Sverre i et moderne datasenter - Groq henter 650 millioner dollar i ny kapital

Groq tapte grunnleggeren til Nvidia – og hentet 7 milliarder kroner likevel

Groq bekreftet i går en finansieringsrunde på 650 millioner dollar etter at Nvidia hentet ut grunnleggeren og lisensierte teknologien. Nå satser selskapet tungt på neocloud-infrastruktur med 13 datasentre og et helt nytt lederteam.
Jan Sverre studerer kode på skjermer i et serverrom, symboliserer AI-drevet sikkerhetsskanning av åpen kildekode

GPT-5.5-Cyber skal lappe Internett – slik bruker OpenAI AI til å fikse åpen kildekode

OpenAI lanserte Patch the Planet 22. juni – GPT-5.5-Cyber scanner åpen kildekode for sikkerhetshull. Modellen har allerede funnet en 23 år gammel sårbarhet i OpenBSD og et angrep som rammer 880 000 servere.
Jan Sverre følger med på DeepSeek sin gigantiske finansieringsrunde på 82 milliarder kroner

DeepSeek samler inn 82 milliarder kroner – og grunnleggeren setter selv 33 milliarder inn

DeepSeek tok inn 82 milliarder kroner i sin første eksterne finansieringsrunde noensinne. Grunnlegger Liang Wenfeng satte selv inn 33 milliarder – og den kinesiske staten er den eneste med stemmerett.
Jan Sverre ser analytisk på en stabel AI-fakturaer sent på kvelden

AI-kostnader: Amazon, Walmart og Uber bremser AI-bruken – dette betyr det for deg

Amazon, Walmart og Uber bremser AI-bruken etter kostnadssjokk i 2026. Her er hvorfor regningen ble for stor – og 4 konkrete grep du kan ta selv.
Mann i hettegenser ser på holografisk display med åpen kildekode og Europa-kart - illustrasjon for Apertus AI

Apertus: den åpne AI-modellen Europa faktisk kontrollerer selv

Apertus er en fullt åpen AI-modell fra sveitsiske forskningsinstitusjoner. Her er hva det betyr i praksis – og hvorfor det er annerledes enn Llama og Mistral.
Saftig glutenfri sitronkake toppet med sitroncurd, pyntet med sitronskiver og mynte på en hvit tallerken

Glutenfri sitronkake – min beste oppskrift

Saftig glutenfri sitronkake med sitrondynk og hjemmelaget sitroncurd – oppskriften som forsvinner samme dag den bakes.