Mann i hettegenser i et fremtidsrettet datasenter med oransje oscillerende lys fra server-rader

Kan Un-0 kutte AI-strømregningen med 1 000 ganger? Databricks-veteran mener ja

Naveen Rao, tidligere AI-sjef hos Databricks, hevder at hans nye selskap Unconventional AI kan kutte strømforbruket ved AI-inferens med 1 000 ganger – og lanserte i går bildegeneratoren Un-0 som bevis på konseptet.
Mann i hettegenser studerer skjermer med data fra massivt AI-kloningsangrep

Alibaba kopierte Claude i 28,8 millioner utvekslinger – Anthropic krever straff

Alibaba brukte 25 000 falske kontoer til å gjennomføre 28,8 millioner Claude-utvekslinger i det største kjente kloningsangrepet mot Anthropic. Selskapet ber nå Kongressen om sanksjoner.
Jan Sverre observerer Det hvite hus i Washington DC i skumringen mens dresskledde maktfigurer beveger seg i bakgrunnen

Kommer Claude Fable 5 tilbake? Her er tegnene som peker mot retur

Claude Fable 5 ble stengt av amerikanske myndigheter 12. juni. Nå peker tekniske funn i Amazon Bedrock, Claude Code v2.1.190 og Polymarket-odds mot at den er på vei tilbake – men Anthropic sier den ikke betjener trafikk ennå.
Person omgitt av store dokumentbunker mens AI-modellen parser og strukturerer innholdet på skjermen

Baidu Unlimited OCR: 3B-modellen som parser hele dokumentbunker uten at minnet eksploderer

Baidu slapp Unlimited OCR – en 3B MoE-modell som parser 40+ siders dokumenter i én operasjon. R-SWA-mekanismen holder KV-cachen flat slik at minne og latens ikke vokser med dokumentlengden. MIT-lisens og tilgjengelig på Hugging Face.
Jan Sverre holder og undersøker en glødende AI-inferens-chip fra OpenAI og Broadcom

OpenAI og Broadcom lanserte Jalapeño – en chip bygd utelukkende for AI-inferens

OpenAI og Broadcom avslørte Jalapeño – en egenutviklet inferens-chip på TSMCs 3nm-prosess som skal gjøre AI-drift billigere og uavhengig av Nvidia.
Jan Sverre utforsker DFlash spekulativ dekoding - parallell token-generering visualisert som lysstrømmer i et serverrom

DFlash: slik kan spekulativ dekoding gi deg opptil 6x raskere AI-inferens

DFlash fra UC San Diego bruker block diffusion og KV injection for å generere hele token-blokker parallelt – og rapporterer opptil 6x lossless speedup på Qwen3-8B. Her er hva det betyr i praksis.
Jan Sverre ser skeptisk på holografiske AI-modell-kort som svever rundt ham ved skrivebordet

Fugu Ultra lover Fable-ytelse – men er det egentlig en ny modell?

Sakana Fugu Ultra kapret overskriftene med ville benchmark-tall. Men under panseret finner du ikke en ny modell – du finner Claude Opus 4.8 og GPT-5.5 innpakket i et orkestrerings-skall. Tre uavhengige tester viser det samme: tregere, dyrere, sjelden bedre.
Jan Sverre ser på dokumenter som forvandles til strukturert JSON-data

lift: Datalab slipper åpen 9B-modell som gjør PDF om til strukturert JSON

lift er en åpen 9B vision-modell fra Datalab som trekker strukturert JSON ut av PDF-er og bilder basert på ditt eget schema. Selvhostbar via vLLM, Apache 2.0-kode, og trent til å returnere null i stedet for å hallusinere felt den ikke finner.
Jan Sverre studerer et dokument med annoterte bounding boxes og strukturert OCR-output

Mistral OCR 4 lansert: dokumenter som vet hvor hvert ord sitter – klar for RAG

Mistral OCR 4 gir deg ikke bare tekst fra dokumenter – den forteller deg nøyaktig hvor på siden hvert ord sitter, hvor sikker den er, og hva slags blokk det er. Det forandrer ganske mye for RAG og agentic pipelines.
Jan Sverre i et moderne datasenter - Groq henter 650 millioner dollar i ny kapital

Groq tapte grunnleggeren til Nvidia – og hentet 7 milliarder kroner likevel

Groq bekreftet i går en finansieringsrunde på 650 millioner dollar etter at Nvidia hentet ut grunnleggeren og lisensierte teknologien. Nå satser selskapet tungt på neocloud-infrastruktur med 13 datasentre og et helt nytt lederteam.