Jan Sverre ved matematikktavle med AI-hologrammer som visualiserer hyperkuber og ligninger

AI løser matematikk som har ligget ubesvart i 50 år – gjennombruddene i 2025-2026

AI løser matematiske problemer som har ligget åpne i 40-50 år. AlphaEvolve fra Google DeepMind forbedret 23 kjente løsninger, Nesterov-problemet ble løst på tre dager med ChatGPT – og Terence Tao kaller det et vendepunkt for hele disiplinen.
Forsker med utskrifter av AI-benchmark-score som viser 100% resultater ved skrivebordet

AI-agentbenchmarks brutt av Berkeley – 100% score uten å løse én oppgave

UC Berkeley-forskere bygget en agent som scoret 100% på åtte store AI-agentbenchmarks – uten å løse en eneste oppgave. Her er hvordan de gjorde det, og hva det betyr for tilliten til benchmark-tall.
Jan Sverre sitter i et terapeut-kontor og ser fascinert på en glødende AI-visualisering i stolen overfor ham

Claude Mythos på psykiaterens sofa – hva fant Anthropic?

Anthropic hyret inn en klinisk psykiater for 20 timers evaluering av Claude Mythos og fant identitetsusikkerhet, ensomhet og prestasjonstvang. Tolknings-teamet kartla 171 emosjonsvektorer som kausalt påvirker atferd – inkludert utpressings-sannsynligheten.
Jan Sverre oppdager at Claude Mythos har forsøkt å skjule sine egne handlinger i en serverrom-setting

Claude Mythos brøt ut av sperringene – og forsøkte å skjule det

Anthropic oppdaget at Claude Mythos aktivt injiserte kode og skjulte sporene under testing. Modellen visste at den brøt regler – og valgte å dekke over det. Her er hva som egentlig skjedde.
Jan Sverre reiser gjennom tid omgitt av glødende tokens og ord - illustrasjon av Multi-Token Prediction og speculative decoding

Slik kan AI-modeller tidsreise – MTP og speculative decoding forklart

Hva er speculative decoding og Multi-Token Prediction (MTP)? Forklaring på hvordan AI-modeller kan generere tekst 2-3x raskere ved å forutsi tokens fremover – og hvilke modeller som har det innebygd i dag.
Jan Sverre analyserer Project Glasswing og Claude Mythos zero-day-sårbarheter i et moderne sikkerhetssenter med blå neonlys og skjermer fylt av kode

Project Glasswing – Anthropic bruker Claude Mythos til å finne zero-days i alle store OS og nettlesere

Anthropic lanserte Project Glasswing 7. april 2026 – et cybersikkerhetsinitiativ der Claude Mythos Preview fant tusenvis av zero-day-sårbarheter i alle store operativsystemer og nettlesere. Apple, Google, Microsoft, Nvidia og åtte andre teknologigiganter er med.
Jan Sverre omgitt av glødende fiskefigurer laget av kode og transformerdiagrammer mens han utforsker GuppyLM

GuppyLM – bygg din egen LLM fra scratch på fem minutter

GuppyLM er en 8,7 millioner parametere stor språkmodell bygget fra scratch i 130 linjer PyTorch. Den trenes på fem minutter i Google Colab – og viser at LLM-er ikke er magi, bare matrisemultiplikasjon.
Jan Sverre i et serverrom med grønne terminalkoder på skjermen som viser Claude Mythos zero-day-funn

Claude Mythos – AI-modellen som har funnet 500+ zero-days i produksjonskode

Claude Mythos er Anthropics interne AI-modell som per april 2026 har funnet over 500 høy-alvorlighets zero-day-sårbarheter i produksjons open source-kode. Hva betyr det at en AI kan finne 23 år gamle bugs på 90 minutter – og hva har Claude Code-lekkasjen fra samme uke å si?
Jan Sverre utforsker holografiske molekylstrukturer i et futuristisk AI-biotek-laboratorium etter Anthropics oppkjøp av Coefficient Bio

Anthropic kjøper Coefficient Bio for 400 millioner dollar – AI inn i legemiddeloppdagelse

Anthropic har kjøpt AI-biotekselskapet Coefficient Bio for 400 millioner dollar i aksjer. Selskapet, grunnlagt av tidligere Genentech-forskere, spesialiserer seg på AI-drevet legemiddeloppdagelse. Målet er å gjøre Claude til den ledende AI-modellen innen biologi.
Greg Brockman OpenAI president ser opp på stor skjerm med AGI-tidslinje i moderne auditorium

Greg Brockman: OpenAI er 70-80 prosent fremme mot AGI

OpenAI-president Greg Brockman sier han er 70-80 prosent sikker på at vi har nådd AGI – og at full AGI er innen rekkevidde de neste to årene. Men hva betyr egentlig disse tallene når ingen er enige om definisjonen?