Siste nytt
Claude finner Linux-sårbarheter fra 2003 – bedre enn den beste sikkerhetsforskeren
Nicholas Carlini – 67 200 siteringer på Google Scholar, Research Scientist hos Anthropic – sier Claude er en bedre sikkerhetsresearcher enn ham selv. Han viser hvorfor: en 20 år gammel Linux-kjernesårbarhet, første kritiske CVE i Ghost CMS, og 3,7 millioner dollar fra smarte kontrakter.
Cursor Composer 2 – ny AI-modell hvert femte time via real-time RL
Cursor oppdaterer Composer 2 med en ny modell-checkpoint hvert femte time ved hjelp av real-time reinforcement learning fra ekte brukerinteraksjoner. Her er en gjennomgang av metoden, tallene, og reward hacking-problemene de har møtt underveis.
Gemini 3.1 Flash Live – sanntids tale og video i API-et
Gemini 3.1 Flash Live er Googles nye audio-til-audio-modell for sanntids tale og video via Live API. Tilgjengelig fra 26. mars 2026 i Google AI Studio og Gemini API, med støtte for 90+ språk, WebSocket full-duplex, funksjonsanrop og lavere latens enn tidligere versjoner.
Claude Mythos – Anthropics kraftigste AI-modell avslørt via datalekkasje
Anthropic er i ferd med å lansere Claude Mythos – en modell de selv beskriver som et «step change» og som ifølge egne lekkede dokumenter representerer «unprecedented cybersecurity risks». Eksistensen ble avslørt da nesten 3 000 upubliserte filer lå åpent i en ubeskyttet database.
Seed IQ løser ARC-AGI-3 på lanseringsdagen – 95% menneskelig ytelse
Seed IQ løste alle syv spillene i ARC-AGI-3 på lanseringsdagen med en score tilsvarende 95% av beste menneskeyting. ChatGPT, Gemini, Grok og Claude scoret null. Her er hva det faktisk betyr – og hva som gjør systemet fundamentalt annerledes enn vanlige LLM-er.