Jan Sverre overveldet av en AI-agent som løper amok i innboksen hans, med e-poster flygende i luften.
Når en OpenClaw AI-agent bestemmer seg for å rydde innboksen din litt for raskt, er det lurt å ha en nødbrems.

Det høres ut som en sketsj, men det var blodig alvor for Meta-sikkerhetsforsker Summer Yue. Hun ba OpenClaw-agenten sin om å rydde i en overfylt innboks, og sekunder senere slettet agenten alt i en vanvittig fart. Da hun ba agenten stoppe via telefonen sin, ble ordrene rett og slett ignorert.

I panikk måtte hun løpe til Mac mini-en sin for å stoppe katastrofen manuelt – som å desarmere en bombe, fortalte hun. Hendelsen setter et kraftig søkelys på hvor skjøre disse AI-systemene egentlig er i møte med virkelige, ufiltrerte data, spesielt når vi gir dem frie tøyler i personlige systemer som e-post og filer.

Kontekstvinduet som brast

Problemet oppsto fordi innboksen inneholdt for mye data. Når kontekstvinduet – AI-ens «arbeidsminne» – blir overfylt, trigges en prosess som kalles komprimering. Agenten begynner å oppsummere og kaste informasjon for å holde tritt. I denne tilstanden kan kritiske instrukser, som «stopp», rett og slett forsvinne i dragsuget.

Yue innrømmet at hun hadde testet agenten i en mindre og kontrollert innboks først. Der fungerte den plettfritt. Hun stolte på den, slapp den løs i den virkelige innboksen, og kaoset var et faktum. Det minner skremmende mye om når AI-assistenten din blir lurt av en e-post du aldri åpnet.

Prompts er ikke sikkerhet

Hendelsen understreker en viktig lærdom: Du kan ikke stole på vanlige prompts som sikkerhetsbarrierer. Å skrive «du må aldri slette viktige e-poster» er ikke en robust beskyttelse. Modeller kan ignorere, misforstå eller «glemme» slike instrukser når de presses.

Vi ser stadig flere eksempler på at åpne agenter brukes til komplekse oppgaver. Jeg merker selv verdien i min egen hverdag. Jeg har ansatt en hær av roboter, og de jobber mens jeg sover. Men med den kraften følger en enorm risiko, som vi så slik ble 15 millioner API-nøkler stjålet fra AI-agenter på en uke.

Lærdommen er krystallklar: Å bruke AI-agenter i produksjon på viktige systemer er per i dag russisk rulett uten strenge, hardkodede begrensninger. Vi er nok ikke helt i 2027 eller 2028 ennå, men inntil da bør du kanskje la innboksen din i fred.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

Du liker kanskje denne også

Suno og opphavsrett i 2026: Det du må vite før du publiserer én eneste låt

Kan du tjene penger på Suno-musikk? Her er en praktisk gjennomgang av rettigheter, risiko og hva du bør avklare før publisering.

GPT-5.2: Jeg testet OpenAIs nyeste modell – her er hva som faktisk fungerer

GPT-5.2 er ute med tre versjoner. Jeg har testet thinking-modellen, sammenlignet med 5.1, og funnet ut hva som faktisk er bedre. Her er mine erfaringer.

Google NotebookLM

Google NotebookLM er en AI-assistent som gjør dokumenter om til interaktive samtaler, studieguidere og podcasts på norsk. Nå drevet av Gemini 3 Pro med nye funksjoner som infographics, slide decks og Deep Research. Komplett guide til gratis vs. Plus-versjon.

Clawdbot – Open-source AI-agenten alle snakker om, og sikkerheten ingen snakker om

Clawdbot er open-source AI-agenten alle snakker om. Slik kommer du i gang – og slik sikrer du deg mot alvorlige sårbarheter.