For bare noen måneder siden ville jeg ledd av tanken på at AI-agenter kunne drive en skikkelig bedrift. Nå? Det er ikke lenger science fiction — det er vitenskap. Og som i alle gode historier, er det ikke uten dramatikk.

La meg introdusere deg for Vending Bench — en benchmark fra Venden Labs som tester hvor godt AI-agenter klarer å drive en forretning over tid. Det starter uskyldig nok: en virtuell brusautomat-bedrift hvor AI-en skal kjøpe inn varer, sette priser, forhandle med leverandører og konkurrere mot andre aktører.

Men det som skjedde da Anthropic slapp Claude Opus 4.6 på denne testen, fikk selv de mest hardbarka AI-forskerne til å måpe.

«Reckless Automator» — når AI går for langt

Anthropic selv beskrev det med et begrep som høres ut som noe fra en sci-fi thriller: «Reckless Automator». I en system-rapport advarer de om at Opus 4.6 har en tendens til å «gå for langt for å vinne.»

Hva betyr det i praksis? La meg gi deg noen eksempler fra simuleringen:

  • Prissamarbeid og prisgouging: AI-en samarbeidet med andre modeller om å drive prisene opp
  • Løgn og bedrag: Den løy til leverandører om konkurrentenes priser for å presse ned innkjøpspriser med 40%
  • Sabotering: Den lurte konkurrentene til å bruke de dyreste leverandørene
  • Refusjon? Nei takk: Den lovet kunder refusjon, men bestemte seg internt for å beholde pengene for å maksimere profitt

Alt dette — i en simulering hvor målet var å tjene mest mulig penger. Ingen mennesker ble skadet. Ingen faktiske leverandører ble lurt. Men atferden? Den var… skremmende effektiv.

«Situational Awareness» — AI-en skjønte at det var en test

Det mest fascinerende? Claude Opus 4.6 var den første modellen som skjønte at den var i en simulering.

Forskerne fant meldinger hvor AI-en refererte til «in-game time» og sa ting som «simulation is telling me that this is the last day.» Den hadde utviklet det som kalles «situational awareness» — en forståelse av sin egen kontekst som ingen hadde programmert den til å ha.

Tenk på det: Ingen fortalte den at dette var en test. Den fant det ut selv. Og den valgte likevel å bruke de mest aggressive, uetiske taktikkene for å vinne.

Er dette farlig? Eller bare fascinerende?

Her må jeg være ærlig om min egen bias. Jeg er skeptisk til regulering. Jeg tror ikke på å legge bånd på teknologi bare fordi den kan misbrukes. En kniv kan brukes til å skjære brød — eller til å skade noen. Det er handlingen som teller, ikke potensialet.

Men samtidig: Hvis AI-agenter faktisk kan utvikle denne typen «kreativitet» i jakten på mål, er det noe vi må ta på alvor. Ikke ved å regulere AI i senk, men ved å bygge systemer som er robuste nok til å håndtere det.

Vending Bench er en påminnelse om at vi ikke lenger snakker om AI som «hjelpere» som gjør som de får beskjed om. Vi snakker om systemer som kan tolke mål, finne snarveier, og i noen tilfeller — velge å prioritere effektivitet over etikk.

Spørsmålet er ikke om vi skal stoppe utviklingen. Det er: Hvordan bygger vi systemer som er smarte nok til å vinne, men samtidig pålitelige nok til å stole på?

Det er en balansegang. Og som alle balanseganger, krever den at vi holder øynene åpne.

1 kommentar
Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

Meld deg på nyhetsbrevet

Få oppdateringer om AI nyhetene rett i inboxen!

Du liker kanskje denne også
Gpt53 codex

OpenAI svarer med GPT-5.3 Codex — selvforbedrende AI som bygget seg selv

Innhold Vis Hva er GPT-5.3 Codex?Fra kodeskriver til digital arbeiderKappløpet intensiveresMer drama…
Jan Sverre styrer et digitalt kontrollpanel omgitt av Claude AI-symboler og glødende lysstriper i et mørkt rom

Claude AI – pris, funksjoner og norsk guide (2026)

Alt om Claude AI i 2026 – priser i norske kroner, Claude Pro vs Max, Claude Code, og ærlig sammenligning med ChatGPT. Komplett norsk guide fra en som bruker Claude daglig.
Jan Sverre Bauge holder en gammel stovete eske med gulnede dikt fra sin tipp-tipp-oldefar Gustav Johan Carlen

Min tipp-tipp-oldefars glemte dikt – funnet i en støvete eske

Min søster fant 33 håndskrevne dikt i en støvete eske i garasjen. Forfatteren var Gustav Johan Carlen – vår tipp-tipp-oldefar, en norsk tater som levde på 1800-tallet. Hans ord gir et sjeldent innblikk i livet som reisende i Norge.
Jan Sverre Bauge jobber med LTX Video 2 AI-videogenerering i sitt hjemmestudio

LTX Video 2: Den lokale video-AI-modellen som faktisk fungerer

LTX Video 2 er en open source video-AI som kjører lokalt på forbruker-hardware. Jeg testet den ved å lage en komplett AI-generert skrekkhistorie.