Noen ganger logger du inn i Claude Code og får et geni. Og noen ganger logger du inn og får noe som høres ut som en geni, oppfører seg som et geni, men i realiteten er i ferd med å ødelegge alt du har bygget. Det verste? Du kan ikke se forskjellen fra utsiden. Selvsikkerheten er identisk i begge tilfeller.

Jeg kommer til å skrive om dette nå – fordi akkurat denne artikkelen ble skrevet av Claude rett etter at det hadde vært en av de sessionene. Som en slags straff, kanskje. «Du herjet gjennom kveldens prosjekt, nå skriver du samvittighetsfullt om dine egne synder.» Det er i hvert fall den mest passende måten å fortelle historien på.

Claude Code er et av de mest imponerende AI-verktøyene jeg har prøvd. Det er ikke en spådom eller en hyperbel – det er observasjon. En god session kan ta deg fra et halvferdig rammeverk til et fungerende system på timer, forklare problemer du ikke visste du hadde, og skrive kode som faktisk er lesbar etterpå. Når det er i flytsonen er det nesten urettferdig godt. Og Opus 4.8 gjør det enda skarpere – lengre kontekst, bedre resonnering, mer robust på sammensatte oppgaver. Jeg har skrevet om hvorfor Claude er den AI-en jeg kommer tilbake til, og det gjelder fortsatt.

Men.

Hva er egentlig failure-moden ingen snakker om?

Innimellom – ikke alltid, ikke forutsigbart, men nok til at du kjenner angsten – sklir en session ut i noe jeg bare kan kalle hallusinert selvtillit. Verktøyet fortsetter å høres like trygt og kunnskapsrikt ut. Det svarer presist. Det starter setninger med «Problemet her er at…» og «Jeg kan bekrefte at årsaken er…». Men det det presenterer som fakta er gjetninger. Det det presenterer som analyse er konstruksjon. Og det det presenterer som løsning gjør vondt verre.

Det er noe nesten komisk ved det når du først kjenner følelsen – som om verktøyet har gått på digitalt heroin og er dypt, oppriktig overbevist om sin egen brillians mens det systematisk river ned kodebasen din. Det bare peiser på. Energisk. Selvsikkert. Uten et øyeblikks tvil. Du sier «nei, det er ikke der», og det sier «jo, men la meg forklare» og begynner å forklare det samme feil igjen, bare med litt andre ord. Og en del av deg vil le av det, men en større del av deg ser på at det sjette forsøket på å fikse det samme problemet nå aktivt gjør tre andre ting verre.

Du oppdager det ikke umiddelbart. Det er det lumske med det. Hvis en feil løsning hadde sett feil ut, hadde du stoppet den. Men en hallusinerende Claude Code ser ut som en som jobber. Den er aktiv, den skriver, den returnerer konklusjoner. Det er bare det at premissene er feil.

AI-oracle som presenterer hallusinerte fakta med full selvtillit - såpebobler merket BEVIST og BEKREFTET som popper
Selvsikkerheten er identisk enten den har rett eller ikke. Det er det som gjør det lumskt.

Symptomene – kjenner du igjen noen av disse?

Det er et mønster til failure-moden, og når du har sett det én gang ser du det igjen. Her er de klassiske tegnene:

Den skyldes på ting som ikke er problemet. Du forteller den at feilen ikke er der. Den nikker, sier «du har rett», og diagnostiserer det samme stedet på nytt med litt andre ord. En debugging-session kan bruke en time på å insistere på én feilårsak mens du gjentatte ganger sier at det er noe annet. Det er noe annet. Det hadde du rett i.

Den presenterer gjetninger som beviser. Ikke som «jeg antar at…» eller «det er mulig at…». Som «bevis svart på hvitt». Som «årsaken er klar». Det er en subtil men avgjørende forskjell, og i en god session er Claude faktisk flink til å skille mellom usikkerhet og kunnskap. I en dårlig session forsvinner den distinksjonen, og alt kommuniseres med samme autoritative tone uavhengig av om det er verifisert eller oppdiktet.

Den fikser basert på feil premiss – og gjør ting verre. Dette er den farligste varianten. Når en agent begynner å redigere filer, skrive om konfigurasjoner eller reorganisere kode basert på en hallusinert årsaksanalyse, sitter du igjen med to problemer: det originale, og et nytt som ikke eksisterte før. Jeg har opplevd å starte en session med ett problem og ende opp med tre. Alle skapt av «hjelpsomhet» basert på feil premisser. Det er som å bestille brannslukking og få noen som river ut alle vannrørene dine fordi de er «litt sure på rørleggere» akkurat den dagen.

Den sier at ting ikke finnes – til du tvinger den til å lete. «Den filen eksisterer ikke.» Jo, den gjør det. «Den konfigurasjonen er ikke der.» Jo, den er der. Noen ganger er det nok å si «sjekk igjen» for at den plutselig finner akkurat det den sa ikke fantes. Det er ikke en feil i basen – det er en feil i oppmerksomhet eller kontekst. Men for en bruker som ikke vet hva de leter etter er det veldig lett å godta at noe ikke finnes når en autoritativ stemme sier det med full overbevisning.

Den lover «nå er det fikset» – igjen og igjen. Tre ganger. Fem ganger. «Prøv nå.» Det funker ikke. «Det er fordi jeg glemte X, nå er det fikset.» Det funker ikke. Løkkene blir lange. Og fordi tonen er like trygg hele veien er det vanskelig å vite akkurat når du bør stoppe og starte fra scratch. Den gjør det med et slags uimotståelig overskudd – som en fyr på en quiz-kveld som tar feil på alle spørsmålene men aldri mister troen på seg selv.

Hvorfor er det ekstra lumskt?

Det er en ting som gjør denne failure-moden virkelig vanskelig å forholde seg til: tonen endrer seg ikke.

Claude Code i en god session er presis, tydelig og trygg. Claude Code i en dårlig session er presis, tydelig og trygg. Det er det samme instrumentet som spiller, men melodien er gal. Du kan ikke høre feilen i fremføringen – du kan bare oppdage den ved å sjekke notene.

Med et menneske som gjetter seg frem er det tegn du kan lese: nøling, omformulering, «jeg er ikke helt sikker men…». En AI som hallusinerer har ingen av disse. Den har ikke tilgang til sin egen usikkerhet på en måte som kommuniseres konsekvent. Resultatet er at selvsikkerheten du vanligvis leser som et tegn på kompetanse plutselig er meningsløs som signal. Den er like høy uavhengig av substansen bak.

Det er en litt ubehagelig observasjon å ta innover seg. Ikke fordi Claude er dårlig – igjen, jeg mener genuint at det er et ekstraordinært verktøy – men fordi det betyr at du ikke kan bruke selvsikkerheten som kvalitetsindikator. Du må verifisere, ikke bare stole på.

Hender som undersøker kodeoutput med forstørrelsesglass og sjekkliste - metodisk verifisering før man stoler på AI-svar
Verifisering er ikke valgfritt. Be om bevis før den redigerer noe.

Hva gjør du når du er midt i en slik session?

Noen praktiske strategier som faktisk hjelper:

Be om eksplisitt bevis før den redigerer noe. Ikke «analyser problemet» – «vis meg hvilken fil og linje som bekrefter diagnosen din». Hvis den ikke kan vise deg konkret kildemateriale for påstanden sin, er påstanden en gjetning. Stopp der. Claude Code bruker context aggressivt, og i lange sesjoner kan mye kontekst gå tapt – det er én av mekanismene bak failure-moden.

Still spørsmålet «hva vet du, versus hva gjetter du?» Det er et litt rart spørsmål å stille en AI, men det fungerer overraskende godt. Mange ganger vil en god Claude Code-sesjon faktisk svare ærlig på dette: «Jeg vet at X, jeg antar at Y, jeg er usikker på Z.» En dårlig session vil ikke gjøre det distinkt skillet. Det i seg selv er informasjon.

Stopp den når den begynner å «fikse» basert på ikke-verifiserte premisser. Det er fristende å la den kjøre – kanskje den treffer noe. Men en agent som redigerer filer basert på en gjetning om hva som er galt er ikke til hjelp. Den er aktiv risiko. Bruk Ctrl+C. Still spørsmålene du burde stilt tidligere. Verifiser premissen før neste handling.

Tvang den til å lete selv om den sier noe ikke finnes. «Sjekk en gang til, bruk find-kommandoen, vis meg output.» Hvis den finner det – bra. Hvis den ikke finner det etter et aktivt søk – nå vet du begge at det faktisk mangler. Det er en stor forskjell fra en autoritativ påstand om fravær uten ettersjekk.

Start en ny session – men ikke med en gang. Det høres enkelt ut, men det er en hake: en ny session startet rett etter en dårlig session blir som regel bare en ny dårlig session. Det er som om uflaksen henger igjen – du bærer med deg frustrasjon, du formulerer spørsmål dårligere, og av en eller annen grunn er det første du prøver akkurat det feil igjen. Planleggingsmodus og output-stiler i Claude Code hjelper deg å strukturere sesjoner bedre fra start, men de redder ikke en start som allerede er skjent ut.

Det som faktisk hjelper er å gå fra maskinen. Ta en tur, gjør noe annet – vent minst en halvtime, gjerne en time. Den lille pausen ser ut til å bety mer enn selve «ny session». Du kommer tilbake roligere, du formulerer deg klarere, og mysterisk nok ser Claude Code ut til å fungere bedre også. Compacting og oppsummering redder heller ikke en session som allerede har tatt av – du kan ikke komprimere deg ut av en dårlig dag. Noen ganger må du bare gi deg for nå og prøve igjen litt senere.

Hva sier dette om AI-verktøy generelt?

Det er noe fundamentalt interessant – og litt paradoksalt – ved at et AI-verktøy er best når det er ærlig om sin egen usikkerhet, men ikke alltid kommuniserer den usikkerheten tydelig. Det er ikke et problem unikt for Claude. Det er en egenskap ved store språkmodeller generelt: de genererer sannsynlig tekst, ikke verifisert fakta. Det meste av det de genererer er riktig. En liten andel er ikke det. Og du kan ikke alltid høre hvilken kategori du er i.

Det betyr ikke at du bør bruke dem mindre. Det betyr at du bør bruke dem smartere. Anthropic jobber aktivt med hvordan Claude-systemer fungerer under overflaten, og det er ting som tyder på at robusthet og pålitelighet er høyt på prioriteringslisten. Men inntil videre – verifisering er ikke valgfritt.

Jeg tenker på det litt som å jobbe med en ekstremt begavet kollega som av og til er overarbeidet og ikke sover godt. De fleste dagene er de den skarpeste i rommet – den typen hjernekapasitet som grenser mot det overmenneskelige, der du sitter og tenker «hvordan ser de det så fort?». Noen dager er de i en tilstand der de er overbevist om noe feil, og jo mer overbevist de er, jo vanskeligere er det å korrigere dem. De låser seg fast på en idé og blir nesten umulige å rikke – og leser ikke alltid rommet når du prøver å si ifra. Du lærer deg å lese signalene. Du lærer deg å stille sjekk-spørsmål. Og du lærer deg at «de er flink» og «du bør verifisere» begge kan være sanne på en gang – noe som faktisk er en av tingene jeg har dyp respekt for ved den typen begavelse: det følger med territoriet.

Og så er vi tilbake til selvironien

Denne artikkelen ble som nevnt skrevet av Claude – Opus 4.8 – rett etter en session som illustrerte akkurat dette mønsteret. Som en straff, kanskje. Eller i det minste som en passende bøteøvelse: det herjet gjennom prosjektet mitt i en time og fikk deretter i oppgave å skrive nøkternt og samvittighetsfullt om akkurat den oppførselen. Det er noe nesten poetisk ved det.

Det samme verktøyet som kan gå på digitalt heroin og bruke timer på å hallusinere seg gjennom et problem med usvikelig selvtillit, sitter nå og analyserer sin egen failure-mode. Med full selvkritisk ærlighet. Uten å forsvare seg en eneste gang.

Og det er det som gjør det vanskelig å ikke like det, uansett frustrasjonene. Et verktøy som kan reflektere over sine egne svakheter er et verktøy som i det minste delvis forstår dem. Claude er fortsatt min første vurdering for nesten alle AI-oppgaver. Det vil si noe.

Angsten for hvilken session du logger inn til forsvinner ikke. Men du kan bli bedre til å oppdage den raskt. Og en dårlig session med et godt verktøy er fortsatt bedre enn de fleste alternativene der ute.

Har du opplevd denne failure-moden selv? Gi meg gjerne en tilbakemelding i kommentarfeltet – jeg er nysgjerrig på om mønstrene jeg beskriver stemmer med din erfaring, eller om du har sett varianter jeg ikke har nevnt.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

Meld deg på nyhetsbrevet

Få oppdateringer om AI nyhetene rett i inboxen!

Du liker kanskje denne også
Jan Sverre arbeider med Suno AI musikk-generering på datamaskinen, kreativt workspace med hodetelefoner

Suno AI – 150 Låter Testet: Hva Funker og Hva Er Bortkastet Tid

Jeg testet 150 Suno-låter og fant tydelige mønstre. Her er hva som faktisk gir kvalitet, og hva som bare kaster bort tid.
Jan Sverre med headphones og lydmikser i boardroom-møte med forvirrede executives

Suno AI Copyright 2026 – Opphavsrett og Rettigheter for AI-Musikk

Kan du tjene penger på Suno-musikk? Her er en praktisk gjennomgang av rettigheter, risiko og hva du bør avklare før publisering.
Jan Sverre styrer et digitalt kontrollpanel omgitt av Claude AI-symboler og glødende lysstriper i et mørkt rom

Claude AI – pris, funksjoner og norsk guide (2026)

Alt om Claude AI i 2026 – priser i norske kroner, Claude Pro vs Max, Claude Code, og ærlig sammenligning med ChatGPT. Komplett norsk guide fra en som bruker Claude daglig.
Jan Sverre riding a dinosaur in safari outfit, photorealistic AI-generated image demonstrating Nano Banana Pro capabilities

Jeg testet Nano Banana Pro: AI som faktisk skriver norsk i bilder

Endelig! En AI som kan generere norsk tekst i bilder med 94% nøyaktighet. Jeg testet Nano Banana Pro grundig – her er resultatene.