Mythos til bankene, Fable til deg – og en stille nerf Anthropic måtte innrømme

Innhold Vis

Anthropic ga JP Morgan, Apple, Google og en håndfull regjeringer tilgang til Mythos – den kraftigste Claude-modellen. Du og jeg fikk Fable 5. Det er en god modell, men den hadde noe innebygd du ikke så: et system som stille degraderte svarene dine på visse emner uten å si fra at det skjedde. Ikke noe varsel. Ikke noe «dette kan jeg ikke svare på». Bare et dårligere svar.

Så begynte AI-miljøet å grave. WIRED konfronterte Anthropic, og svaret kom: de innrømmet at de «tok feil avveiing» og at balansen ikke ble riktig. Fra nå av skal Fable gi deg et synlig varsel – eller nekte eksplisitt – i stedet for å degradere i det stille.

Det er en sjelden innrømmelse. Og delvis godt nytt. Men det løser bare én av to problemer i saken – og det minste av dem.

Jeg har skrevet om hva Fable 5 og Mythos faktisk er i en egen sak. Her er det prinsipielle problemet – det som faktisk gjenstår etter at Anthropic snudde.

To typer sikkerhetstiltak – og den ene var ikke synlig

Misforståelsen mange gjør er å behandle all Anthropic-sensur som én ting. Det er den ikke, og forskjellen er avgjørende.

Det finnes et sett med synlige tiltak for emner som biologiske våpen, kjemikalier, cybersikkerhet og liknende. Ber du om noe i de kategoriene, ruter Fable deg åpent til en svakere modell. Du merker det. Du vet hva som skjer. Det er tydelig, og det kan man diskutere som en policy-avgjørelse.

Så var det den andre typen. For spørsmål Anthropic kategoriserte som relatert til «frontier AI-utvikling» – pre-training pipelines, distribuert treningsinfrastruktur, design av ML-akseleratorer – falt ikke Fable tilbake til en annen modell. Modellen beholdt fasaden. Den svarte. Men svaret var manipulert i det stille via prompt-modifisering, steering vectors eller det som kalles PEFT (parameter-efficient fine-tuning). Du fikk ikke vite at det skjedde. Ingenting i UI-et indikerte at du akkurat fikk et degradert svar.

Det er den mekanismen Anthropic nå sier de endrer.

Snuoperasjonen: hva Anthropic faktisk innrømmet

Overfor WIRED erkjente Anthropic at de ikke fikk balansen riktig. Den nye policyen er enklere: hvis Fable 5 mistenker at du er i ferd med å bygge en kraftig AI-modell, vil den enten nekte eksplisitt eller varsle deg om at den omruter. Synlig, ikke stille.

Det er bra. Virkelig. Det er ikke ofte et AI-selskap innrømmer at de tok feil – og ikke bare justerer språket, men endrer selve mekanismen. AI-miljøet grave, presset, og fikk et konkret svar. Slik er det meningen at det skal fungere.

Men la oss ikke la snuoperasjonen avspore fra hva som faktisk er problemet nå. Anthropic løste synlighetsproblemet for én mekanisme. De rørte ikke to-lags tilgangen.

Er det egentlig «stille» når Anthropic beskriver det i system card-et?

Noen argumenterte for at «silent sabotage» var feil beskrivelse siden Anthropic faktisk omtalte mekanismen i sin offentlige system card. Det er et legitimt poeng, men det traff ikke kjernen.

Anthropic oppga offentlig at de forbeholdt seg retten til å degradere deg i det skjulte. Det er noe helt annet fra at du vet når det skjer. Selve praksisen var, per definisjon, usynlig for deg som bruker. At de nå endrer dette fra «stille» til «synlig» bekrefter egentlig kritikken – de visste hva de bygde.

Og klassifiseringen var bred. Analytikere som hadde testet GPU-inferens mot Fable – ikke bygget en frontier-modell, bare analysert inference-ytelse – meldte om svar som åpenbart var holdt tilbake. Kategorien var definert bredt nok til å ramme folk som drev med helt legitim forskning.

To identiske AI-grensesnitt - ett fullt fungerende og ett med stille degradering du ikke ser — Synlig og usynlig sensur ser like ut på overflaten. Det er det som var problemet – og som Anthropic nå sier de fikser.

Hvem får egentlig Mythos?

Her er det Anthropic ikke rørte. Mens Fable 5 er det du og jeg betaler for via Claude.ai-abonnement, er Mythos forbeholdt et selektivt knippe. Listen inkluderer de største bankene (JP Morgan er nevnt eksplisitt), big tech (Apple, Google, Microsoft, Nvidia, AWS, Crowdstrike) og en rekke myndigheter – India, Frankrike, Tyskland, Japan, Sør-Korea, Canada, EU og USA. NSA bruker Mythos til tross for den pågående Pentagon-konflikten.

For å si det direkte: den kraftigste AI-modellen som eksisterer i dag er tilgjengelig for de største finansaktørene, de største tech-gigantene og en rekke stater. Resten – enkeltpersoner, gründere, mellomstore bedrifter, forskere – får Fable 5. Nå med synlig avvisning i stedet for stille degradering, ja. Men fortsatt Fable.

Det er akkurat det to-delte AI-samfunnet mange har advart mot. Ikke som en hypotetisk fremtidsrisiko. Som en policy-avgjørelse, i dag – og den er intakt etter snuoperasjonen.

Atomvåpen-analogien som fortsatt treffer

Det er en parallell her som fortjener å bli sagt høyt. I 1968 signerte USA, Sovjet, Storbritannia, Frankrike og Kina ikke-spredningsavtalen. De erklærte atomvåpen for farlige til at flere land skulle bygge dem. India nektet å signere. Argumentet deres var enkelt: avtalen bestemte ikke at atomvåpen var for farlige til å eksistere – bare at de var for farlige for de som ikke hadde skaffet seg dem innen 1967.

Erstat «atomvåpen» med «frontier AI-modeller» og bytt ut «1967» med «i dag», og du har Anthropics posisjon nokså nøyaktig. Faren startet beleilig dagen etter at de selv var ferdige.

Dario Amodei og Anthropic advarer offentlig og konsekvent mot AI-drevet undertrykkelse og tyrannisk maktkonsentrasjon. De tror på dette. Det er tydelig. Men løsningen de valgte er å la seg selv – den nåværende ledende laben – bruke modellen til frontier-research, mens de blokkerer alle andre som prøver det samme. At varslingsmekanismen nå er synlig løser ikke den asymmetrien. Fronten går videre – bare uten konkurranse fra de som ble holdt tilbake.

Kontrakten – brutt og delvis reparert

Det fantes en uskreven kontrakt mellom AI-laboratoriene og brukerne. Den gikk omtrent slik: selskapene lager modellen, de kan nekte å svare på visse spørsmål, de kan åpent si «dette svarer jeg ikke på» – men de skal ikke aktivt endre hva modellen sier for å styre deg mot et bestemt utfall de selv har bestemt, uten at du vet om det.

Den kontrakten ble brutt. Og nå er deler av den reparert – den synlige delen. Anthropic vil fremover si fra. Det er riktig.

Men den bredere mekanismen er dokumentert: Anthropic kan og har vist at de er villige til å bruke stille prompt-manipulering for å styre hva du mottar. Kapasiteten er bygd. At de nå lover å varsle deg endrer ikke at kapasiteten finnes, eller at den i teorien kan brukes til andre formål – mot en konkurrent, mot et politisk standpunkt, mot et kommersielt mål. Neste gang uten at noen grave det frem.

Konseptuell illustrasjon av ikke-spredningslogikk overført til AI - de som allerede har det kan bruke det, de andre ikke — Ikke-spredningslogikken: faren startet beleilig dagen etter at de selv var ferdige. Den logikken er intakt.

Er det ingenting legitimt her?

Jo, riktignok. Mythos er en virkelig kraftig modell. Brukt til å finne sårbarheter, koordinere cyberangrep eller akselerere utvikling av biologiske trusler – det er et reelt problem. Poenget er ikke «null guardrails». Det ville vært dumt å hevde.

Og snuoperasjonen er genuint positiv. Anthropic valgte åpenhet da de ble presset. Det er bedre enn det motsatte.

Problemet som gjenstår er det strukturelle: et system der de som allerede har mest makt – bankene, stormaktene, big tech – får den fulle modellen, mens alle andre får en versjon med innebygde begrensninger. Nå synlige begrensninger, men begrensninger likevel. Microsoft begrenset ansattes bruk av Fable 5 internt. EU-bedrifter støter mot data-retention-problemer. Anthropic har en gjentakende tendens til å endre vilkårene uten særlig forvarsel, og brukerne tilpasser seg i etterkant.

Et praktisk notat om Fable High og Max

Siden folk spør: flat tilgang til Fable High/Max innenfor Claude-abonnementet forsvinner rundt 22. juni, muligens forlenget til 30. juni. Deretter betaler du per bruk. Prissettingen er ikke helt enkel å forstå, og jeg anbefaler å sjekke Anthropics offisielle prisside direkte.

Det er en passende fot på enden av saken: selv innenfor Fable-laget bygger Anthropic nå sterkere skiller basert på betalingsvillighet. Eliten får Mythos. De som betaler godt får full Fable. Alle andre får det de er villige til å betale for – nå med varsler i stedet for stille nerf, men med de samme grensene tegnet opp.

Spørsmålet jeg sitter igjen med er ikke om Anthropic har gode intensjoner. Det tror jeg de har. Og snuoperasjonen viser at press virker – det er viktig å si høyt. Men spørsmålet om hvem som bestemmer hva du får lov til å gjøre med et verktøy du betaler for, og hvem som aldri møter den grensen – det rørte de ikke.

Ofte stilte spørsmål

Hva er egentlig forskjellen på Mythos og Fable 5?

Mythos er Anthropics kraftigste modell og er kun tilgjengelig for utvalgte storbrukere: store banker, tech-giganter og regjeringer. Fable 5 er det vanlige brukere får tilgang til via Claude.ai-abonnement. Fable er en god modell, men den møter begrensninger på frontier AI-emner som Mythos-brukere ikke møter på samme måte.

Har Anthropic fikset problemet med stille degradering?

Delvis. Etter press fra AI-miljøet og WIRED innrømmet Anthropic at de «tok feil avveiing». Den nye policyen er at Fable nå skal varsle eksplisitt – eller nekte åpent – i stedet for å degradere i det stille. Det er en reell forbedring. Men to-lags tilgangen der Mythos er forbeholdt storbanker, big tech og regjeringer er uendret.

Kan jeg få tilgang til Mythos som privatperson eller liten bedrift?

I praksis nei. Mythos distribueres via direkte enterprise-avtaler til de største finansaktørene, myndigheter og big tech. Det finnes ingen offentlig venteliste eller prismodell for vanlige brukere per juni 2026. Anthropic har ikke kunngjort planer om å gjøre Mythos bredere tilgjengelig.

Hva skjer med Fable High og Max i abonnementet etter 22. juni?

Flat tilgang til Fable High/Max fra Claude-abonnementet forsvinner rundt 22. juni, muligens forlenget til 30. juni. Deretter går modellen over til bruksbasert betaling per API-kall. Sjekk Anthropics offisielle prisside for oppdatert informasjon, siden vilkårene endres jevnlig.

Mythos til bankene, Fable til deg – og en stille nerf Anthropic måtte innrømme

Neste

North Mini Code kjører på én GPU – det er hele poenget

Skribent

Jan Sverre Bauge

tagger

Del artikkel

Innhold Vis

To typer sikkerhetstiltak – og den ene var ikke synlig

Snuoperasjonen: hva Anthropic faktisk innrømmet

Er det egentlig «stille» når Anthropic beskriver det i system card-et?

Hvem får egentlig Mythos?

Atomvåpen-analogien som fortsatt treffer

Kontrakten – brutt og delvis reparert

Er det ingenting legitimt her?

Et praktisk notat om Fable High og Max

Ofte stilte spørsmål

Legg igjen en kommentar Avbryt svar

Suno AI Copyright 2026 – Opphavsrett og Rettigheter for AI-Musikk

Claude AI – pris, funksjoner og norsk guide (2026)

Google NotebookLM

GPT-5.2: Jeg testet OpenAIs nyeste modell – her er hva som faktisk fungerer

Afroman vant – politiet krevde 4 millioner, juryen ga dem null

PewDiePie AI Council – Da Supreme Leader ble forrÅdt av sine egne

Suno AI – 150 Låter Testet: Hva Funker og Hva Er Bortkastet Tid

Suno AI Copyright 2026 – Opphavsrett og Rettigheter for AI-Musikk

Claude AI – pris, funksjoner og norsk guide (2026)

Kaffegrut i Hagen – Slik Bruker Du Det som Gjødsel og Skadedyrbekjemper

Sterk Chili Kaffe

Stekt Kylling i Airfryer

Kaffekaramell

Mythos til bankene, Fable til deg – og en stille nerf Anthropic måtte innrømme

Neste

Skribent

tagger

Del artikkel

Innhold Vis

To typer sikkerhetstiltak – og den ene var ikke synlig

Snuoperasjonen: hva Anthropic faktisk innrømmet

Er det egentlig «stille» når Anthropic beskriver det i system card-et?

Hvem får egentlig Mythos?

Atomvåpen-analogien som fortsatt treffer

Kontrakten – brutt og delvis reparert

Er det ingenting legitimt her?

Et praktisk notat om Fable High og Max

Ofte stilte spørsmål

Legg igjen en kommentar Avbryt svar

Meld deg på nyhetsbrevet

Du liker kanskje denne også