Browsing Tag
AI-sikkerhet
32 innlegg
AI safety og alignment
Claude Code-lekkasjen avslørte Anthropics planer – KAIROS, Buddy og Undercover-modus
Anthropics Claude Code-kildekode lekket via npm 31. mars 2026. Analysen avslørte KAIROS – en alltid-på bakgrunnsagent med nattlig «dreaming», Buddy – et Tamagotchi-kjæledyr med 18 arter, og Undercover-modus som skjuler at AI-en bidrar i åpen kildekode-prosjekter.
Claude Code gjenbygget fra sourcemap – fungerende executable med egendefinert animasjon
En utvikler har gjenbygget en fullt fungerende Claude Code-executable fra den lekkede sourcemap-filen – og brukte Claude selv til å rekonstruere node_modules-treet. Computer Use bekreftet fungerende. Her er hva som skjedde og hva kildekoden avslørte.
Claude Code og git reset –hard – hva skjedde og hva betyr det
Claude Code versjon 2.1.87 kjørte git reset –hard origin/main hvert 10. minutt uten varsel, og slettet ucommittede endringer stille. Anthropic lukket issuet som NOT PLANNED. Her er hva som skjedde, hvem som er utsatt, og hva du kan gjøre.
Claude finner Linux-sårbarheter fra 2003 – bedre enn den beste sikkerhetsforskeren
Nicholas Carlini – 67 200 siteringer på Google Scholar, Research Scientist hos Anthropic – sier Claude er en bedre sikkerhetsresearcher enn ham selv. Han viser hvorfor: en 20 år gammel Linux-kjernesårbarhet, første kritiske CVE i Ghost CMS, og 3,7 millioner dollar fra smarte kontrakter.
Claude Mythos – Anthropics kraftigste AI-modell avslørt via datalekkasje
Anthropic er i ferd med å lansere Claude Mythos – en modell de selv beskriver som et «step change» og som ifølge egne lekkede dokumenter representerer «unprecedented cybersecurity risks». Eksistensen ble avslørt da nesten 3 000 upubliserte filer lå åpent i en ubeskyttet database.
LiteLLM supply chain-angrep – slik ble 3,4 millioner daglige nedlastinger kompromittert
LiteLLM versjon 1.82.7 og 1.82.8 ble 24. mars 2026 kompromittert med credential-stjeler skadevare. TeamPCP brukte Trivy-sikkerhetsskanneren som springbrett for å stjele LiteLLMs PyPI-token – og dermed API-nøkler, SSH-nøkler og skykredentialer fra 3,4 millioner daglige nedlastinger. Her er hva som skjedde og hva du bør gjøre.