Innhold Vis
Er Anthropic virkelig KI-bransjens hvite ridder, eller bare enda en aktør som ignorerer regler for egen vinnings skyld? Et nytt søksmål fra Reddit kaster alvorlige skygger over selskapets selvpresentasjon som den etiske KI-utvikleren.
Reddit har nylig gått til søksmål mot Anthropic ved Superior Court of California i San Francisco fylke. De anklager selskapet for kontraktsbrudd, urettmessig berikelse, ulovlig inntrengning på personlig eiendom, rettsstridig innblanding i kontraktsforhold, og urettferdig konkurranse. Søksmålet er et kraftig angrep mot et selskap som har bygget sitt rykte på å være den ansvarlige, etiske aktøren i KI-landskapet.
Hvit ridder eller tom fasade?
I rettsdokumentene beskriver Reddit Anthropic som et «sent blomstrende kunstig intelligens-selskap som fremstiller seg selv som KI-industriens hvite ridder». Denne karakteristikken stemmer godt med Anthropics offentlige image – de har posisjonert seg som det sikreste KI-selskapet gjennom omfattende sikkerhetsforskning, strenge beskyttelsesmekanismer, og ved å vente lenger enn konkurrentene med å lansere modeller for å sikkerhetsteste dem grundig.
Men Reddit hevder at virkeligheten er en helt annen. Ifølge søksmålet er Anthropics påstander om å prioritere ærlighet og være styrt av uvanlig høy tillit bare «tomme markedsføringstriks». Søksmålet peker på flere påstander fra Anthropic som Reddit mener er usanne:
- Anthropic hevder at de ikke har til hensikt å trene modellene sine på personlige data, men Reddit påstår at selskapet bevisst har trent på Reddit-brukeres personlige data uten samtykke.
- Anthropic påstår at de respekterer industristandard direktiver i robots.txt-filer (som forteller søkemotorer og KI-selskaper om de har tillatelse til å indeksere eller skrape innhold), men flere nettsteder har anklaget Anthropic for å ignorere disse direktivene.
- I juli 2024 påsto Anthropic at de hadde blokkert sine boter fra å få tilgang til Reddit, men ifølge Reddits revisjonslogger fortsatte Anthropics boter å treffe Reddits servere over 100.000 ganger i de påfølgende månedene.
- Anthropic hevder at deres KI er programmert til å velge svar som best respekterer alles personvern, men i motsetning til konkurrentene har Anthropic nektet å respektere grunnleggende personvernrettigheter for Reddit-brukere, inkludert fjerning av slettede innlegg fra sine systemer.
Reddit som verdifull datakilde
Rettsdokumentene fremhever at Reddit er en av verdens mest verdifulle datakilder og beskriver plattformen som «den mest robuste online diskusjonsplattformen i verden». Reddit argumenterer for at deres omfattende samling av offentlig innhold har enorm nytteverdi, særlig som potensiell kilde for trening av store språkmodeller.
«Vi mener på det sterkeste at AI-selskaper trenger klare begrensninger på hvordan de bruker innholdet de skraper.» – Ben Lee, Reddits juridiske direktør.
Dette er nettopp grunnen til at Reddit har etablert et marked for lisensiering av innholdet sitt. KI-selskaper som OpenAI og Google har allerede inngått formelle partnerskap med Reddit, der de får tillatelse til å bruke offentlig Reddit-innhold etter å ha godtatt Reddits lisensvilkår som beskytter både Reddit og brukernes interesser og personvern.

Tidslinje for uautorisert databruk
Søksmålet hevder at Anthropic allerede i desember 2021, uten autorisasjon og i direkte strid med Reddits brukeravtale, trente sin Claude-modell på Reddit-brukeres innlegg. Reddit påpeker at Anthropics egne forskere, inkludert administrerende direktør Dario Amodei, har forklart at trening av KI-modeller på store offentlige preferansemodelleringsdata fra blant annet Reddit-kommentarer forbedret modellenes effektivitet betydelig.
Reddit inkluderer også en interaksjon med Claude der KI-modellen tilsynelatende bekrefter at den er trent på Reddit-data. Men det er viktig å merke seg at dette ikke nødvendigvis vil stå sterkt i retten, ettersom en KI-modells svar kan være upresist, hallusinert, eller kan referere til Reddit-data som var tilgjengelig via andre nettsteder.
I motsetning til Anthropic har selskaper som OpenAI gjort det rette – de har inngått formelle avtaler. Dette har også vært lønnsomt for Reddit, som meldte om hele $60 millioner i årlig verdi på sin lisensavtale med Google for bruk av data til AI-trening.
Økonomisk skade og tap av trafikk
Et sentralt økonomisk argument i søksmålet er at uautorisert kommersiell bruk av Reddit-innhold skader selskapet direkte. Reddit argumenterer for at hvis Anthropic skraper deres data, vil folk gå til Anthropic for å få tilgang til menneskekurert Reddit-data istedenfor å besøke Reddit direkte, noe som potensielt kan skade plattformens trafikk og økonomi.
Steve Huffman, Reddits administrerende direktør, uttrykte sin frustrasjon tydelig: «Vi har hatt Microsoft, Anthropic og Perplexity til å handle som om alt innhold på internett er gratis for dem å bruke.» Dette synspunktet gjenspeiler en større frustrasjon blant innholdsskapere og plattformer over KI-selskapers tilnærming til datainnsamling.
Personvernproblematikk og sletting av data
Søksmålet fremhever også at Claude tilsynelatende ikke har noen mekanisme for å vite om Reddit-innhold som modellen er trent på senere har blitt slettet av brukere. Dette reiser alvorlige spørsmål om personvern og om brukernes rett til å få sitt innhold slettet faktisk blir respektert av KI-selskapene.
«Vi har inngått avtaler med selskaper som OpenAI og Google, som respekterer både våre brukeres og vår plattforms rettigheter. Anthropic har konsekvent nektet å følge samme standard.» – Utdrag fra Reddits uttalelse.
Dette står i sterk kontrast til andre aktører i bransjen som har implementert systemer for å respektere slettinger og personvernforespørsler. Manglende evne til å fjerne slettet materiale er ikke bare et etisk problem, men kan også bryte med personvernlovgivning i mange jurisdiksjoner.
Reddits krav og fremtidige implikasjoner
Reddit krever spesifikk oppfyllelse av avtaler, kompensasjon for skader, erstatning for tapte inntekter, og/eller tilbakeføring av Anthropics fortjeneste. Videre ber de om en rettslig kjennelse som forbyr Anthropic å fortsette å bruke Reddit-data eller -innhold i sine kommersielle tilbud.
Dette søksmålet kan få vidtrekkende konsekvenser for hele KI-industrien. Hvis Reddit vinner frem, kan det etablere viktige presedenser for hvordan KI-selskaper må forholde seg til datalisensiering og innholdsrettigheter i fremtiden.
En større debatt om KI-etikk og databruk
Saken mellom Reddit og Anthropic belyser den pågående debatten om etikk og lovlighet i bruken av offentlige data til AI-trening. Mens Reddit søker å beskytte sine brukeres personvern og kontrollere bruken av sitt innhold, hevder Anthropic at deres praksis er lovlig og nødvendig for utviklingen av avanserte AI-modeller.
Denne konflikten reflekterer bredere utfordringer i teknologiindustrien angående datatilgang, opphavsrett og etiske retningslinjer for AI-utvikling. Det setter også et viktig spørsmålstegn ved selvpresentasjonen til selskaper som påstår å være etiske ledere, men som anklages for nettopp de praksisene de kritiserer hos andre.
Hva tror du? Er Anthropic hypokritisk, eller er dette bare nok en rettslig tvist i det kompliserte landskapet av AI-utvikling? Del gjerne dine tanker i kommentarfeltet nedenfor!