Innhold Vis
xAI har akkurat sluppet Grok 4.20, og dette er ikke en vanlig modelloppgradering. Det er en helt ny måte å tenke på AI. I stedet for én AI som gir deg ett svar, setter Grok 4.20 fire spesialiserte AI-agenter til å diskutere og krangle seg frem til det beste svaret – i sanntid, før du ser noe som helst.
Jeg har fulgt AI-utviklingen tett i flere år nå, og dette er genuint noe nytt. Ikke bare markedsføringsprat om «bedre benchmark-tall», men en fundamental endring i hvordan en AI-modell fungerer under panseret.
Fire agenter som krangler: Grok, Harper, Benjamin og Lucas
La meg forklare hvordan dette fungerer. Når du stiller Grok 4.20 et spørsmål, blir det ikke bare sendt til én modell. I stedet aktiveres fire spesialiserte agenter som jobber parallelt:
Grok (Kapteinen) – Koordinatoren som bryter ned oppgaven, løser konflikter mellom de andre, og setter sammen det endelige svaret du ser.
Harper (Fakta-eksperten) – Denne agenten søker i sanntid på X (tidligere Twitter) og nettet for å faktasjekke påstander. Med tilgang til ~68 millioner engelske tweets per dag, har Harper oppdatert informasjon ned til millisekund-nivå.
Benjamin (Logikk- og kode-eksperten) – Her snakker vi rigøros steg-for-steg-resonnering. Benjamin verifiserer matematikk, sjekker programmeringskode, og stresser-tester logiske kjeder.
Lucas (Kreativitet og balanse) – Denne agenten tenker utenfor boksen. Lucas finner blindsoner, nye vinkler, og sørger for at svaret faktisk er nyttig for mennesker – ikke bare teknisk korrekt.
Hvorfor er dette en big deal?
Du har sikkert hørt om «hallusinasjoner» – når AI bare dikter opp ting som høres riktig ut. Det er et reelt problem med alle store språkmodeller, inkludert Claude (som jeg bruker daglig), GPT-4, og tidligere Grok-versjoner.
Grok 4.20 angriper dette problemet på en elegant måte: Før du får se svaret, har Harper allerede faktasjekket det, Benjamin har verifisert logikken, og Lucas har sjekket at det gir mening fra et menneskelig perspektiv. Alle tre kritiserer hverandre i sanntid. Det er som å ha et ekspertpanel som diskuterer svaret ditt før du får det.
Resultatet? xAI rapporterer dramatisk reduserte hallusinasjoner sammenlignet med Grok 4.1, som allerede hadde kuttet hallusinasjoner med 65% fra tidligere versjoner.
Bevist i praksis: Eneste profitable AI i aksjehandel
Dette er ikke bare teori. I Alpha Arena Season 1.5 – en live aksjehandel-konkurranse i januar 2026 – var Grok 4.20 den eneste AI-modellen som gikk i pluss. Fire varianter av Grok 4.20 tok fire av de seks toppplasseringene, mens konkurrenter fra OpenAI og Google endte i minus.
En av variantene oppnådde +34.59% avkastning. I en konkurranse hvor de andre taper penger, er det ganske imponerende.
Modellen brukte sanntids-sentiment fra X kombinert med prissignaler på 1-5 minutters horisont. Det er her Harper-agentens tilgang til X-firehosen virkelig viser sin verdi.
Hvordan skiller dette seg fra Claude og GPT?
OpenAI har eksperimentert mye med multi-agent-systemer. De har Swarm-rammeverket, o1/o3-modellene med utvidet resonneringstid, og Noam Brown (kjent for Diplomacy-AI) leder forskning på agentsystemer.
Men her er forskjellen: Alt dette er enten (a) noe du må bygge selv oppå modellene deres, eller (b) intern «chain-of-thought» i én modell som simulerer flere perspektiver.
Grok 4.20 leverer fire spesialiserte agenter innebygd i selve modellen. Du trenger ikke sette opp noe. Du stiller et spørsmål, og rådslagningen skjer automatisk.
Claude (som jeg bruker til det meste) er fortsatt fantastisk for mange oppgaver, spesielt lange dokumenter og nyansert resonering. Men denne multi-agent-tilnærmingen er noe helt annet.
Tekniske detaljer for nerden
For de som vil vite mer: Grok 4.20 kjører på xAIs Colossus-superklynge med over 200,000 GPUer. Modellen har 256K kontekstvindu (opp til 2 millioner tokens i agentic-modus), native multimodal støtte for tekst, bilde og video, og en estimert Arena Elo på 1505-1535 – som sannsynligvis vil ta førsteplass når den blir fullstendig rangert.
Og kostnaden? For vanlige brukere er det inkludert i SuperGrok (~$30/mnd) eller X Premium+. Ingen ekstra kostnad per spørring for det fulle fire-agent-systemet.
Min vurdering
Dette er genuint interessant. Ikke fordi xAI har laget «den beste modellen» – det er en kamp som skifter hver måned. Men fordi de har tatt en fundamentalt annerledes tilnærming.
I stedet for å bare skalere opp én modell, har de bygget et system hvor flere eksperter samarbeider. Det minner om hvordan menneskelige team fungerer: Du får bedre resultater når en faktasjekker, en logiker, og en kreativ tenker alle bidrar – i stedet for at én person prøver å være alt.
Er dette fremtiden for AI? Kanskje. Det som er sikkert er at konkurransen mellom Claude, GPT, Gemini og Grok aldri har vært mer interessant. Og for oss som bruker disse verktøyene daglig, er det bare gode nyheter.
Grok 4.20 er tilgjengelig nå på grok.x.ai og via X-appen for Premium+-brukere.
1 kommentar