GLM-5.2 lansert uten benchmarks - dette leverer Z.ais nye kodemodell

Innhold Vis

Z.ai slapp GLM-5.2 13. juni, og det er noe uvanlig med denne lanseringen: ikke ett eneste benchmark-tall ble publisert. Det er en liten revolusjon i AI-verdenen, der det normalt hagler med SWE-bench-prosenter og Arena-scoringer fra dag én. I stedet er det én ting Z.ai vil du skal se på: kontekstvinduet.

GLM-5.2 leverer 1 million tokens i kontekst. Det er fem ganger mer enn GLM-5.1 klarte med sine 200 000 tokens, og det er denne endringen som er hele poenget med denne utgivelsen. Modellen er tilgjengelig nå – på tvers av alle GLM Coding Plan-nivåene, fra Lite til Team.

Jeg har fulgt GLM-serien tett siden GLM-5 kom i februar, og dette er tredje gang på fire måneder Z.ai oppdaterer modellen. Det begynner å ligne noe.

Hva er et kontekstvindu på 1 million tokens verdt i praksis?

Et kontekstvindu på 1 million tokens betyr at du kan holde et helt mellomstort koderepository i arbeidsminnet uten at modellen må begynne å sammenfatte og glemme. Det er den praktiske konsekvensen, og det er vesentlig for alle som bruker AI til seriøst kodearbeid.

For å sette det i perspektiv: GLM-5.2 femdobler kontekstvinduet fra GLM-5.1s 200 000 tokens. Men 1 million tokens er ikke lenger unikt på toppnivå – Claude-flaggskipet Opus 4.8 kjører også på 1 million tokens, og det samme gjør Gemini. GLM-5.2 legger seg altså på linje med de største, ikke over dem. Det er likevel verdt å merke seg: et så stort vindu betyr at modellen kan holde mye mer kode i hodet på én gang uten å miste tråden.

Modellen heter glm-5.2[1m] i API-et, og kan returnere inntil 131 072 output-tokens per respons. Det er også markant mer enn de fleste konkurrentene.

Visualisering av et kontekstvindu på 1 million tokens - data strømmer inn i en AI-modell — 1 million tokens betyr at hele koderepositories kan holdes i modellens arbeidsminne

To tenkemodus-nivåer – High og Max

GLM-5.2 introduserer to tenkemoduser: High og Max. Z.ai anbefaler Max for komplekse, flerstegs kodeoppgaver. High er raskere og bruker mindre tokens, mens Max bruker mer tid og ressurser på å resonnere gjennom problemet.

Dette mønsteret kjenner vi fra andre modeller nå – tankemoduser er i ferd med å bli standard. Det interessante her er at Z.ai ikke sier mye mer om hva som skiller de to nivåene utover «kompleksitet». Ingen tall, ingen sammenligninger. Bare «bruk Max på vanskelige ting».

Det gir meg en viss respekt for tilnærmingen. I stedet for å love presise prosentpoeng, sier de i klartekst: vi vet ikke nøyaktig hva du trenger – prøv deg frem.

Dropper rett inn i Claude Code og OpenCode

Det som gjør GLM-5.2 spesielt interessant for folk som allerede bruker AI-kodeverktøy, er at modellen støtter en Anthropic-kompatibel endepunkt. Det betyr at den dropper rett inn som en drop-in-erstatning i Claude Code, Cline, OpenCode og OpenClaw – uten å måtte endre konfigurasjonen vesentlig.

Åtte agentic coding-verktøy er støttet fra dag én. Det er et smart grep: i stedet for å bygge en egen klient, sørger Z.ai for at GLM-5.2 snakker det språket utviklere allerede bruker.

Jeg synes det er en fornuftig strategi. Lavterskel-integrasjon vinner over spesialbygd innlåsing. Og for de som allerede er vant til Anthropic-APIet – som meg – er dette nærmest friksjonsfritt å teste.

Agentic coding-verktøy koblet sammen - Claude Code, Cline, OpenCode og OpenClaw med GLM-5.2 — GLM-5.2 støtter åtte agentic coding-verktøy fra dag én via Anthropic-kompatibelt endepunkt

MIT-lisens og open weights – men vent til neste uke

GLM-5.2 er lovet som open source under MIT-lisens. Vektene kommer neste uke, ifølge Z.ai. Det betyr at du kan laste ned og kjøre modellen lokalt – om du har maskinvare til det. Grunnmodellen er basert på GLM-5 med 744 milliarder parametre i en Mixture-of-Experts-arkitektur som aktiverer 40 milliarder parametre per token.

MIT-lisensen er viktig. Det er den samme lisensen som gjør at du kan bruke modellen kommersielt uten å betale royalties eller binde deg til spesifikke vilkår. For bedrifter som vil ha kontroll over sin egen AI-infrastruktur, er det en stor fordel. Det er også grunnen til at den kinesiske opprinnelsen er verdt å ha i bakhodet – Z.ai er Zhipu AIs kommersielle arm, og det er alltid greit å vite hvem som bygde verktøyet du bruker.

Ingen benchmarks – og det er kanskje et poeng

Z.ai publiserte null benchmark-tall ved lansering. Ingen SWE-bench, ingen Terminal-Bench, ingen Code Arena. Det er uvanlig, og jeg vil ikke påstå at det er dårlig – det er faktisk et grep jeg liker.

Benchmarks har blitt en konkurranse om å score høyt på tester, ikke nødvendigvis om å bygge modeller som er nyttige i praksis. GLM-5.1 toppet SWE-Bench Pro – og fikk mye oppmerksomhet for det. GLM-5.2 velger en annen kommunikasjonsstrategi: her er hva den gjør, prøv den selv.

Det er en tillitserklæring til brukerne, og den er litt tøff å svelge hvis du vil ha noe å sammenligne med. Men det er ærlig.

Hva koster GLM Coding Plan?

GLM-5.2 er inkludert i alle nivåer av GLM Coding Plan – Lite, Pro, Max og Team. Z.ai har ikke publisert nye prisdetaljer i forbindelse med denne lanseringen. For oppdatert prisinformasjon: sjekk z.ai direkte.

Det finnes også GLM-4.7 via API for de som vil prøve GLM-serien uten å binde seg til en abonnementsplan. Prisene på GLM-serien har historisk vært vesentlig lavere enn sammenlignbare Anthropic-modeller.

Med 1 million tokens i kontekst, MIT-lisens og dag-én-støtte for verktøy du allerede bruker, er GLM-5.2 verdt å holde øye med. Benchmarks eller ikke.

Ofte stilte spørsmål

Hva er GLM-5.2 og hvem har laget den?

GLM-5.2 er en stor språkmodell fra Z.ai – den kommersielle armen til Zhipu AI fra Kina. Den ble sluppet 13. juni 2026 og er den tredje oppdateringen i GLM-5-serien etter GLM-5-Turbo og GLM-5.1.

Hva er forskjellen på 1 million tokens kontekst og vanlige modeller?

GLM-5.2 tilbyr 1 million tokens kontekst – fem ganger mer enn GLM-5.1s 200 000. På toppnivå er 1 million tokens blitt vanlig (Claude Opus 4.8 og Gemini ligger der også), mens mange mindre modeller fortsatt holder seg rundt 128 000-200 000. Et stort vindu betyr at du kan holde et helt koderepository i arbeidsminnet under en arbeidsøkt uten at modellen mister kontekst.

Kan jeg bruke GLM-5.2 i Claude Code eller Cline?

Ja. GLM-5.2 støtter et Anthropic-kompatibelt endepunkt, noe som gjør det mulig å bruke den som drop-in-erstatning i Claude Code, Cline, OpenCode og OpenClaw uten vesentlig rekonfigurasjon.

Når kommer open weights for GLM-5.2?

Z.ai lovet MIT-lisensierte open weights uken etter lansering – det vil si rundt 20. juni 2026. Med MIT-lisensen kan du bruke modellen kommersielt og kjøre den lokalt uten å betale royalties.