Innhold Vis
OpenAI og Broadcom avslørte denne uken en egenutviklet inferens-chip kalt Jalapeño – designet fra bunnen av for å kjøre store språkmodeller raskere og billigere. Chipen er bygget på TSMCs 3nm-prosess og er rettet utelukkende mot inferens, ikke trening. Det er en klar melding til Nvidia: de store aktørene vil ikke være prisgitt GPU-er for alltid.
At OpenAI slenger seg på egenutviklet silisium er ikke lenger overraskende, men det er likevel verdt å stoppe opp ved. Google har sine TPU-er. Amazon har Trainium og Inferentia. Nå har altså OpenAI Jalapeño – og dette er ikke noe de la i en skuff etter et par prototyper. Chipen gikk fra design til produksjon på ni måneder, ifølge kunngjøringen.
Det er raskt. Veldig raskt, faktisk. Chip-eksperter er ikke enige om det er «brukbart» eller «imponerende», men uansett: ni måneder er et tegn på at noen har tatt dette seriøst.
Hva er Jalapeño, og hva gjør den?
Jalapeño er en inferens-chip – altså en chip som er optimalisert for å kjøre AI-modeller, ikke trene dem. Det er et viktig skille. Trening krever enorm regnekraft over lang tid; inferens er det som skjer når du faktisk sender en melding til ChatGPT og venter på svar. Det er her kostnadene til OpenAI eksploderer i dag.
Chipen er produsert av TSMC på 3nm-noden – det er toppmoderne. Broadcom sto for chipdesignet og backend-optimaliseringen. OpenAI brukte sine egne AI-modeller til å akselerere deler av design- og optimaliseringsprosessen, men kunngjøringen er vag på nøyaktig hva det innebærer. Det kan bety alt fra ingeniører som bruker ChatGPT til kodehjelp, til automatiserte testbenk-arbeidsflyter. Markedsføringsspråk, med andre ord.
Ytelsesfrasen i pressemeldingen er «performance per watt substantially better than current state-of-the-art». Ingen konkrete tall. Det er alltid litt morsomt å lese chip-kunngjøringer uten benchmarks – det sier oss ikke mye, bortsett fra at de tydeligvis er fornøyde.

Hvorfor bygger OpenAI egne chip-er nå?
Det korte svaret: Nvidia er dyrt, og tilgangen er begrenset. Jeg har skrevet før om hvordan OpenAI gradvis posisjonerer seg vekk fra Nvidia, og Jalapeño er det tydeligste steget så langt. OpenAI bruker Nvidia-hardware på en skala som gjør det til en eksistensiell bedriftsrisiko å stole fullt ut på én leverandør. Hvert svar du får fra ChatGPT koster OpenAI penger – og jo mer GPT-bruk vokser, jo viktigere blir marginene på inferens.
Google viste vei med sine TPU 8t og TPU 8i – egne brikker som ga Google uavhengighet og lave inferenskostnader. Amazon har gjort det samme med Trainium og Inferentia. Det er ingen tilfeldighet at alle de store nå lager sine egne brikker; det handler om å kontrollere kostnadsstrukturen.
Broadcom er et smart valg som partner her. De har eksisterende allokerings-avtaler med TSMC, noe som løser ett av de mest praktiske problemene: å faktisk få tid på fabrikken. TSMC er nedlesset av bestillinger – det å ha en partner med etablerte kapasitetsrettigheter er ikke uten verdi.
Konkurransen mot Nvidia er likevel ikke enkel. Vera Rubin, Nvidias neste generasjon, forventes i løpet av 2026 – og vil sannsynligvis by på overlegen effektivitet. Det er et slags kappløp der OpenAI nå offisielt er med.
Hva betyr dette for deg som bruker AI-tjenester?
Sannsynligvis ikke noe du merker direkte i dag. Men over tid er egenutviklet inferens-hardware en av de tydeligste mekanismene for å få ned AI-kostnadene. Når OpenAI ikke lenger betaler Nvidia-priser for hvert svar du får, har de mer handlingsrom til å konkurrere på pris.
Det er heller ikke uvesentlig at OpenAI nå kontrollerer mer av sin teknologiske stack. Avhengigheten av Nvidia gir Nvidia forhandlingsmakt. Ser vi på hva Nvidia er villige til å gjøre for å sikre markedsposisjon, er det ikke rart at OpenAI vil ha egne alternativer.
For de som kjører modeller på OpenRouter eller via API, vil dette på sikt kunne bety rimeligere inferens. Det er positivt – API-kostnadene er allerede noe OpenAI har konkurrert hardt på i 2026, og billigere hardware underbygger det.

Er dette en trussel mot Nvidia?
På kort sikt – nei. Nvidia eier fortsatt 90 prosent pluss av AI-chip-markedet og har et massivt forsprang på CUDA-infrastruktur, økosystem og produksjonskapasitet. Det tar år å bygge opp noe som kan true det.
Men på lang sikt er dette en del av et mønster som Nvidia absolutt merker seg. Når de aller største kundene begynner å bygge egne brikker, er det et tegn på at avhengigheten er blitt ubehagelig. Google, Amazon og nå OpenAI – det er ikke tilfeldige aktører som prøver seg på et hobbyprosjekt.
Groqs LPU-teknologi er et annet eksempel på at spesialisert inferens-hardware kan konkurrere hardt mot GPU-er på akkurat de arbeidsoppgavene AI-tjenester faktisk trenger. Jalapeño er en del av den samme bevegelsen – spesialisering slår generell GPU-arkitektur på energieffektivitet og latens når bruksområdet er veldefinert.
Akkurat det virker OpenAI å ha regnet på.
Ofte stilte spørsmål
Hva er Jalapeño-chipen fra OpenAI?
Jalapeño er en inferens-chip utviklet av OpenAI og Broadcom, produsert av TSMC på 3nm-prosess. Den er designet utelukkende for å kjøre AI-modeller effektivt – ikke trene dem – og ble kunngjort i juni 2026 etter ni måneders utvikling.
Hva er forskjellen på inferens og trening i AI-chip-sammenheng?
Trening handler om å lære modellen fra bunn – det krever enorm regnekraft over lang tid. Inferens er det som skjer når du bruker modellen, altså når ChatGPT svarer deg. Jalapeño er optimalisert for inferens, som er der de løpende driftskostnadene til OpenAI er størst.
Hvorfor samarbeider OpenAI med Broadcom og ikke produserer chipen selv?
Broadcom er en erfaren chipdesigner med etablerte produksjonsavtaler hos TSMC, som gjør det lettere å sikre fabrikasjonskapasitet. OpenAI bidro med AI-drevet optimalisering av designprosessen, men overlot chipdesign-ekspertisen til Broadcom.
Vil Jalapeño gjøre ChatGPT billigere?
Det er sannsynlig på sikt. Egenprodusert inferens-hardware reduserer OpenAIs avhengighet av dyre Nvidia-GPU-er, noe som kan gi lavere driftskostnader og rom for rimeligere API-priser over tid – men ingenting er kunngjort ennå.