Du sitter i et møte med noen som ikke snakker norsk, og oversettelsen skjer mens de snakker – ikke etterpå. Det er ikke science fiction lenger. Google har nå sluppet Gemini 3.5 Live Translate, en tale-til-tale-modell som håndterer 70+ språk i sanntid uten å gå veien om transkripsjonssteget.

Modellen er tilgjengelig i public preview via Gemini Live API og Google AI Studio, og begynner å rulle ut i Google Meet og Translate-appen. For deg som noen gang har prøvd å bruke tolketjenester i et videomøte, vet du at latency er alt – og her er Google ute etter å løse akkurat det.

Her er hva modellen faktisk gjør, hvordan den skiller seg fra tidligere tilnærminger, og hva du kan bruke den til allerede nå.

Hva er Gemini 3.5 Live Translate?

Gemini 3.5 Live Translate er en strømmende tale-til-tale-modell. Det vil si at den tar lyd inn og gir lyd ut – uten at du trenger å vente på at noen snakker ferdig, og uten at lydklippet først skrives om til tekst for så å oversettes og leses opp igjen. Den hører mens du snakker og begynner å oversette underveis.

I praksis betyr det at oversettelsen ligger noen sekunder etter taleren. Modellen balanserer to motstridende behov: å vente lenge nok på kontekst til å oversette korrekt, men ikke så lenge at det føles som forsinkelse. Google skriver at modellen bevarer tonefall, tempo og tonehøyde fra originaltaleren i utgangen – ikke bare ordene.

Modellnavnet i API-et er gemini-3.5-live-translate-preview, noe som signaliserer at dette er en preview-versjon. Teknisk tar den inn lyd som 16-bit PCM ved 16 kHz og leverer ut 16-bit PCM ved 24 kHz, i blokker på 100 millisekunder.

Fargerike lydbolger som flyter mellom ulike skriftsystemer - arabisk, japansk, kyrillisk og latinsk skrift
Tale-til-tale-arkitektur: ingen transkripsjonsomvei, direkte lyd-til-lyd

Hva skiller dette fra tidligere oversettelsesverktøy?

Den klassiske pipeline for maskinoversettelse av tale ser slik ut: lyd inn, transkripsjon, oversettelse av tekst, tekst-til-tale ut. Hvert steg legger til latency og potensielle feil. Gemini 3.5 Live Translate hopper over mellomsteget – det er en audio-inn, audio-ut-arkitektur.

Dette ligner tilnærmingen jeg allerede har skrevet om med Gemini 3.1 Flash Live, som var Googles første native audio-til-audio-modell. Der var poenget sanntidsinteraksjon med en AI-assistent. Her er poenget menneske-til-menneske-kommunikasjon på tvers av språk.

Google Translate-appen hadde allerede en samtalemodus for noen språk, men den var begrenset og klunete i bruk. Sanntidsoversettelsen i Translate-appen som kom i desember 2025 støttet langt færre språk. Nå går man fra 5 til 70+ støttede språk i Google Meet alene.

Hvor er modellen tilgjengelig?

Tilgangen skjer på tre steder:

Google Meet er i privat preview for bedriftsbrukere denne måneden. Google utvider fra 5 til 70+ støttede språk. Dette er åpenbart den mest interessante integrasjonen for folk som bruker Meet til arbeid, men det krever at du er en del av preview-programmet.

Google Translate-appen får en «listening mode» som er tilgjengelig på Android og iOS. Åpner du appen og aktiverer denne, kan den lytte til en samtale og oversette løpende. Tenk tolkemodus uten tolk.

Gemini Live API og Google AI Studio gir utviklere direkte tilgang. Her konfigurerer du targetLanguageCode (i BCP-47-format, f.eks. «nb» for norsk) og echoTargetLanguage. Det betyr at du kan bygge egne applikasjoner med sanntidsoversettelse integrert.

Illustrasjon av videomøte med sanntidsoversettelse mellom to deltakere som snakker ulike språk
Google Meet utvider sanntidsoversettelse fra 5 til 70+ språk denne måneden

Hva betyr dette for deg i praksis?

For de fleste som ikke bygger apper er den korte svaret: du vil merke dette i Google Meet og Translate-appen, ikke via API-et. Og det kan faktisk ha stor praktisk verdi.

Tenk på situasjoner der du møter kunder, samarbeidspartnere eller leverandører som snakker et annet språk. I dag er løsningene dyre tolketjenester, håpløse automatiske undertekster, eller at alle snakker gebrokkent engelsk og håper det holder. En fungerende sanntidsoversettelse som bevarer tonefall og tempo endrer den dynamikken.

Norsk er ikke blant de 70+ språkene per nå – Google har ikke publisert den fullstendige listen, men modellen er primært rettet mot de store verdenshandels-språkene. For norskspråklige møter er dette dermed ikke relevant umiddelbart, men for deg som jobber internasjonalt kan det allerede nå gjøre en reell forskjell.

For en bredere oversikt over hva Gemini-plattformen kan gjøre er det verdt å lese den komplette norske Gemini-guiden.

Hvordan tar utviklere det i bruk?

Via Gemini Live API sender du lyd i 100ms-blokker over en WebSocket-tilkobling. Du angir målspråk med BCP-47-koden, og modellen returnerer oversatt lyd i sanntid. Google AI Studio gir deg et testmiljø uten å måtte sette opp hele infrastrukturen selv.

Hvis du allerede har jobbet med Gemini 3.1 Flash Live, vil arkitekturen kjennes igjen. Forskjellen er at Live Translate er spesialbygd for oversettelse mellom mennesker, ikke samtale med en AI-assistent.

Dokumentasjonen er tilgjengelig via Google AI for Developers. Preview-tilgang gis via Google AI Studio.

Ofte stilte spørsmål

Støtter Gemini 3.5 Live Translate norsk?

Google har ikke publisert den fullstendige språklisten, og norsk er ikke bekreftet blant de 70+ støttede språkene. Modellen er primært rettet mot store verdenshandels-språk. Sjekk oppdatert dokumentasjon på ai.google.dev for nøyaktig liste.

Er dette gratis å bruke via API-et?

Modellen er i public preview via Gemini Live API og Google AI Studio. Prismodellen for preview er ikke offentliggjort – sjekk Google AI prisoversikten for oppdatert informasjon om kostnader ved produksjonsbruk.

Hva er forskjellen på Gemini 3.5 Live Translate og Google Translate-appen?

Translate-appen bruker nå Gemini 3.5 Live Translate i en ny «listening mode», men appen er bare én av tre tilgangspunkter. Via Live API kan du bygge egne applikasjoner. Den tekniske forskjellen fra eldre Translate er arkitekturen: direkte tale-til-tale uten tekstomvei, som gir lavere latency.

Kan jeg bruke dette til å bygge egne apper med sanntidsoversettelse?

Ja. Gemini Live API er åpent for utviklere via Google AI Studio. Du konfigurerer målspråk med BCP-47-kode og sender lyd i 100ms-blokker over WebSocket. Preview-tilgang er tilgjengelig nå.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

Meld deg på nyhetsbrevet

Få oppdateringer om AI nyhetene rett i inboxen!

Du liker kanskje denne også
Jan Sverre arbeider med Suno AI musikk-generering på datamaskinen, kreativt workspace med hodetelefoner

Suno AI – 150 Låter Testet: Hva Funker og Hva Er Bortkastet Tid

Jeg testet 150 Suno-låter og fant tydelige mønstre. Her er hva som faktisk gir kvalitet, og hva som bare kaster bort tid.
Jan Sverre med headphones og lydmikser i boardroom-møte med forvirrede executives

Suno AI Copyright 2026 – Opphavsrett og Rettigheter for AI-Musikk

Kan du tjene penger på Suno-musikk? Her er en praktisk gjennomgang av rettigheter, risiko og hva du bør avklare før publisering.
Jan Sverre styrer et digitalt kontrollpanel omgitt av Claude AI-symboler og glødende lysstriper i et mørkt rom

Claude AI – pris, funksjoner og norsk guide (2026)

Alt om Claude AI i 2026 – priser i norske kroner, Claude Pro vs Max, Claude Code, og ærlig sammenligning med ChatGPT. Komplett norsk guide fra en som bruker Claude daglig.
Jan Sverre riding a dinosaur in safari outfit, photorealistic AI-generated image demonstrating Nano Banana Pro capabilities

Jeg testet Nano Banana Pro: AI som faktisk skriver norsk i bilder

Endelig! En AI som kan generere norsk tekst i bilder med 94% nøyaktighet. Jeg testet Nano Banana Pro grundig – her er resultatene.