Innhold Vis
Du sitter i et møte med noen som ikke snakker norsk, og oversettelsen skjer mens de snakker – ikke etterpå. Det er ikke science fiction lenger. Google har nå sluppet Gemini 3.5 Live Translate, en tale-til-tale-modell som håndterer 70+ språk i sanntid uten å gå veien om transkripsjonssteget.
Modellen er tilgjengelig i public preview via Gemini Live API og Google AI Studio, og begynner å rulle ut i Google Meet og Translate-appen. For deg som noen gang har prøvd å bruke tolketjenester i et videomøte, vet du at latency er alt – og her er Google ute etter å løse akkurat det.
Her er hva modellen faktisk gjør, hvordan den skiller seg fra tidligere tilnærminger, og hva du kan bruke den til allerede nå.
Hva er Gemini 3.5 Live Translate?
Gemini 3.5 Live Translate er en strømmende tale-til-tale-modell. Det vil si at den tar lyd inn og gir lyd ut – uten at du trenger å vente på at noen snakker ferdig, og uten at lydklippet først skrives om til tekst for så å oversettes og leses opp igjen. Den hører mens du snakker og begynner å oversette underveis.
I praksis betyr det at oversettelsen ligger noen sekunder etter taleren. Modellen balanserer to motstridende behov: å vente lenge nok på kontekst til å oversette korrekt, men ikke så lenge at det føles som forsinkelse. Google skriver at modellen bevarer tonefall, tempo og tonehøyde fra originaltaleren i utgangen – ikke bare ordene.
Modellnavnet i API-et er gemini-3.5-live-translate-preview, noe som signaliserer at dette er en preview-versjon. Teknisk tar den inn lyd som 16-bit PCM ved 16 kHz og leverer ut 16-bit PCM ved 24 kHz, i blokker på 100 millisekunder.

Hva skiller dette fra tidligere oversettelsesverktøy?
Den klassiske pipeline for maskinoversettelse av tale ser slik ut: lyd inn, transkripsjon, oversettelse av tekst, tekst-til-tale ut. Hvert steg legger til latency og potensielle feil. Gemini 3.5 Live Translate hopper over mellomsteget – det er en audio-inn, audio-ut-arkitektur.
Dette ligner tilnærmingen jeg allerede har skrevet om med Gemini 3.1 Flash Live, som var Googles første native audio-til-audio-modell. Der var poenget sanntidsinteraksjon med en AI-assistent. Her er poenget menneske-til-menneske-kommunikasjon på tvers av språk.
Google Translate-appen hadde allerede en samtalemodus for noen språk, men den var begrenset og klunete i bruk. Sanntidsoversettelsen i Translate-appen som kom i desember 2025 støttet langt færre språk. Nå går man fra 5 til 70+ støttede språk i Google Meet alene.
Hvor er modellen tilgjengelig?
Tilgangen skjer på tre steder:
Google Meet er i privat preview for bedriftsbrukere denne måneden. Google utvider fra 5 til 70+ støttede språk. Dette er åpenbart den mest interessante integrasjonen for folk som bruker Meet til arbeid, men det krever at du er en del av preview-programmet.
Google Translate-appen får en «listening mode» som er tilgjengelig på Android og iOS. Åpner du appen og aktiverer denne, kan den lytte til en samtale og oversette løpende. Tenk tolkemodus uten tolk.
Gemini Live API og Google AI Studio gir utviklere direkte tilgang. Her konfigurerer du targetLanguageCode (i BCP-47-format, f.eks. «nb» for norsk) og echoTargetLanguage. Det betyr at du kan bygge egne applikasjoner med sanntidsoversettelse integrert.

Hva betyr dette for deg i praksis?
For de fleste som ikke bygger apper er den korte svaret: du vil merke dette i Google Meet og Translate-appen, ikke via API-et. Og det kan faktisk ha stor praktisk verdi.
Tenk på situasjoner der du møter kunder, samarbeidspartnere eller leverandører som snakker et annet språk. I dag er løsningene dyre tolketjenester, håpløse automatiske undertekster, eller at alle snakker gebrokkent engelsk og håper det holder. En fungerende sanntidsoversettelse som bevarer tonefall og tempo endrer den dynamikken.
Norsk er ikke blant de 70+ språkene per nå – Google har ikke publisert den fullstendige listen, men modellen er primært rettet mot de store verdenshandels-språkene. For norskspråklige møter er dette dermed ikke relevant umiddelbart, men for deg som jobber internasjonalt kan det allerede nå gjøre en reell forskjell.
For en bredere oversikt over hva Gemini-plattformen kan gjøre er det verdt å lese den komplette norske Gemini-guiden.
Hvordan tar utviklere det i bruk?
Via Gemini Live API sender du lyd i 100ms-blokker over en WebSocket-tilkobling. Du angir målspråk med BCP-47-koden, og modellen returnerer oversatt lyd i sanntid. Google AI Studio gir deg et testmiljø uten å måtte sette opp hele infrastrukturen selv.
Hvis du allerede har jobbet med Gemini 3.1 Flash Live, vil arkitekturen kjennes igjen. Forskjellen er at Live Translate er spesialbygd for oversettelse mellom mennesker, ikke samtale med en AI-assistent.
Dokumentasjonen er tilgjengelig via Google AI for Developers. Preview-tilgang gis via Google AI Studio.
Ofte stilte spørsmål
Støtter Gemini 3.5 Live Translate norsk?
Google har ikke publisert den fullstendige språklisten, og norsk er ikke bekreftet blant de 70+ støttede språkene. Modellen er primært rettet mot store verdenshandels-språk. Sjekk oppdatert dokumentasjon på ai.google.dev for nøyaktig liste.
Er dette gratis å bruke via API-et?
Modellen er i public preview via Gemini Live API og Google AI Studio. Prismodellen for preview er ikke offentliggjort – sjekk Google AI prisoversikten for oppdatert informasjon om kostnader ved produksjonsbruk.
Hva er forskjellen på Gemini 3.5 Live Translate og Google Translate-appen?
Translate-appen bruker nå Gemini 3.5 Live Translate i en ny «listening mode», men appen er bare én av tre tilgangspunkter. Via Live API kan du bygge egne applikasjoner. Den tekniske forskjellen fra eldre Translate er arkitekturen: direkte tale-til-tale uten tekstomvei, som gir lavere latency.
Kan jeg bruke dette til å bygge egne apper med sanntidsoversettelse?
Ja. Gemini Live API er åpent for utviklere via Google AI Studio. Du konfigurerer målspråk med BCP-47-kode og sender lyd i 100ms-blokker over WebSocket. Preview-tilgang er tilgjengelig nå.