Jan Sverre dirigerer fire datastrømmer for lyd, video, tekst og bilder som smelter sammen - illustrasjon av Qwen3.5 Omni omnimodal AI

Qwen3.5 Omni – Alibabas omnimodale AI hører, ser og snakker samtidig

Qwen3.5 Omni er Alibabas nye omnimodale AI-modell som håndterer lyd, video, bilder og tekst i én og samme modell – uten separate verktøy. Plus-varianten overpresterer Gemini 3.1 Pro på audioforståelse og nådde SOTA på 22 av 36 benchmarks.