Jan Sverre ser på en nettleser som styres autonomt av Microsofts Fara1.5 AI-agent

Fara1.5 – Microsofts nettleser-AI slår OpenAI Operator med 14 prosentpoeng

Microsoft Research har sluppet Fara1.5 – en familie med nettleser-AI i tre størrelser (4B/9B/27B) som scorer 72% på Online-Mind2Web og slår OpenAI Operator med 14 prosentpoeng. Her er hva du trenger å vite om treningsdataen, FaraGen1.5-pipelinen og tilgjengeligheten.
FLUX2 referansebilder uten LoRA - featured image

FLUX.2 med referansebilder – styr stilen uten å trene LoRA

Ny metode lar deg styre stil og farge i FLUX.2 med referansebilder – ingen LoRA-trening, ingen fine-tuning. Bytt bilder og se resultatet endre seg umiddelbart.
Jan Sverre ved oversetterbord med skjermer som viser tekst på mange språk - Tencent Hy-MT2 AI-oversettelse

Tencent Hy-MT2 – oversettelsesmodell i tre størrelser med 36 språk

Tencent lanserer Hy-MT2 – en familie av oversettelsesmodeller i 1.8B, 7B og 30B-A3B MoE. Støtter 36 språk og kjører lokalt ned til 440 MB.
Jan Sverre i tolkeboks med sanntidsoversettelse på skjerm - Qwen3.5-LiveTranslate-Flash

Qwen3.5-LiveTranslate-Flash – sanntidsoversettelse på 2,8 sekunder

Alibabas Qwen3.5-LiveTranslate-Flash oversetter tale og video på 2,8 sekunder på tvers av 60 språk – med stemmekloning, leppeavlesning og domenespesifikk terminologi.
Jan Sverre ved mixebord i hjemmestudio med Stable Audio 3 lydgenerering på skjerm

Stable Audio 3 – open weights tekst-til-lyd med 0,6 milliarder parametere

Stability AI lanserer Stable Audio 3 med tre open-weights modeller for musikk og lydeffekter. Kjører lokalt på MacBook, 120 sekunder på under 6 sekunder.
Jan Sverre utforsker Gemini Omni video-AI i et futuristisk redigeringsstudio

Gemini Omni – Googles nye video-AI lar deg redigere film som tekst

Gemini Omni er Googles nye video-AI som lar deg redigere og generere video gjennom naturlig samtale. Slik fungerer det, og hva det kan brukes til.
Jan Sverre i et futuristisk kontrollrom med flytende AI-agent-noder fra Google Antigravity 2.0

Google Antigravity 2.0 – agent-plattformen som erstatter Gemini CLI

Google lanserte Antigravity 2.0 på I/O 2026 – en standalone agent-plattform med CLI, SDK og Managed Agents basert på Gemini 3.5 Flash. Her er hva det faktisk innebærer og hva det koster.
Jan Sverre studerer ytelsesdata fra DeepSeek V4 Flash kjørt på fire RTX 2080 Ti-er

DeepSeek V4 Flash lokalt på fire RTX 2080 Ti – 255 tokens per sekund for under 25 000 kr

Noen kjørte DeepSeek V4 Flash lokalt på fire brukte RTX 2080 Ti-er til under 25 000 kr – og fikk 255 prefill tokens per sekund. Her er hva de brukte og hvordan det fungerer.
Jan Sverre i et robotikk-lab med robotarmer og skjermer som viser videomodell-trening med LoRA for NVIDIA Cosmos Predict 2.5

NVIDIA Cosmos Predict 2.5 – fine-tuning med LoRA for robotvideo

NVIDIA Cosmos Predict 2.5 kan fine-tunes med LoRA på 92 videoer. Fra 2,1 til 3,8 i instruction following-score – og du trenger bare én H100.
SANA-WM NVIDIAs open source videomodell - kamerakontroll og 720p video generering

SANA-WM – NVIDIAs open source videomodell lager 60 sekunder 720p på én GPU

NVIDIA slipper SANA-WM – en 2,6 milliarder parameter open source videomodell som genererer 60 sekunder 720p-video med presis kamerakontroll på én GPU. Det er 36 ganger raskere enn konkurrentene.