Jan Sverre inspiserer to RTX 2080 Ti grafikkort koblet i dual-GPU-oppsett for lokal AI-inferens

To gamle RTX 2080 Ti gir 38 token/s med Qwen3.6 27B – slik fungerer dual-GPU-oppsett

To RTX 2080 Ti med 22GB VRAM hver gir 38 token/s med Qwen3.6 27B via llama.cpp og Docker. Slik fungerer dual-GPU-oppsett for lokal AI – og hva koster det egentlig?
Jan Sverre i serverrom med blågrønt lys fra racks, tablet viser AI-genererte videorammer fra Alice v1

Alice v1 – open source videomodell som utfordrer Sora og Veo

Alice v1 er en 14-milliarder parameter open source videomodell fra Mirage med Apache 2.0-lisens. Bruker rCM-destillasjon og MoE-arkitektur for å generere 720p video på 4 inferenstrinn – og hevder å slå lukkede modeller som Sora og Veo.
Jan Sverre observerer kappløpet mellom kinesiske og vestlige AI-selskaper representert som holografiske logoer

GLM-5.1 topper SWE-Bench Pro – kinesisk AI slår Claude og GPT på koding

GLM-5.1 fra Z.ai toppet SWE-Bench Pro i april 2026 og slo Claude Opus 4.6 og GPT-5.4 på koding – til en femtedel av prisen, trent uten Nvidia. Her er hva det faktisk betyr.
Jan Sverre rir en glødende digital hest gjennom lukkede dører mot et åpent landskap - symbolikk for Happy Horse open source AI-videomodellen fra Alibaba

Happy Horse – Alibabas nye AI-videomodell topper leaderboardet

Happy Horse fra Alibaba/Qwen-teamet topper Artificial Analysis video-leaderboardet med nesten 100 ELO-poeng foran Seedance 2.0 – og slippes open source. Første gang en åpen videomodell på dette nivået utfordrer de lukkede gigantene.
Jan Sverre dirigerer et nettverk av open source AI-modeller som Llama, Qwen og Mistral lokalt på egen maskin

Open source AI – komplett guide (2026)

Alt du trenger å vite om open source AI i 2026: hva open weights faktisk betyr, de beste modellene (Llama, Qwen, Mistral, DeepSeek), verktøy for lokal kjøring, og når open source slår lukkede alternativ.
Jan Sverre studerer Qwen3.6-Plus på laptop med skeptisk blikk på Alibabas nye AI-modell

Qwen3.6-Plus – Alibabas nye modell med 1 million token kontekst

Qwen3.6-Plus er Alibabas nyeste stormodell med 1 million token kontekstvindu, lansert 30. mars 2026. Gratis via OpenRouter i preview – men lukket kilde og datahøsting. Her er hva du trenger å vite.
Jan Sverre holder et glødende kinesisk AI-øye og studerer Qwen 3.6 Plus Preview med skeptisk nysgjerrighet

Qwen 3.6 på OpenRouter – 1 million token kontekst og gratis preview

Qwen 3.6 Plus Preview dukket opp på OpenRouter 30. mars 2026 uten noen offisiell kunngjøring fra Alibaba. Modellen har 1 million token kontekstvindu, innebygd reasoning og er gratis tilgjengelig akkurat nå – men med forbehold om kinesisk datainnsamling.
Jan Sverre dirigerer fire datastrømmer for lyd, video, tekst og bilder som smelter sammen - illustrasjon av Qwen3.5 Omni omnimodal AI

Qwen3.5 Omni – Alibabas omnimodale AI hører, ser og snakker samtidig

Qwen3.5 Omni er Alibabas nye omnimodale AI-modell som håndterer lyd, video, bilder og tekst i én og samme modell – uten separate verktøy. Plus-varianten overpresterer Gemini 3.1 Pro på audioforståelse og nådde SOTA på 22 av 36 benchmarks.
Jan Sverre fascinert over at en liten Qwen3-modell på 4 milliarder parametre slår GPT-5 og Claude Opus på smale oppgaver

Fine-tunede Qwen3-modeller slår GPT-5, Claude og Gemini på smale oppgaver

Fine-tunede Qwen3-modeller på 0,6 til 8 milliarder parametre slår GPT-5, Claude og Gemini på smale oppgaver som klassifisering og spørsmål-svar — med bare 50 treningseksempler og kun open-weight lærere. Ny systematisk benchmarkstudie viser at fine-tuning matter mer enn valg av grunnmodell.
Jan Sverre ser overrasket på skjermen der Qwen 3.5 4B løser et abstraksjonsproblem som GPT-4 feilet på

Qwen 3.5 4B løser abstraksjonstesten som GPT-4 feilet på

Qwen 3.5 4B er den første lille open source-modellen som konsekvent løser en abstraksjontest der GPT-4, GPT-4o, Gemini 2.5 Flash og store 120B-modeller feiler. Her er testen, hvem som feilet, og hva det betyr for AI-utvikling.