Jan Sverre utforsker Gemma-4-31B-it-DFlash og spekulativ dekoding med DFlash-teknikken

Gemma-4-31B-it-DFlash – spekulativ dekoding for Googles åpne modell

Gemma-4-31B-it-DFlash er en ny variant av Googles Gemma 4 31B utgitt av Z Lab, med DFlash spekulativ dekoding som kan gi opptil 8x raskere inferens. Llama.cpp-støtte er under utvikling via PR #22105.
Jan Sverre analyserer DeepSeek V4 Pro og Flash - kinesiske open source AI-modeller med 1,6 billiarder parametere

DeepSeek V4 Pro og Flash – 1,6 billiarder parametere og Huawei Ascend-støtte

DeepSeek V4 Pro og Flash er lansert med 1,6 billiarder parametere, MIT-lisens og støtte for Huawei Ascend-chips. Modellen er god men ikke lenger benchmarks-leder – her er hva du trenger å vite.
Jan Sverre utforsker IBM Granite 4.1 sine tre open source AI-modeller på 3B, 8B og 30B parametere

IBM Granite 4.1 – open source AI-modeller i 3B, 8B og 30B

IBM Granite 4.1 er tre nye open source AI-modeller (3B, 8B og 30B) med Apache 2.0-lisens, 512K tokens kontekstvindu og FP8-kvantisering. 8B-modellen matcher tidligere 32B MoE-modell – og kjører på vanlig gaming-GPU.
Jan Sverre studerer Asimov v1 humanoid robot fra Menlo Research - open source robot til 165 000 kroner

Asimov v1 – open source humanoid robot til 165 000 kroner

Asimov v1 er en open source humanoid robot på 1,2 meter og 35 kg fra Menlo Research – tilgjengelig som DIY-kit til 15 000 dollar (165 000 kr). CAD-filer og simuleringsmodell er allerede ute på GitHub under CERN-OHL-S og GPL-2.0-lisenser.
Jan Sverre ser skeptisk på kamp mellom DeepSeek V4 og Claude i anime-stil med neon-farger

DeepSeek V4 preview – kinesisk AI utfordrer Claude og GPT igjen

DeepSeek lanserte 24. april 2026 en preview av V4 – to modeller med 1 million tokens kontekst, open source, og benchmark-resultater som matcher Claude Opus 4.6 på koding. V4-Flash koster $0,14 per million tokens.
Jan Sverre ved AMD PC-rig som kjører GAIA AI-agenter lokalt uten skyavhengighet

GAIA – AMDs open-source rammeverk for lokale AI-agenter

GAIA er AMDs open-source rammeverk for å bygge AI-agenter som kjører helt lokalt – dokumentanalyse, tale-til-tale, kodegenerering og MCP-integrasjon. MIT-lisens, støtter Python og C++17, optimalisert for Ryzen AI NPU. Her er hva rammeverket kan gjøre og hva brukere faktisk opplever.
Jan Sverre rir en glødende digital hest gjennom lukkede dører mot et åpent landskap - symbolikk for Happy Horse open source AI-videomodellen fra Alibaba

Happy Horse – Alibabas nye AI-videomodell topper leaderboardet

Happy Horse fra Alibaba/Qwen-teamet topper Artificial Analysis video-leaderboardet med nesten 100 ELO-poeng foran Seedance 2.0 – og slippes open source. Første gang en åpen videomodell på dette nivået utfordrer de lukkede gigantene.
Jan Sverre ved siden av en lysende data-blekksprut i et serverrom som symboliserer Octopoda minnelag for AI-agenter

Octopoda – persistent minnelag for lokale AI-agenter uten sky

Octopoda er et åpen kildekode-minnelag for lokale AI-agenter. Kjører helt offline, ingen sky, ingen API-nøkler. Løser problemet med at agenter glemmer alt mellom sesjonene – med krasjgjenoppretting, delt minne og revisjonsspor.
Jan Sverre holder to kraftige energistrømmer fra øst og vest fra hverandre - symboliserer dragkampen mellom kinesisk og vestlig AI

DeepSeek – den kinesiske AI-utfordreren forklart (2026)

DeepSeek er det kinesiske AI-selskapet som sjokkerte Silicon Valley og senket Nvidia-aksjen 18 % på én dag. Her er alt du trenger å vite om modellene, prisene, sensureringen og personvernproblemene – og hvem som faktisk bør bruke det.
Jan Sverre utforsker Gemma 4 fra Google med Apache 2.0-lisens og fire nye åpne AI-modeller

Gemma 4 – Google lanserer åpne AI-modeller med Apache 2.0-lisens

Google lanserte Gemma 4 den 2. april 2026 med Apache 2.0-lisens – den første Gemma-modellen som er fullt åpen for kommersiell bruk. Fire varianter fra 2,3 til 31 milliarder parametere, multimodal støtte og 128-256K kontekstvindu.