small language model – Jan Sverre Bauge

Jan Sverre studerer et Mixture of Experts-nettverksdiagram som viser ZAYA1-8B sin selektive parameteraktivering med AMD-hardware i bakgrunnen

ZAYA1-8B – Zyphra sin MoE-modell slår modeller 15 ganger større

ZAYA1-8B fra Zyphra aktiverer bare 760 millioner parametere per inferens, men slår modeller med 119 milliarder parametere på matematikk-benchmarks. Trent ende-til-ende på AMD Instinct MI300x og tilgjengelig under Apache 2.0-lisens.

7. mai 2026
69 visninger
4 minutter lesetid

Jan Sverre ser overrasket på skjermen der Qwen 3.5 4B løser et abstraksjonsproblem som GPT-4 feilet på

Qwen 3.5 4B løser abstraksjonstesten som GPT-4 feilet på

Qwen 3.5 4B er den første lille open source-modellen som konsekvent løser en abstraksjontest der GPT-4, GPT-4o, Gemini 2.5 Flash og store 120B-modeller feiler. Her er testen, hvem som feilet, og hva det betyr for AI-utvikling.

9. mars 2026
159 visninger
4 minutter lesetid

Saftig glutenfri sitronkake toppet med sitroncurd, pyntet med sitronskiver og mynte på en hvit tallerken

Glutenfri sitronkake – min beste oppskrift

Saftig glutenfri sitronkake med sitrondynk og hjemmelaget sitroncurd - oppskriften som…

Jan Sverre Bauge
22. juni 2026
16 visninger
3 minutter lesetid

Kaffegrut jordforbedringsmiddel

Kaffegrut i Hagen – Slik Bruker Du Det som Gjødsel og Skadedyrbekjemper

Lær hvordan du kan bruke kaffegrut som gjødsel, bekjempe skadedyr og forbedre jorden i…

Jan Sverre Bauge
3. juni 2025
485 visninger
5 minutter lesetid

strong chili coffee blend

Kaffe

Sterk Chili Kaffe

Jalapeño og chili møter din morgenkaffe i denne dristige blandingen som vil…

Jan Sverre Bauge
22. januar 2025
242 visninger
1 minutt lesetid

stekt kylling i airfryer

Oppskrifter

Stekt Kylling i Airfryer

Utrolig sprø stekt kylling i airfryer gir deg den samme knasende skorpen som…

Jan Sverre Bauge
22. januar 2025
260 visninger
3 minutter lesetid