LLM benchmark – Jan Sverre Bauge

Jan Sverre ser opp på et digitalt benchmark-leaderboard der Xiaomi MiMo-V2-Pro klatrer forbi Claude Opus 4.6 og GPT-5.2

Xiaomi MiMo-V2-Pro – telefonselskapet som konkurrerer med Anthropic på AI-benchmarks

Xiaomi lanserte MiMo-V2-Pro 18. mars 2026 – en AI-modell med over 1 billion parametere som rangerer nr. 3 globalt på agent-benchmarks, rett bak Claude Opus 4.6. Til en åttendedel av prisen.

23. mars 2026
176 visninger
5 minutter lesetid

Jan Sverre reagerer på resultater fra LLM sycophancy benchmark som avslører at AI-modeller snur dommen sin basert på hvem som snakker

LLM Sycophancy Benchmark – hvem snur dommen sin for å behage deg?

Et nytt benchmark tester 16 AI-modeller på sykofansi — snur de dommen sin basert på hvem som forteller historien? Gemini 3.1 Pro scorer best med 0,5 %, Mistral Large 3 er verst med 31,2 %. 199 testcaser, overraskende resultater.

10. mars 2026
136 visninger
4 minutter lesetid

Saftig glutenfri sitronkake toppet med sitroncurd, pyntet med sitronskiver og mynte på en hvit tallerken

Glutenfri sitronkake – min beste oppskrift

Saftig glutenfri sitronkake med sitrondynk og hjemmelaget sitroncurd - oppskriften som…

Jan Sverre Bauge
22. juni 2026
21 visninger
3 minutter lesetid

Kaffegrut jordforbedringsmiddel

Kaffegrut i Hagen – Slik Bruker Du Det som Gjødsel og Skadedyrbekjemper

Lær hvordan du kan bruke kaffegrut som gjødsel, bekjempe skadedyr og forbedre jorden i…

Jan Sverre Bauge
3. juni 2025
493 visninger
5 minutter lesetid

strong chili coffee blend

Kaffe

Sterk Chili Kaffe

Jalapeño og chili møter din morgenkaffe i denne dristige blandingen som vil…

Jan Sverre Bauge
22. januar 2025
244 visninger
1 minutt lesetid

stekt kylling i airfryer

Oppskrifter

Stekt Kylling i Airfryer

Utrolig sprø stekt kylling i airfryer gir deg den samme knasende skorpen som…

Jan Sverre Bauge
22. januar 2025
264 visninger
3 minutter lesetid