LLM komprimering – Jan Sverre Bauge

Jan Sverre klemmer glødende tallblokker sammen som komprimeres fra 16-bit til 4-bit i sci-fi visning av TurboQuant vektkomprimering

TurboQuant for weights – 4-bit vektkomprimering med nær-optimal presisjon

TurboQuant-algoritmen fra Google er blitt tilpasset for modellvekter – ikke bare KV-cache. Resultatet: 4-bit kvantisering med nær-optimal presisjon, 3,2x minnebesparelse, og et 8-bit residuallag som gir null perplexity-tap.

27. mars 2026
70 visninger
4 minutter lesetid

Jan Sverre i et serverrom med lysende GPU-racker - TurboQuant komprimerer KV-cache til 3 bits

TurboQuant – Googles nye KV-cache-algoritme gir 6x lavere minnebruk

Googles TurboQuant komprimerer KV-cachen i store språkmodeller til kun 3 bits – uten nøyakhetstap. 6 ganger lavere minnebruk og opptil 8 ganger raskere ytelse på NVIDIA H100. Presentert på ICLR 2026.

26. mars 2026
96 visninger
4 minutter lesetid

Kaffegrut jordforbedringsmiddel

Kaffegrut i Hagen – Slik Bruker Du Det som Gjødsel og Skadedyrbekjemper

Lær hvordan du kan bruke kaffegrut som gjødsel, bekjempe skadedyr og forbedre jorden i…

Jan Sverre Bauge
3. juni 2025
264 visninger
5 minutter lesetid

strong chili coffee blend

Kaffe

Sterk Chili Kaffe

Jalapeño og chili møter din morgenkaffe i denne dristige blandingen som vil…

Jan Sverre Bauge
22. januar 2025
146 visninger
1 minutt lesetid

stekt kylling i airfryer

Oppskrifter

Stekt Kylling i Airfryer

Utrolig sprø stekt kylling i airfryer gir deg den samme knasende skorpen som…

Jan Sverre Bauge
22. januar 2025
166 visninger
3 minutter lesetid

coffee caramel delight treat

Mat og drikke

Kaffekaramell

I disse hjemmelagde karamellene møter din morgenkaffe deilig fløtekaramell -…

Jan Sverre Bauge
21. januar 2025
234 visninger
1 minutt lesetid