Browsing Tag

verifiable rewards

1 innlegg

Trekningsteknikk der belønningssignal er automatisk verifiserbart, som kode som kjøres mot tester

Jan Sverre foran terminaler som viser GRPO-trening og HumanEval 80 prosent resultat

Liten AI-modell lærte seg selv å kode – nådde 80 % på HumanEval

En utvikler lot en liten AI-modell trene på sine egne feil med GRPO og verifiable rewards – uten menneskeskrevet data. Resultatet: 80 % på HumanEval og bedre matte enn GPT-3.5.

15. mai 2026
4 visninger
4 minutter lesetid

Kaffegrut i Hagen – Slik Bruker Du Det som Gjødsel og Skadedyrbekjemper

Lær hvordan du kan bruke kaffegrut som gjødsel, bekjempe skadedyr og forbedre jorden i…

Jan Sverre Bauge
3. juni 2025
330 visninger
5 minutter lesetid

Kaffe

Sterk Chili Kaffe

Jalapeño og chili møter din morgenkaffe i denne dristige blandingen som vil…

Jan Sverre Bauge
22. januar 2025
176 visninger
1 minutt lesetid

Oppskrifter

Stekt Kylling i Airfryer

Utrolig sprø stekt kylling i airfryer gir deg den samme knasende skorpen som…

Jan Sverre Bauge
22. januar 2025
206 visninger
3 minutter lesetid

Mat og drikke

Kaffekaramell

I disse hjemmelagde karamellene møter din morgenkaffe deilig fløtekaramell -…

Jan Sverre Bauge
21. januar 2025
271 visninger
1 minutt lesetid

verifiable rewards

Liten AI-modell lærte seg selv å kode – nådde 80 % på HumanEval

Afroman vant – politiet krevde 4 millioner, juryen ga dem null

PewDiePie AI Council – Da Supreme Leader ble forrÅdt av sine egne

Suno AI – 150 Låter Testet: Hva Funker og Hva Er Bortkastet Tid

Suno AI Copyright 2026 – Opphavsrett og Rettigheter for AI-Musikk

Jeg testet Nano Banana Pro: AI som faktisk skriver norsk i bilder

Kaffegrut i Hagen – Slik Bruker Du Det som Gjødsel og Skadedyrbekjemper

Sterk Chili Kaffe

Stekt Kylling i Airfryer

Kaffekaramell