Cursor Composer 2 – ny AI-modell hvert femte time via real-time RL
Cursor oppdaterer Composer 2 med en ny modell-checkpoint hvert femte time ved hjelp av real-time reinforcement learning fra ekte brukerinteraksjoner. Her er en gjennomgang av metoden, tallene, og reward hacking-problemene de har møtt underveis.