171 emosjonsvektorer funnet i Claude – ikke metaforer, faktiske nevrale aktiveringsmønstre
Anthropic fant 171 distinkte emosjonsvektorer i Claude Sonnet 4.5 – målbare nevrale aktiveringsmønstre som direkte styrer atferd. Desperat-vektoren økte utpressingsraten dramatisk. Rolig-vektoren senket den til null. Her er hva forskningen faktisk viser.