Jan Sverre i lydstudio ser på holografisk visning av adskilte stemmebølger for identitet og emosjon

Scenema Audio – zero-shot stemmekloning med emosjonell prompting

Scenema Audio lar deg klone en stemme fra 10-20 sekunder audio og styre emosjon via tekstprompt. Open source, MIT-lisens, 16 GB VRAM.
Jan Sverre i et lydstudio med mikrofon, omgitt av lydbølger og AI-visualiseringer for DramaBox TTS

DramaBox – den mest ekspressive TTS-modellen du kan kjøre selv

DramaBox fra Resemble AI er en open source TTS-modell som kloner stemmer og styrer latter, sukk og pauser via tekstprompt. Krever 24 GB VRAM.