Scenema Audio – zero-shot stemmekloning med emosjonell prompting Scenema Audio lar deg klone en stemme fra 10-20 sekunder audio og styre emosjon via tekstprompt. Open source, MIT-lisens, 16 GB VRAM. 15. mai 202646 visninger4 minutter lesetid
DramaBox – den mest ekspressive TTS-modellen du kan kjøre selv DramaBox fra Resemble AI er en open source TTS-modell som kloner stemmer og styrer latter, sukk og pauser via tekstprompt. Krever 24 GB VRAM. 14. mai 202669 visninger4 minutter lesetid