Вышла бесплатная замена нашумевшей ElevenLabs. Нейронка HierSpeech++ клонирует любой голос по паре секунд речи.
Просто кидаем аудио референс, пишем текст для озвучки и нажимаем на одну кнопку. Голос получается неотличимым, так можно заставить говорить что угодно любого человека.
Попробовать в браузере — тут.
https://huggingface.…Speech_TTS___
Увы, русский не понимает. Возможно, пока не понимает.