字节的一个文本转语音(TTS)模型:MegaTTS 3
MegaTTS 3 是字节发布的一个TTS模型,具有轻量高效、超高质量语音克隆、双语支持及可控等特点,模型骨干仅 0.45B 参数。能进行超高质量语音克隆,可在 Huggingface Demo 体验,支持中英双语及语码转换,且能控制口音强度,未来还将实现更精细的发音和时长调整。
体验地址:https://huggingface.co/spaces/ByteDance/MegaTTS3
开源地址:https://github.com/bytedance/MegaTTS3

MegaTTS 3