1. Kokoro-TTS模型近期在Hugging Face平台发布,凭借8200万参数在TTS领域排行榜上夺得第一,表现超越多个大型模型。其使用少量音频数据便实现了高质量音频生成,展现了语音合成技术的新里程碑。用户可在Google Colab中轻松运行代码加载模型和语音包,支持美英两种语言及多个语音包选择。
2. Kokoro-TTS模型训练过程高效,使用了合规的公有领域和开放许可证音频数据,但受限于训练数据和架构,暂不支持声音克隆,且训练数据以长篇朗读和叙述为主。