张小闲 邀你回答

2025/02/11

新发布的最强开源语音模型 Zonos 太强了,这次还支持中文!

Zonos语音生成质量非常高,而且这次有中文,以下是主要特点:

1、两种1.6B 模型,transformer 和 SSM
2、用5到30秒的语音进行高保真语音克隆
3、可以调节速度,音高,音频质量和情绪
4、添加文本和音频前缀,实现更丰富的说话人匹配效果
5、在 RTX 4090 显卡上运行时,实时率约为 2 倍

模型下载:https://huggingface.co/Zyphra/Zonos-v0.1-hybrid

收藏 点赞 38 生成海报
阅读相关文章
{{comTitle}} {{comSubtitle}}

新发布的最强开源语音模型 Zonos 太强了,这次还支持中文!

生成问答海报 我要提问 我来回答