返回模型
说明文档
uZipVoice ONNX 模型(蒸馏版)
uZipVoice 的 ONNX 模型 —— ZipVoice 的 Unity 实现,这是一个使用流匹配(Flow Matching)的轻量级零样本文本转语音系统。
模型描述
这些 ONNX 模型是从 ZipVoice-Distill(蒸馏版本)导出的,用于 Unity AI 推理引擎(Sentis)。
- 零样本 TTS:仅使用几秒钟的参考音频即可生成任意人声的语音
- 快速生成:蒸馏模型内嵌 CFG,仅需 4-8 步即可实现高质量合成
- 轻量级:总参数量 1.23 亿
- 蒸馏版:CFG(无分类器引导)已内嵌,无需双重推理
文件
| 文件 | 描述 | 大小 |
|---|---|---|
text_encoder.onnx |
文本到条件向量 | ~17MB |
fm_decoder.onnx |
流匹配解码器(蒸馏版) | ~456MB |
vocos_opset15.onnx |
声码器(梅尔频谱转波形) | ~52MB |
推荐设置
- 步数:4-8(蒸馏模型,默认:8)
- 采样率:24kHz
- 梅尔频谱维度:100
ayousanz/uZipVoice-onnx
作者 ayousanz
text-to-speech
↓ 0
♥ 0
创建时间: 2026-01-12 04:42:18+00:00
更新时间: 2026-01-12 07:47:06+00:00
在 Hugging Face 上查看文件 (5)
.gitattributes
README.md
fm_decoder.onnx
ONNX
text_encoder.onnx
ONNX
vocos_opset15.onnx
ONNX