ONNX 模型库
返回模型

说明文档

uZipVoice ONNX 模型(蒸馏版)

uZipVoice 的 ONNX 模型 —— ZipVoice 的 Unity 实现,这是一个使用流匹配(Flow Matching)的轻量级零样本文本转语音系统。

模型描述

这些 ONNX 模型是从 ZipVoice-Distill(蒸馏版本)导出的,用于 Unity AI 推理引擎(Sentis)。

  • 零样本 TTS:仅使用几秒钟的参考音频即可生成任意人声的语音
  • 快速生成:蒸馏模型内嵌 CFG,仅需 4-8 步即可实现高质量合成
  • 轻量级:总参数量 1.23 亿
  • 蒸馏版:CFG(无分类器引导)已内嵌,无需双重推理

文件

文件 描述 大小
text_encoder.onnx 文本到条件向量 ~17MB
fm_decoder.onnx 流匹配解码器(蒸馏版) ~456MB
vocos_opset15.onnx 声码器(梅尔频谱转波形) ~52MB

推荐设置

  • 步数:4-8(蒸馏模型,默认:8)
  • 采样率:24kHz
  • 梅尔频谱维度:100

ayousanz/uZipVoice-onnx

作者 ayousanz

text-to-speech
↓ 0 ♥ 0

创建时间: 2026-01-12 04:42:18+00:00

更新时间: 2026-01-12 07:47:06+00:00

在 Hugging Face 上查看

文件 (5)

.gitattributes
README.md
fm_decoder.onnx ONNX
text_encoder.onnx ONNX
vocos_opset15.onnx ONNX