说明文档

CosyVoice2 ONNX 模型 (flow & hift)

本仓库提供 CosyVoice2 部分模块的 ONNX 格式模型，包括：

2025-11-09 更新：修复了 flow 模块在半精度下 /decoder/estimator 子模块中的 NaN 问题。flow_fp16.onnx 已更新为完全半精度的 flow 模型。组合模型也已同步更新。

使用说明请参考 GitHub 仓库。
CosyVoice2 的其他模块可从官方 CosyVoice2 获取。
我已开源 CosyVoice2 的 ONNX 版本，包括 ONNX 所需的修改模块和转换脚本。如需了解如何进行转换，请访问 CosyVoiceForOnnx。

输入：
- token (int64)
- prompt_token (int32)
- prompt_feat (float32 / float16)
- embedding (float32 / float16)
  - 对于 flow_fp32.onnx，必须使用 float32
  - 对于 flow_fp16.onnx，必须使用 float16
输出：
- tts_mel (float32)

原始模型来自官方 CosyVoice2。本仓库仅提供 ONNX 格式的转换和适配。

作者 Lourdle

text-to-speech

↓ 0 ♥ 1

创建时间: 2025-08-19 01:40:52+00:00

更新时间: 2025-11-09 05:53:59+00:00

.gitattributes

README.md

flow_fp16.onnx ONNX

flow_fp32.onnx ONNX

flow_hift_combined_fp16.onnx ONNX

flow_hift_combined_fp32.onnx ONNX

hift.onnx ONNX