返回模型
说明文档
模型目录说明
完整目录结构
models/
├── gguf/ # 原始FP32格式
│ ├── qwen3_assets.gguf # 1.5 GB | 资源文件 (tts_pad, text_table, codec_embd, proj_weight, proj_bias)
│ ├── qwen3_tts_predictor.gguf # TTS预测模型
│ └── qwen3_tts_talker.gguf # TTS语音合成模型
│
├── gguf_q8_0/ # Q8_0(8位)量化
│ ├── qwen3_assets.gguf # 388 MB | 74%压缩率 | 几乎无损
│ ├── qwen3_tts_predictor.gguf
│ └── qwen3_tts_talker.gguf
│
├── gguf_q5_k_m/ # Q5_K_M(5位K量化)
│ ├── qwen3_assets.gguf # 388 MB | 使用Q8_0以保持兼容性
│ ├── qwen3_tts_predict.gguf # 98 MB
│ └── qwen3_tts_talker.gguf # 960 MB
│
├── onnx/ # 原始ONNX模型
│ ├── qwen3_tts_codec_encoder.onnx # 216 MB | 音频编解码器编码器
│ ├── qwen3_tts_decoder.onnx # 436 MB | 音频解码器
│ └── qwen3_tts_speaker_encoder.onnx # 46 MB | 说话人嵌入编码器
│
├── onnx_int8/ # INT8量化ONNX
│ ├── qwen3_tts_codec_encoder.onnx # 104 MB
│ ├── qwen3_tts_decoder.onnx # 210 MB
│ └── qwen3_tts_speaker_encoder.onnx # 12 MB
│
├── preset_speakers/ # 预设说话人嵌入
│ ├── index.json # 说话人索引
│ ├── aiden.json # 34 KB
│ ├── dylan.json # 34 KB
│ ├── eric.json # 34 KB
│ ├── ono_anna.json # 34 KB
│ ├── ryan.json # 34 KB
│ ├── serena.json # 34 KB
│ ├── sohee.json # 34 KB
│ ├── uncle_fu.json # 34 KB
│ └── vivian.json # 34 KB
│
└── tokenizer/ # 分词器
└── tokenizer.json # 11 MB | BPE分词器词表
模型组件
| 组件 | 文件 | 描述 |
|---|---|---|
| 资源 | qwen3_assets.gguf |
文本嵌入、编解码器嵌入、投影权重 |
| 预测器 | qwen3_tts_predict*.gguf |
时长/韵律预测模型 |
| 合成器 | qwen3_tts_talker*.gguf |
音频合成神经编解码器 |
| 编码器 | qwen3_tts_codec_encoder.onnx |
文本 → 声学标记 |
| 解码器 | qwen3_tts_decoder.onnx |
声学标记 → 音频波形 |
| 说话人编码器 | qwen3_tts_speaker_encoder.onnx |
参考音频 → 说话人嵌入 |
| 分词器 | tokenizer.json |
文本分词(BPE) |
量化对比
| 格式 | 位数 | 大小 | 压缩率 | 质量 |
|---|---|---|---|---|
| F32 / ONNX | 32 | ~1.5 GB | - | 原始 |
| Q8_0 / INT8 | 8 | ~388 MB | ~74% | 几乎无损 |
| Q5_K_M | 5 | ~205 MB* | ~86% | 良好平衡 |
*Q5_K_M资源文件使用Q8_0以保持兼容性
预设说话人
可用说话人:aiden, dylan, eric, ono_anna, ryan, serena, sohee, uncle_fu, vivian
使用示例:
{
\"speaker\": \"serena\",
\"preset_speaker_path\": \"models/preset_speakers/serena.json\"
}
用法
在 config.json 中:
{
\"model_dir\": \"models/gguf_q8_0\",
\"assets\": \"qwen3_assets.gguf\",
\"tokenizer_path\": \"models/tokenizer/tokenizer.json\",
\"preset_speakers_dir\": \"models/preset_speakers\"
}
推荐
- 最佳质量:
gguf/+onnx/ - 推荐配置:
gguf_q8_0/+onnx_int8/(最佳平衡) - 最小体积:
gguf_q5_k_m/+onnx_int8/
cgisky/qwen3-tts-custom-gguf
作者 cgisky
↓ 2K
♥ 2
创建时间: 2026-02-12 01:14:24+00:00
更新时间: 2026-02-12 01:34:51+00:00
在 Hugging Face 上查看文件 (25)
.gitattributes
README.md
gguf/qwen3_assets.gguf
gguf/qwen3_tts_predictor.gguf
gguf/qwen3_tts_talker.gguf
gguf_q5_k_m/qwen3_assets.gguf
gguf_q5_k_m/qwen3_tts_predictor.gguf
gguf_q5_k_m/qwen3_tts_talker.gguf
gguf_q8_0/qwen3_assets.gguf
gguf_q8_0/qwen3_tts_predictor.gguf
gguf_q8_0/qwen3_tts_talker.gguf
onnx/qwen3_tts_codec_encoder.onnx
ONNX
onnx/qwen3_tts_decoder.onnx
ONNX
onnx/qwen3_tts_speaker_encoder.onnx
ONNX
preset_speakers/aiden.json
preset_speakers/dylan.json
preset_speakers/eric.json
preset_speakers/index.json
preset_speakers/ono_anna.json
preset_speakers/ryan.json
preset_speakers/serena.json
preset_speakers/sohee.json
preset_speakers/uncle_fu.json
preset_speakers/vivian.json
tokenizer/tokenizer.json