ONNX 模型库
返回模型

说明文档

模型目录说明

完整目录结构

models/
├── gguf/                    # 原始FP32格式
│   ├── qwen3_assets.gguf   # 1.5 GB | 资源文件 (tts_pad, text_table, codec_embd, proj_weight, proj_bias)
│   ├── qwen3_tts_predictor.gguf  # TTS预测模型
│   └── qwen3_tts_talker.gguf     # TTS语音合成模型
│
├── gguf_q8_0/               # Q8_0(8位)量化
│   ├── qwen3_assets.gguf   # 388 MB | 74%压缩率 | 几乎无损
│   ├── qwen3_tts_predictor.gguf
│   └── qwen3_tts_talker.gguf
│
├── gguf_q5_k_m/             # Q5_K_M(5位K量化)
│   ├── qwen3_assets.gguf   # 388 MB | 使用Q8_0以保持兼容性
│   ├── qwen3_tts_predict.gguf  # 98 MB
│   └── qwen3_tts_talker.gguf  # 960 MB
│
├── onnx/                    # 原始ONNX模型
│   ├── qwen3_tts_codec_encoder.onnx   # 216 MB | 音频编解码器编码器
│   ├── qwen3_tts_decoder.onnx         # 436 MB | 音频解码器
│   └── qwen3_tts_speaker_encoder.onnx # 46 MB  | 说话人嵌入编码器
│
├── onnx_int8/               # INT8量化ONNX
│   ├── qwen3_tts_codec_encoder.onnx   # 104 MB
│   ├── qwen3_tts_decoder.onnx         # 210 MB
│   └── qwen3_tts_speaker_encoder.onnx # 12 MB
│
├── preset_speakers/         # 预设说话人嵌入
│   ├── index.json           # 说话人索引
│   ├── aiden.json           # 34 KB
│   ├── dylan.json           # 34 KB
│   ├── eric.json            # 34 KB
│   ├── ono_anna.json        # 34 KB
│   ├── ryan.json            # 34 KB
│   ├── serena.json          # 34 KB
│   ├── sohee.json           # 34 KB
│   ├── uncle_fu.json        # 34 KB
│   └── vivian.json          # 34 KB
│
└── tokenizer/               # 分词器
    └── tokenizer.json       # 11 MB | BPE分词器词表

模型组件

组件 文件 描述
资源 qwen3_assets.gguf 文本嵌入、编解码器嵌入、投影权重
预测器 qwen3_tts_predict*.gguf 时长/韵律预测模型
合成器 qwen3_tts_talker*.gguf 音频合成神经编解码器
编码器 qwen3_tts_codec_encoder.onnx 文本 → 声学标记
解码器 qwen3_tts_decoder.onnx 声学标记 → 音频波形
说话人编码器 qwen3_tts_speaker_encoder.onnx 参考音频 → 说话人嵌入
分词器 tokenizer.json 文本分词(BPE)

量化对比

格式 位数 大小 压缩率 质量
F32 / ONNX 32 ~1.5 GB - 原始
Q8_0 / INT8 8 ~388 MB ~74% 几乎无损
Q5_K_M 5 ~205 MB* ~86% 良好平衡

*Q5_K_M资源文件使用Q8_0以保持兼容性

预设说话人

可用说话人:aiden, dylan, eric, ono_anna, ryan, serena, sohee, uncle_fu, vivian

使用示例:

{
  \"speaker\": \"serena\",
  \"preset_speaker_path\": \"models/preset_speakers/serena.json\"
}

用法

config.json 中:

{
  \"model_dir\": \"models/gguf_q8_0\",
  \"assets\": \"qwen3_assets.gguf\",
  \"tokenizer_path\": \"models/tokenizer/tokenizer.json\",
  \"preset_speakers_dir\": \"models/preset_speakers\"
}

推荐

  • 最佳质量gguf/ + onnx/
  • 推荐配置gguf_q8_0/ + onnx_int8/(最佳平衡)
  • 最小体积gguf_q5_k_m/ + onnx_int8/

cgisky/qwen3-tts-custom-gguf

作者 cgisky

↓ 2K ♥ 2

创建时间: 2026-02-12 01:14:24+00:00

更新时间: 2026-02-12 01:34:51+00:00

在 Hugging Face 上查看

文件 (25)

.gitattributes
README.md
gguf/qwen3_assets.gguf
gguf/qwen3_tts_predictor.gguf
gguf/qwen3_tts_talker.gguf
gguf_q5_k_m/qwen3_assets.gguf
gguf_q5_k_m/qwen3_tts_predictor.gguf
gguf_q5_k_m/qwen3_tts_talker.gguf
gguf_q8_0/qwen3_assets.gguf
gguf_q8_0/qwen3_tts_predictor.gguf
gguf_q8_0/qwen3_tts_talker.gguf
onnx/qwen3_tts_codec_encoder.onnx ONNX
onnx/qwen3_tts_decoder.onnx ONNX
onnx/qwen3_tts_speaker_encoder.onnx ONNX
preset_speakers/aiden.json
preset_speakers/dylan.json
preset_speakers/eric.json
preset_speakers/index.json
preset_speakers/ono_anna.json
preset_speakers/ryan.json
preset_speakers/serena.json
preset_speakers/sohee.json
preset_speakers/uncle_fu.json
preset_speakers/vivian.json
tokenizer/tokenizer.json