说明文档

模型目录说明

完整目录结构

models/
├── gguf/                    # 原始FP32格式
│   ├── qwen3_assets.gguf   # 1.5 GB | 资源文件 (tts_pad, text_table, codec_embd, proj_weight, proj_bias)
│   ├── qwen3_tts_predictor.gguf  # TTS预测模型
│   └── qwen3_tts_talker.gguf     # TTS语音合成模型
│
├── gguf_q8_0/               # Q8_0（8位）量化
│   ├── qwen3_assets.gguf   # 388 MB | 74%压缩率 | 几乎无损
│   ├── qwen3_tts_predictor.gguf
│   └── qwen3_tts_talker.gguf
│
├── gguf_q5_k_m/             # Q5_K_M（5位K量化）
│   ├── qwen3_assets.gguf   # 388 MB | 使用Q8_0以保持兼容性
│   ├── qwen3_tts_predict.gguf  # 98 MB
│   └── qwen3_tts_talker.gguf  # 960 MB
│
├── onnx/                    # 原始ONNX模型
│   ├── qwen3_tts_codec_encoder.onnx   # 216 MB | 音频编解码器编码器
│   ├── qwen3_tts_decoder.onnx         # 436 MB | 音频解码器
│   └── qwen3_tts_speaker_encoder.onnx # 46 MB  | 说话人嵌入编码器
│
├── onnx_int8/               # INT8量化ONNX
│   ├── qwen3_tts_codec_encoder.onnx   # 104 MB
│   ├── qwen3_tts_decoder.onnx         # 210 MB
│   └── qwen3_tts_speaker_encoder.onnx # 12 MB
│
├── preset_speakers/         # 预设说话人嵌入
│   ├── index.json           # 说话人索引
│   ├── aiden.json           # 34 KB
│   ├── dylan.json           # 34 KB
│   ├── eric.json            # 34 KB
│   ├── ono_anna.json        # 34 KB
│   ├── ryan.json            # 34 KB
│   ├── serena.json          # 34 KB
│   ├── sohee.json           # 34 KB
│   ├── uncle_fu.json        # 34 KB
│   └── vivian.json          # 34 KB
│
└── tokenizer/               # 分词器
    └── tokenizer.json       # 11 MB | BPE分词器词表

模型组件

组件	文件	描述
资源	`qwen3_assets.gguf`	文本嵌入、编解码器嵌入、投影权重
预测器	`qwen3_tts_predict*.gguf`	时长/韵律预测模型
合成器	`qwen3_tts_talker*.gguf`	音频合成神经编解码器
编码器	`qwen3_tts_codec_encoder.onnx`	文本 → 声学标记
解码器	`qwen3_tts_decoder.onnx`	声学标记 → 音频波形
说话人编码器	`qwen3_tts_speaker_encoder.onnx`	参考音频 → 说话人嵌入
分词器	`tokenizer.json`	文本分词（BPE）

量化对比

格式	位数	大小	压缩率	质量
F32 / ONNX	32	~1.5 GB	-	原始
Q8_0 / INT8	8	~388 MB	~74%	几乎无损
Q5_K_M	5	~205 MB*	~86%	良好平衡

*Q5_K_M资源文件使用Q8_0以保持兼容性

预设说话人

可用说话人：aiden, dylan, eric, ono_anna, ryan, serena, sohee, uncle_fu, vivian

使用示例：

{
  \"speaker\": \"serena\",
  \"preset_speaker_path\": \"models/preset_speakers/serena.json\"
}

用法

在 config.json 中：

{
  \"model_dir\": \"models/gguf_q8_0\",
  \"assets\": \"qwen3_assets.gguf\",
  \"tokenizer_path\": \"models/tokenizer/tokenizer.json\",
  \"preset_speakers_dir\": \"models/preset_speakers\"
}

cgisky/qwen3-tts-custom-gguf

作者 cgisky

↓ 2K ♥ 2

创建时间: 2026-02-12 01:14:24+00:00

更新时间: 2026-02-12 01:34:51+00:00

在 Hugging Face 上查看

文件 (25)

.gitattributes

README.md

gguf/qwen3_assets.gguf

gguf/qwen3_tts_predictor.gguf

gguf/qwen3_tts_talker.gguf

gguf_q5_k_m/qwen3_assets.gguf

gguf_q5_k_m/qwen3_tts_predictor.gguf

gguf_q5_k_m/qwen3_tts_talker.gguf

gguf_q8_0/qwen3_assets.gguf

gguf_q8_0/qwen3_tts_predictor.gguf

gguf_q8_0/qwen3_tts_talker.gguf

onnx/qwen3_tts_codec_encoder.onnx ONNX

onnx/qwen3_tts_decoder.onnx ONNX

onnx/qwen3_tts_speaker_encoder.onnx ONNX

preset_speakers/aiden.json

preset_speakers/dylan.json

preset_speakers/eric.json

preset_speakers/index.json

preset_speakers/ono_anna.json

preset_speakers/ryan.json

preset_speakers/serena.json

preset_speakers/sohee.json

preset_speakers/uncle_fu.json

preset_speakers/vivian.json

tokenizer/tokenizer.json