返回模型
说明文档
Kitten TTS 😻
Kitten TTS 是一款开源的逼真文本转语音模型,仅包含 1500 万个参数,专为轻量级部署和高质量语音合成而设计。
目前处于开发者预览阶段
✨ 特性
- 超轻量级:模型大小小于 25MB
- CPU 优化:无需 GPU,可在任何设备上运行
- 高质量语音:多种优质语音选项可选
- 快速推理:专为实时语音合成优化
🚀 快速开始
安装
pip install https://github.com/KittenML/KittenTTS/releases/download/0.1/kittentts-0.1.0-py3-none-any.whl
基本用法
from kittentts import KittenTTS
m = KittenTTS("KittenML/kitten-tts-nano-0.1")
audio = m.generate("This high quality TTS model works without a GPU")
# 保存音频
import soundfile as sf
sf.write('output.wav', audio, 24000)
💻 系统要求
可在任何设备上运行
待办事项
- [x] 发布预览模型
- [ ] 发布完整训练的模型权重
- [ ] 发布移动端 SDK
- [ ] 发布网页版本
KittenML/kitten-tts-nano-0.1
作者 KittenML
kittentts
↓ 40.5K
♥ 507
创建时间: 2025-08-05 01:43:50+00:00
更新时间: 2025-08-30 06:33:49+00:00
在 Hugging Face 上查看文件 (5)
.gitattributes
README.md
config.json
kitten_tts_nano_v0_1.onnx
ONNX
voices.npz