说明文档

Kitten TTS 😻

Kitten TTS 是一款开源的逼真文本转语音模型，仅包含 1500 万个参数，专为轻量级部署和高质量语音合成而设计。

目前处于开发者预览阶段

✨ 特性

超轻量级：模型大小小于 25MB
CPU 优化：无需 GPU，可在任何设备上运行
高质量语音：多种优质语音选项可选
快速推理：专为实时语音合成优化

🚀 快速开始

安装

pip install https://github.com/KittenML/KittenTTS/releases/download/0.1/kittentts-0.1.0-py3-none-any.whl

基本用法

from kittentts import KittenTTS
m = KittenTTS("KittenML/kitten-tts-nano-0.1")

audio = m.generate("This high quality TTS model works without a GPU")

# 保存音频
import soundfile as sf
sf.write('output.wav', audio, 24000)

💻 系统要求

可在任何设备上运行

待办事项

[x] 发布预览模型
[ ] 发布完整训练的模型权重
[ ] 发布移动端 SDK
[ ] 发布网页版本

KittenML/kitten-tts-nano-0.1

作者 KittenML

kittentts

↓ 40.5K ♥ 507

创建时间: 2025-08-05 01:43:50+00:00

更新时间: 2025-08-30 06:33:49+00:00

在 Hugging Face 上查看

文件 (5)

.gitattributes

README.md

config.json

kitten_tts_nano_v0_1.onnx ONNX

voices.npz