ONNX 模型库
返回模型

说明文档

Kitten TTS 😻

Kitten TTS 是一款开源的逼真文本转语音模型,仅包含 1500 万个参数,专为轻量级部署和高质量语音合成而设计。

目前处于开发者预览阶段

✨ 特性

  • 超轻量级:模型大小小于 25MB
  • CPU 优化:无需 GPU,可在任何设备上运行
  • 高质量语音:多种优质语音选项可选
  • 快速推理:专为实时语音合成优化

🚀 快速开始

安装

pip install https://github.com/KittenML/KittenTTS/releases/download/0.1/kittentts-0.1.0-py3-none-any.whl

基本用法

from kittentts import KittenTTS
m = KittenTTS("KittenML/kitten-tts-nano-0.1")

audio = m.generate("This high quality TTS model works without a GPU")

# 保存音频
import soundfile as sf
sf.write('output.wav', audio, 24000)

💻 系统要求

可在任何设备上运行

待办事项

  • [x] 发布预览模型
  • [ ] 发布完整训练的模型权重
  • [ ] 发布移动端 SDK
  • [ ] 发布网页版本

KittenML/kitten-tts-nano-0.1

作者 KittenML

kittentts
↓ 40.5K ♥ 507

创建时间: 2025-08-05 01:43:50+00:00

更新时间: 2025-08-30 06:33:49+00:00

在 Hugging Face 上查看

文件 (5)

.gitattributes
README.md
config.json
kitten_tts_nano_v0_1.onnx ONNX
voices.npz