说明文档
Taein-TTS
描述
Taein-TTS 是一个旨在创建用我自己的声音朗读句子的文本转语音(TTS)系统的项目。本仓库包含使用我的声音训练的预训练模型。
目录
安装
本 README 侧重于指导您使用预训练模型合成语音,而不是详细介绍模型训练过程。
-
克隆 HuggingFace 仓库: https://huggingface.co/icecream0910/taein-tts
-
修改
/server目录中的run-server.bat批处理文件,使其与您的实际文件路径匹配。例如,如果您的 server 文件夹位于
C:\myown-tts\server,请按以下方式更新文件:@echo off setlocal cd /D \"%~dp0\" set MECAB_KO_DIC_PATH=.\mecab\mecab-ko-dic -r .\mecab\mecabrc set TTS_MODEL_FILE=C:\myown-tts\server\models\glowtts-v2\best_model.pth.tar set TTS_MODEL_CONFIG=C:\myown-tts\server\models\glowtts-v2\config.json set VOCODER_MODEL_FILE=C:\myown-tts\server\models\hifigan-v2\best_model.pth.tar set VOCODER_MODEL_CONFIG=C:\myown-tts\server\models\hifigan-v2\config.json server.exe endlocal -
更新
/server/models/目录中的glowtts-v2/config.json和hifigan-v2/config.json文件,填入您的实际文件路径。请确保在文件路径中将反斜杠加倍(
\\),如下所示:- 对于
glowtts-v2/config.json:
\"stats_path\": \"C:\\mydata\\tts-server\\models\\glowtts-v2\\scale_stats.npy\"- 对于
hifigan-v2/config.json:
\"stats_path\": \"C:\\mydata\\tts-server\\models\\hifigan-v2\\scale_stats.npy\" - 对于
使用方法
要启动 TTS 服务器,请执行 run-server.bat。服务器运行后,您将在命令提示符中看到消息 INFO:werkzeug: * Running on http://0.0.0.0:5000/ (Press CTRL+C to quit),这表示语音合成功能已通过 TTS 服务器可用。要停止服务器,请在命令提示符中按 CTRL+C。
API
-
文本预处理:
/tts-server/api/process-text分割句子并删除特殊字符,以便在您输入时自动拼接并播放多行句子。
-
文本推理:
/tts-server/api/infer-glowtts将文本合成为语音。在 URL 的
text参数中发送要合成的文本。示例:
http://localhost:5000/tts-server/api/infer-glowtts?text=hello
文本推理演示页面
访问 http://localhost:5000/ 查看演示。
贡献
- Fork 本仓库。
- 创建新分支:
git checkout -b feature/<featureName>。 - 提交您的更改:
git commit -am 'Add <featureName>'。 - 推送到分支:
git push origin feature/<featureName>。 - 提交 Pull Request。
许可证
本项目采用 MIT 许可证 授权。
参考资料
本实现参考了以下仓库:
以下数据集根据 CC-BY 2.0 许可证分发,原始文本数据由韩国信息社会发展研究院的 AI Hub 提供,包括韩语对话文本数据和韩英翻译(平行)语料库文本数据。
- Korean Corpus for Voice Recording
- SleepingCE Speech Dataset
- SleepingCE 语音数据集预训练模型 (Glow-TTS)
- SleepingCE 语音数据集预训练模型 (HiFi-GAN)
- 这些模型是在 VCTK 数据集上训练的 coqui-ai/TTS 提供的模型基础上微调的,可在此处获取 here。
icecream0910/taein-tts
作者 icecream0910
创建时间: 2024-02-10 08:16:44+00:00
更新时间: 2024-02-10 10:09:45+00:00
在 Hugging Face 上查看