说明文档
<p align="center"> <img src="https://hi-paris.github.io/CosyVoice2-EU/cosyvoice2-logo-clear.png" alt="CosyVoice2-EU logo" width="260"> </p>
CosyVoice2-0.5B-EU — 法语/德语零样本语音克隆 (CosyVoice2)
面向法语和德语的欧洲化 CosyVoice2。
即插即用的零样本语音克隆,支持流式推理,双语训练(法语+德语),并通过配套的 PyPI 包提供简单的命令行工具。
👉 PyPI: cosyvoice2-eu(当前版本:0.2.7)https://pypi.org/project/cosyvoice2-eu/
👉 演示: https://hi-paris.github.io/CosyVoice2-EU/
👉 基于构建: FunAudioLLM CosyVoice2(语义语言模型 + 分块感知流模型 + HiFi-GAN)
简介
基于 CosyVoice2 构建的高质量法语/德语零样本 TTS(文本 + 短参考音频)。针对句子到段落的叙述、法语+德语双语适配以及便捷的本地推理进行了优化。 虽然该模型针对法语和德语进行了优化,但它仍然完全兼容原始 CosyVoice2 的语言——英语、中文、日语、韩语及其方言。
快速开始(命令行)
安装:
pip install cosyvoice2-eu
法语示例:
cosy2-eu --text "Salut ! Je vous présente CosyVoice 2, un système de synthèse vocale très avancé." --prompt path/to/french_ref.wav --out out_fr.wav
德语示例:
cosy2-eu --text "Hallo! Ich präsentiere CosyVoice 2 – ein fortschrittliches TTS-System." --prompt path/to/german_ref.wav --out out_de.wav
首次运行会从此仓库下载模型并缓存到本地。
提示:您可以使用"<style>. <|endofprompt|> <text>"格式的提示词进行风格控制,例如 "Speak cheerfully. <|endofprompt|> Hallo! Wie geht es Ihnen heute?"
功能特性
- 面向法语/德语的零样本语音克隆(参考音频 → 克隆音色和风格)。
- 在 CosyVoice2 基础上的双语适配(法语+德语),实现更高的数据效率。虽然该模型增加了对法语和德语的支持,但它仍然完全兼容原始 CosyVoice2 的语言——英语、中文、日语、韩语及其方言。
- 底层架构支持流式和非流式合成。
- 简单的本地推理:一个 pip 安装,一个命令行工具(
cosy2-eu)。 - 可互操作组件(文本→语义语言模型、流解码器、HiFi-GAN 声码器)。
同时兼容原始 CosyVoice2 语言(英语/中文/日语/韩语及方言)。
输入 / 输出
- 输入: 文本(法语/德语)+ 短参考音频(建议使用单声道 WAV)。
- 输出: 合成的 WAV 文件,克隆参考说话人的音色,用法语/德语朗读输入文本。
注意事项与限制
- 法语/德语是在受限的开放数据预算下进行适配的;极端边缘情况(非常嘈杂的提示、长数字串、严重的语码转换)可能需要仔细的提示工程或额外的微调。
- 语音克隆存在滥用风险(冒充、欺诈)。请仅在获得同意的情况下使用,并遵守当地法律和政策。
许可证与致谢
- 许可证: Apache-2.0(参见卡片元数据/仓库)。
- 基于 FunAudioLLM 的 CosyVoice2 构建;请引用他们的工作(见下文)。
相关链接
- PyPI(推理命令行):https://pypi.org/project/cosyvoice2-eu/
- 上游项目:https://github.com/FunAudioLLM/CosyVoice
- CosyVoice2 论文和主页:https://arxiv.org/abs/2412.10117 • https://funaudiollm.github.io/cosyvoice2/
如果您在研究或产品中使用 CosyVoice2-0.5B-EU,请添加简短致谢并分享反馈或示例——我们正在持续改进法语/德语的表现力和鲁棒性。
hi-paris/CosyVoice2-0.5B-EU
作者 hi-paris
创建时间: 2025-10-09 13:25:16+00:00
更新时间: 2025-11-19 14:45:58+00:00
在 Hugging Face 上查看