ONNX 模型库
返回模型

说明文档

<p align="center"> <img src="https://hi-paris.github.io/CosyVoice2-EU/cosyvoice2-logo-clear.png" alt="CosyVoice2-EU logo" width="260"> </p>

CosyVoice2-0.5B-EU — 法语/德语零样本语音克隆 (CosyVoice2)

面向法语和德语的欧洲化 CosyVoice2。
即插即用的零样本语音克隆,支持流式推理,双语训练(法语+德语),并通过配套的 PyPI 包提供简单的命令行工具。

👉 PyPI: cosyvoice2-eu(当前版本:0.2.7)https://pypi.org/project/cosyvoice2-eu/
👉 演示: https://hi-paris.github.io/CosyVoice2-EU/ 👉 基于构建: FunAudioLLM CosyVoice2(语义语言模型 + 分块感知流模型 + HiFi-GAN)


简介

基于 CosyVoice2 构建的高质量法语/德语零样本 TTS(文本 + 短参考音频)。针对句子到段落的叙述、法语+德语双语适配以及便捷的本地推理进行了优化。 虽然该模型针对法语和德语进行了优化,但它仍然完全兼容原始 CosyVoice2 的语言——英语、中文、日语、韩语及其方言。


快速开始(命令行)

安装:

pip install cosyvoice2-eu

法语示例:

cosy2-eu   --text "Salut ! Je vous présente CosyVoice 2, un système de synthèse vocale très avancé."   --prompt path/to/french_ref.wav   --out out_fr.wav

德语示例:

cosy2-eu   --text "Hallo! Ich präsentiere CosyVoice 2 – ein fortschrittliches TTS-System."   --prompt path/to/german_ref.wav   --out out_de.wav

首次运行会从此仓库下载模型并缓存到本地。
提示:您可以使用 "<style>. <|endofprompt|> <text>" 格式的提示词进行风格控制,例如 "Speak cheerfully. <|endofprompt|> Hallo! Wie geht es Ihnen heute?"


功能特性

  • 面向法语/德语零样本语音克隆(参考音频 → 克隆音色和风格)。
  • 在 CosyVoice2 基础上的双语适配(法语+德语),实现更高的数据效率。虽然该模型增加了对法语和德语的支持,但它仍然完全兼容原始 CosyVoice2 的语言——英语、中文、日语、韩语及其方言。
  • 底层架构支持流式和非流式合成。
  • 简单的本地推理:一个 pip 安装,一个命令行工具(cosy2-eu)。
  • 可互操作组件(文本→语义语言模型、流解码器、HiFi-GAN 声码器)。

同时兼容原始 CosyVoice2 语言(英语/中文/日语/韩语及方言)。


输入 / 输出

  • 输入: 文本(法语/德语)+ 短参考音频(建议使用单声道 WAV)。
  • 输出: 合成的 WAV 文件,克隆参考说话人的音色,用法语/德语朗读输入文本。

注意事项与限制

  • 法语/德语是在受限的开放数据预算下进行适配的;极端边缘情况(非常嘈杂的提示、长数字串、严重的语码转换)可能需要仔细的提示工程或额外的微调。
  • 语音克隆存在滥用风险(冒充、欺诈)。请仅在获得同意的情况下使用,并遵守当地法律和政策。

许可证与致谢

  • 许可证: Apache-2.0(参见卡片元数据/仓库)。
  • 基于 FunAudioLLM 的 CosyVoice2 构建;请引用他们的工作(见下文)。

相关链接

  • PyPI(推理命令行):https://pypi.org/project/cosyvoice2-eu/
  • 上游项目:https://github.com/FunAudioLLM/CosyVoice
  • CosyVoice2 论文和主页:https://arxiv.org/abs/2412.10117 • https://funaudiollm.github.io/cosyvoice2/

如果您在研究或产品中使用 CosyVoice2-0.5B-EU,请添加简短致谢并分享反馈或示例——我们正在持续改进法语/德语的表现力和鲁棒性。

hi-paris/CosyVoice2-0.5B-EU

作者 hi-paris

text-to-speech
↓ 0 ♥ 1

创建时间: 2025-10-09 13:25:16+00:00

更新时间: 2025-11-19 14:45:58+00:00

在 Hugging Face 上查看

文件 (19)

.gitattributes
CosyVoice-BlankEN/config.json
CosyVoice-BlankEN/generation_config.json
CosyVoice-BlankEN/merges.txt
CosyVoice-BlankEN/model.safetensors
CosyVoice-BlankEN/tokenizer_config.json
CosyVoice-BlankEN/vocab.json
README.md
campplus.onnx ONNX
cosyvoice2.yaml
flow.decoder.estimator.fp32.onnx ONNX
flow.encoder.fp16.zip
flow.encoder.fp32.zip
flow.pt
hifigan.pt
hift.pt
llm.pt
sample_audio_prompt.wav
speech_tokenizer_v2.onnx ONNX