返回模型

说明文档

CosyVoice2-0.5B-EU — 法语/德语零样本语音克隆（CosyVoice2）

面向法语和德语的欧化版 CosyVoice2。
即插即用的零样本语音克隆，支持流式合成、双语训练（法语+德语），并通过配套 PyPI 包提供简单易用的命令行工具。

👉 PyPI： cosyvoice2-eu（当前版本：0.2.7）地址 https://pypi.org/project/cosyvoice2-eu/
👉 演示： https://horstmann.tech/cosyvoice2-demo/
👉 基于： FunAudioLLM CosyVoice2（语义语言模型 + 分块感知流模型 + HiFi-GAN）

一句话概述

基于 CosyVoice2 构建的高质量法语/德语零样本语音合成（文本 + 短参考音频）。针对句子到段落的旁白朗读、法语+德语双语适配以及便捷的本地推理进行了优化。虽然本模型针对法语和德语进行了优化，但它仍然完全兼容原始 CosyVoice2 支持的语言——英语、中文、日语、韩语及其各方言。

快速开始（命令行）

安装：

pip install cosyvoice2-eu

法语示例：

cosy2-eu   --text "Salut ! Je vous présente CosyVoice 2, un système de synthèse vocale très avancé."   --prompt path/to/french_ref.wav   --out out_fr.wav

德语示例：

cosy2-eu   --text "Hallo! Ich präsentiere CosyVoice 2 – ein fortschrittliches TTS-System."   --prompt path/to/german_ref.wav   --out out_de.wav

首次运行会从本仓库下载模型并缓存到本地。
提示：您可以使用 "<风格>. <|endofprompt|> <文本>" 格式的提示词来控制风格，例如："用欢快的语气说话。 <|endofprompt|> Hallo! Wie geht es Ihnen heute?"

功能特性

零样本语音克隆，支持法语/德语（参考音频 → 克隆音色和风格）。
双语适配（法语+德语），在 CosyVoice2 基础上实现更高的数据效率。虽然本模型新增了对法语和德语的支持，但仍完全兼容原始 CosyVoice2 支持的语言——英语、中文、日语、韩语及其各方言。
流式和非流式合成均由底层架构支持。
简单的本地推理：一次 pip 安装，一个命令行工具（cosy2-eu）。
可互操作组件（文本→语义语言模型、流解码器、HiFi-GAN 声码器）。

同时兼容原始 CosyVoice2 语言（英语/中文/日语/韩语及各方言）。

输入 / 输出

输入： 文本（法语/德语）+ 短参考音频（推荐单声道 WAV 格式）。
输出： 合成的 WAV 音频，克隆参考说话人的音色，以法语/德语朗读输入文本。

注意事项与限制

法语/德语是在有限的开源数据预算下进行适配的；极端边缘情况（噪声很大的提示音频、长数字串、大量语码切换）可能需要仔细调整提示词或进行额外微调。
语音克隆存在滥用风险（冒充、欺诈）。请仅在获得授权的情况下使用，并遵守当地法律法规。

许可证与归属

许可证： Apache-2.0（见模型卡元数据 / 仓库）。
基于 FunAudioLLM 的 CosyVoice2 构建；请引用其工作（见下文）。

相关链接

PyPI（推理命令行）：https://pypi.org/project/cosyvoice2-eu/
上游项目：https://github.com/FunAudioLLM/CosyVoice
CosyVoice2 论文与主页：https://arxiv.org/abs/2412.10117 • https://funaudiollm.github.io/cosyvoice2/

如果您在研究或产品中使用 CosyVoice2-0.5B-EU，请添加简短致谢并分享反馈或示例——我们将持续改进法语/德语的表现力和鲁棒性。

Luka512/CosyVoice2-0.5B-EU

作者 Luka512

text-to-speech

↓ 0 ♥ 8

创建时间: 2025-07-07 11:46:57+00:00

更新时间: 2025-09-12 10:15:42+00:00

在 Hugging Face 上查看

文件 (19)

.gitattributes

CosyVoice-BlankEN/config.json

CosyVoice-BlankEN/generation_config.json

CosyVoice-BlankEN/merges.txt

CosyVoice-BlankEN/model.safetensors

CosyVoice-BlankEN/tokenizer_config.json

CosyVoice-BlankEN/vocab.json

README.md

campplus.onnx ONNX

cosyvoice2.yaml

flow.decoder.estimator.fp32.onnx ONNX

flow.encoder.fp16.zip

flow.encoder.fp32.zip

flow.pt

hifigan.pt

hift.pt

llm.pt

sample_audio_prompt.wav

speech_tokenizer_v2.onnx ONNX