ONNX 模型库
返回模型

说明文档

<p align="center"> <img src="https://horstmann.tech/cosyvoice2-demo/cosyvoice2-logo-clear.png" alt="CosyVoice2-EU logo" width="260"> </p>

CosyVoice2-0.5B-EU — 法语/德语零样本语音克隆(CosyVoice2)

面向法语和德语的欧化版 CosyVoice2。
即插即用的零样本语音克隆,支持流式合成、双语训练(法语+德语),并通过配套 PyPI 包提供简单易用的命令行工具。

👉 PyPI: cosyvoice2-eu(当前版本:0.2.7)地址 https://pypi.org/project/cosyvoice2-eu/
👉 演示: https://horstmann.tech/cosyvoice2-demo/
👉 基于: FunAudioLLM CosyVoice2(语义语言模型 + 分块感知流模型 + HiFi-GAN)


一句话概述

基于 CosyVoice2 构建的高质量法语/德语零样本语音合成(文本 + 短参考音频)。针对句子到段落的旁白朗读、法语+德语双语适配以及便捷的本地推理进行了优化。 虽然本模型针对法语和德语进行了优化,但它仍然完全兼容原始 CosyVoice2 支持的语言——英语、中文、日语、韩语及其各方言。


快速开始(命令行)

安装:

pip install cosyvoice2-eu

法语示例:

cosy2-eu   --text "Salut ! Je vous présente CosyVoice 2, un système de synthèse vocale très avancé."   --prompt path/to/french_ref.wav   --out out_fr.wav

德语示例:

cosy2-eu   --text "Hallo! Ich präsentiere CosyVoice 2 – ein fortschrittliches TTS-System."   --prompt path/to/german_ref.wav   --out out_de.wav

首次运行会从本仓库下载模型并缓存到本地。
提示:您可以使用 "<风格>. <|endofprompt|> <文本>" 格式的提示词来控制风格,例如:"用欢快的语气说话。 <|endofprompt|> Hallo! Wie geht es Ihnen heute?"


功能特性

  • 零样本语音克隆,支持法语/德语(参考音频 → 克隆音色和风格)。
  • 双语适配(法语+德语),在 CosyVoice2 基础上实现更高的数据效率。虽然本模型新增了对法语和德语的支持,但仍完全兼容原始 CosyVoice2 支持的语言——英语、中文、日语、韩语及其各方言。
  • 流式和非流式合成均由底层架构支持。
  • 简单的本地推理:一次 pip 安装,一个命令行工具(cosy2-eu)。
  • 可互操作组件(文本→语义语言模型、流解码器、HiFi-GAN 声码器)。

同时兼容原始 CosyVoice2 语言(英语/中文/日语/韩语及各方言)。


输入 / 输出

  • 输入: 文本(法语/德语)+ 短参考音频(推荐单声道 WAV 格式)。
  • 输出: 合成的 WAV 音频,克隆参考说话人的音色,以法语/德语朗读输入文本。

注意事项与限制

  • 法语/德语是在有限的开源数据预算下进行适配的;极端边缘情况(噪声很大的提示音频、长数字串、大量语码切换)可能需要仔细调整提示词或进行额外微调。
  • 语音克隆存在滥用风险(冒充、欺诈)。请仅在获得授权的情况下使用,并遵守当地法律法规。

许可证与归属

  • 许可证: Apache-2.0(见模型卡元数据 / 仓库)。
  • 基于 FunAudioLLM 的 CosyVoice2 构建;请引用其工作(见下文)。

相关链接

  • PyPI(推理命令行):https://pypi.org/project/cosyvoice2-eu/
  • 上游项目:https://github.com/FunAudioLLM/CosyVoice
  • CosyVoice2 论文与主页:https://arxiv.org/abs/2412.10117 • https://funaudiollm.github.io/cosyvoice2/

如果您在研究或产品中使用 CosyVoice2-0.5B-EU,请添加简短致谢并分享反馈或示例——我们将持续改进法语/德语的表现力和鲁棒性。

Luka512/CosyVoice2-0.5B-EU

作者 Luka512

text-to-speech
↓ 0 ♥ 8

创建时间: 2025-07-07 11:46:57+00:00

更新时间: 2025-09-12 10:15:42+00:00

在 Hugging Face 上查看

文件 (19)

.gitattributes
CosyVoice-BlankEN/config.json
CosyVoice-BlankEN/generation_config.json
CosyVoice-BlankEN/merges.txt
CosyVoice-BlankEN/model.safetensors
CosyVoice-BlankEN/tokenizer_config.json
CosyVoice-BlankEN/vocab.json
README.md
campplus.onnx ONNX
cosyvoice2.yaml
flow.decoder.estimator.fp32.onnx ONNX
flow.encoder.fp16.zip
flow.encoder.fp32.zip
flow.pt
hifigan.pt
hift.pt
llm.pt
sample_audio_prompt.wav
speech_tokenizer_v2.onnx ONNX