ONNX 模型库
返回模型

说明文档

<span style="color:#76b900;">🦜 parakeet-tdt-0.6b-v3:多语言语音转文本模型</span>

<style> img { display: inline; } </style>

模型架构 | 模型规模 | 语言

<span style="color:#466f00;">描述:</span>

parakeet-tdt-0.6b-v3 是一个拥有6亿参数的多语言自动语音识别(ASR)模型,专为高吞吐量语音转文本转录而设计。它通过将语言支持从英语扩展到25种欧洲语言,对 parakeet-tdt-0.6b-v2 模型进行了扩展。该模型能够自动检测音频的语言并进行转录,无需额外的提示。它是一系列利用 Granary [1, 2] 多语言语料库作为主要训练数据集的模型之一。

🗣️ 在此试用演示:https://huggingface.co/spaces/nvidia/parakeet-tdt-0.6b-v3

支持的语言:
保加利亚语,克罗地亚语,捷克语,丹麦语,荷兰语,英语,爱沙尼亚语,芬兰语,法语,德语,希腊语,匈牙利语,意大利语,拉脱维亚语,立陶宛语,马耳他语,波兰语,葡萄牙语,罗马尼亚语,斯洛伐克语,斯洛文尼亚语,西班牙语,瑞典语,俄语,乌克兰语

本模型可用于商业/非商业用途。

shahrukhx01/parakeet-tdt-0.6b-v3-fp32-onnx

作者 shahrukhx01

automatic-speech-recognition nemo
↓ 0 ♥ 2

创建时间: 2025-12-16 17:32:17+00:00

更新时间: 2025-12-16 17:47:26+00:00

在 Hugging Face 上查看

文件 (7)

.gitattributes
README.md
decoder.onnx ONNX
encoder.onnx ONNX
encoder.weights
joiner.onnx ONNX
parakeet_vocab.yaml