返回模型
说明文档
<span style="color:#76b900;">🦜 parakeet-tdt-0.6b-v3:多语言语音转文本模型</span>
<style> img { display: inline; } </style>
<span style="color:#466f00;">描述:</span>
parakeet-tdt-0.6b-v3 是一个拥有6亿参数的多语言自动语音识别(ASR)模型,专为高吞吐量语音转文本转录而设计。它通过将语言支持从英语扩展到25种欧洲语言,对 parakeet-tdt-0.6b-v2 模型进行了扩展。该模型能够自动检测音频的语言并进行转录,无需额外的提示。它是一系列利用 Granary [1, 2] 多语言语料库作为主要训练数据集的模型之一。
🗣️ 在此试用演示:https://huggingface.co/spaces/nvidia/parakeet-tdt-0.6b-v3
支持的语言:
保加利亚语,克罗地亚语,捷克语,丹麦语,荷兰语,英语,爱沙尼亚语,芬兰语,法语,德语,希腊语,匈牙利语,意大利语,拉脱维亚语,立陶宛语,马耳他语,波兰语,葡萄牙语,罗马尼亚语,斯洛伐克语,斯洛文尼亚语,西班牙语,瑞典语,俄语,乌克兰语
本模型可用于商业/非商业用途。
shahrukhx01/parakeet-tdt-0.6b-v3-fp32-onnx
作者 shahrukhx01
automatic-speech-recognition
nemo
↓ 0
♥ 2
创建时间: 2025-12-16 17:32:17+00:00
更新时间: 2025-12-16 17:47:26+00:00
在 Hugging Face 上查看文件 (7)
.gitattributes
README.md
decoder.onnx
ONNX
encoder.onnx
ONNX
encoder.weights
joiner.onnx
ONNX
parakeet_vocab.yaml