返回模型
说明文档
NVIDIA Parakeet TDT 0.6B V3(多语言)
安装 onnx-asr
pip install onnx-asr[cpu,hub]
加载 Parakeet TDT 模型并识别 wav 文件
import onnx_asr
model = onnx_asr.load_model("nemo-parakeet-tdt-0.6b-v3")
print(model.recognize("test.wav"))
模型导出代码
import nemo.collections.asr as nemo_asr
from pathlib import Path
model = nemo_asr.models.ASRModel.from_pretrained("nvidia/parakeet-tdt-0.6b-v3")
onnx_dir = Path("nemo-onnx")
onnx_dir.mkdir(exist_ok=True)
model.export(str(Path(onnx_dir, "model.onnx")))
with Path(onnx_dir, "vocab.txt").open("wt") as f:
for i, token in enumerate([*model.tokenizer.vocab, "<blk>"]):
f.write(f"{token} {i}\n")
istupakov/parakeet-tdt-0.6b-v3-onnx
作者 istupakov
automatic-speech-recognition
↓ 26.4K
♥ 40
创建时间: 2025-08-16 21:00:05+00:00
更新时间: 2026-02-17 14:26:49+00:00
在 Hugging Face 上查看文件 (10)
.gitattributes
README.md
config.json
decoder_joint-model.int8.onnx
ONNX
decoder_joint-model.onnx
ONNX
encoder-model.int8.onnx
ONNX
encoder-model.onnx
ONNX
encoder-model.onnx.data
nemo128.onnx
ONNX
vocab.txt