说明文档

NVIDIA Parakeet TDT 0.6B V3（多语言）

模型已转换为 ONNX 格式，用于 onnx-asr。

安装 onnx-asr

pip install onnx-asr[cpu,hub]

加载 Parakeet TDT 模型并识别 wav 文件

import onnx_asr
model = onnx_asr.load_model("nemo-parakeet-tdt-0.6b-v3")
print(model.recognize("test.wav"))

模型导出代码

import nemo.collections.asr as nemo_asr
from pathlib import Path

model = nemo_asr.models.ASRModel.from_pretrained("nvidia/parakeet-tdt-0.6b-v3")

onnx_dir = Path("nemo-onnx")
onnx_dir.mkdir(exist_ok=True)
model.export(str(Path(onnx_dir, "model.onnx")))

with Path(onnx_dir, "vocab.txt").open("wt") as f:
    for i, token in enumerate([*model.tokenizer.vocab, "<blk>"]):
        f.write(f"{token} {i}\n")

istupakov/parakeet-tdt-0.6b-v3-onnx

作者 istupakov

automatic-speech-recognition

↓ 26.4K ♥ 40

创建时间: 2025-08-16 21:00:05+00:00

更新时间: 2026-02-17 14:26:49+00:00

在 Hugging Face 上查看

文件 (10)

.gitattributes

README.md

config.json

decoder_joint-model.int8.onnx ONNX

decoder_joint-model.onnx ONNX

encoder-model.int8.onnx ONNX

encoder-model.onnx ONNX

encoder-model.onnx.data

nemo128.onnx ONNX

vocab.txt