ONNX 模型库
返回模型

说明文档

whisper-large-v3-onnx-w8a16-dynamic 的 ONNX 版本

本仓库包含 openai/whisper-large-v3 模型的 ONNX 版本。

模型详情

原始模型可在此处找到:openai/whisper-large-v3

量化

本模型已使用动态量化技术量化为 w8a16。 这减小了模型大小,并可以提高推理速度,尤其是在 CPU 上。

使用方法

该模型可与 optimum.onnxruntime.ORTModelForSpeechSeq2Seq 一起使用。

from optimum.onnxruntime import ORTModelForSpeechSeq2Seq
from transformers import WhisperProcessor

model_name = "mirekphd/whisper-large-v3-onnx-w8a16-dynamic"
processor = WhisperProcessor.from_pretrained(model_name)
model = ORTModelForSpeechSeq2Seq.from_pretrained(model_name)

# ... 在此添加您的推理代码 ...

mirekphd/whisper-large-v3-onnx-w8a16-dynamic

作者 mirekphd

automatic-speech-recognition
↓ 0 ♥ 0

创建时间: 2025-07-19 17:52:14+00:00

更新时间: 2025-07-19 17:52:49+00:00

在 Hugging Face 上查看

文件 (14)

.gitattributes
README.md
added_tokens.json
config.json
decoder_model.onnx ONNX
decoder_with_past_model.onnx ONNX
encoder_model.onnx ONNX
generation_config.json
merges.txt
normalizer.json
preprocessor_config.json
special_tokens_map.json
tokenizer_config.json
vocab.json