ONNX 模型库
返回模型

说明文档

Whisper 模型量化

本仓库包含使用 ONNXRuntime 的 Smooth Quant 方法量化的 Whisper 模型

  1. 模型中仅对 Whisper 解码器进行了量化
  2. 模型已修改为接受固定形状的输入:编码器为 (1, 80, 3000),解码器为 (1, 448)。
  3. 推理时使用未量化的编码器模型和量化的解码器模型。
  4. 此模型用于测试,未来可能会发布更好的版本。

评估:

该模型在 librispeech_asr (clean) 测试数据集上的 WER 为 6.02%

mohitsha/whisper-tiny-static-shape-quantized-SL-448

作者 mohitsha

automatic-speech-recognition transformers
↓ 2 ♥ 0

创建时间: 2023-10-06 10:53:28+00:00

更新时间: 2023-10-24 03:32:41+00:00

在 Hugging Face 上查看

文件 (17)

.gitattributes
README.md
added_tokens.json
config.json
decoder_model_quantized.onnx ONNX
decoder_model_quantized_static_scatter.onnx ONNX
encoder_model.onnx ONNX
merges.txt
normalizer.json
ort_config.json
preprocessor_config.json
special_tokens_map.json
sq_model.onnx ONNX
tokenizer.json
tokenizer_config.json
vocab.json
whisper_eval.py