ONNX 模型库
返回模型

说明文档

google/madlad400-3b-mt 的 ONNX 版本

使用 optimum-cli 转换和量化

  • 转换为 ONNX:
optimum-cli onnxruntime export --model google/madlad400-3b-mt <output_path> --legacy
  • 量化:
optimum-cli onnxruntime quantize --onnx_model <input_model_path> -o <output_model_path> --avx512_vnni

ISoloist1/madlad400-3b-mt-onnx

作者 ISoloist1

translation
↓ 1 ♥ 1

创建时间: 2025-06-30 10:08:20+00:00

更新时间: 2025-06-30 11:32:18+00:00

在 Hugging Face 上查看

文件 (12)

.gitattributes
README.md
config.json
decoder_model_merged_quantized.onnx ONNX
decoder_model_quantized.onnx ONNX
decoder_with_past_model_quantized.onnx ONNX
encoder_model_quantized.onnx ONNX
ort_config.json
special_tokens_map.json
spiece.model
tokenizer.json
tokenizer_config.json