返回模型
说明文档
google/madlad400-3b-mt 的 ONNX 版本
使用 optimum-cli 转换和量化
- 转换为 ONNX:
optimum-cli onnxruntime export --model google/madlad400-3b-mt <output_path> --legacy
- 量化:
optimum-cli onnxruntime quantize --onnx_model <input_model_path> -o <output_model_path> --avx512_vnni
ISoloist1/madlad400-3b-mt-onnx
作者 ISoloist1
translation
↓ 1
♥ 1
创建时间: 2025-06-30 10:08:20+00:00
更新时间: 2025-06-30 11:32:18+00:00
在 Hugging Face 上查看文件 (12)
.gitattributes
README.md
config.json
decoder_model_merged_quantized.onnx
ONNX
decoder_model_quantized.onnx
ONNX
decoder_with_past_model_quantized.onnx
ONNX
encoder_model_quantized.onnx
ONNX
ort_config.json
special_tokens_map.json
spiece.model
tokenizer.json
tokenizer_config.json