返回模型
说明文档
这是与 https://huggingface.co/ISoloist1/madlad400-3b-mt-onnx 相同的模型,但文件夹结构针对 Transformers.js 进行了优化。
google/madlad400-3b-mt 的 ONNX 版本
使用 optimum-cli 转换和量化
- 转换为 ONNX:
optimum-cli onnxruntime export --model google/madlad400-3b-mt <output_path> --legacy
- 量化:
optimum-cli onnxruntime quantize --onnx_model <input_model_path> -o <output_model_path> --avx512_vnni
Kutalia/madlad400-3b-mt-onnx
作者 Kutalia
translation
↓ 1
♥ 1
创建时间: 2025-07-27 16:49:21+00:00
更新时间: 2025-07-27 17:04:43+00:00
在 Hugging Face 上查看文件 (12)
.gitattributes
README.md
config.json
onnx/decoder_model_merged_quantized.onnx
ONNX
onnx/decoder_model_quantized.onnx
ONNX
onnx/decoder_with_past_model_quantized.onnx
ONNX
onnx/encoder_model_quantized.onnx
ONNX
ort_config.json
special_tokens_map.json
spiece.model
tokenizer.json
tokenizer_config.json