ONNX 模型库
返回模型

说明文档

这是与 https://huggingface.co/ISoloist1/madlad400-3b-mt-onnx 相同的模型,但文件夹结构针对 Transformers.js 进行了优化。

google/madlad400-3b-mt 的 ONNX 版本

使用 optimum-cli 转换和量化

  • 转换为 ONNX:
optimum-cli onnxruntime export --model google/madlad400-3b-mt <output_path> --legacy
  • 量化:
optimum-cli onnxruntime quantize --onnx_model <input_model_path> -o <output_model_path> --avx512_vnni

Kutalia/madlad400-3b-mt-onnx

作者 Kutalia

translation
↓ 1 ♥ 1

创建时间: 2025-07-27 16:49:21+00:00

更新时间: 2025-07-27 17:04:43+00:00

在 Hugging Face 上查看

文件 (12)

.gitattributes
README.md
config.json
onnx/decoder_model_merged_quantized.onnx ONNX
onnx/decoder_model_quantized.onnx ONNX
onnx/decoder_with_past_model_quantized.onnx ONNX
onnx/encoder_model_quantized.onnx ONNX
ort_config.json
special_tokens_map.json
spiece.model
tokenizer.json
tokenizer_config.json