ONNX 模型库
返回模型

说明文档

microsoft/Phi-3.5-mini-instruct

  • 简介

    • 量化工具:Quark 0.6.0
    • OGA 模型构建器:v0.5.1
  • 量化策略

    • AWQ / 分组 128 / 非对称 / UINT4 权重 / FP16 激活
    • 排除层:无
    python3 quantize_quark.py \
          --model_dir \"$model\" \
          --output_dir \"$output_dir\" \
          --quant_scheme w_uint4_per_group_asym \
          --num_calib_data 128 \
          --quant_algo awq \
          --dataset pileval_for_awq_benchmark \
          --seq_len 512 \
          --model_export quark_safetensors \
          --data_type float16 \
          --exclude_layers [] \
          --custom_mode awq
    
  • OGA 模型构建器

    python builder.py \
      -i <quantized safetensor model dir> \
      -o <oga model output dir> \
      -p int4 \
      -e dml
    

amd/Phi-3.5-mini-instruct-awq-g128-int4-asym-fp16-onnx-dml

作者 amd

text-generation transformers
↓ 0 ♥ 0

创建时间: 2024-11-30 04:13:05+00:00

更新时间: 2024-12-03 13:42:46+00:00

在 Hugging Face 上查看

文件 (10)

.gitattributes
README.md
added_tokens.json
genai_config.json
model.onnx ONNX
model.onnx.data
special_tokens_map.json
tokenizer.json
tokenizer.model
tokenizer_config.json