返回模型
说明文档
microsoft/Phi-3.5-mini-instruct
-
简介
- 量化工具:Quark 0.6.0
- OGA 模型构建器:v0.5.1
-
量化策略
- AWQ / 分组 128 / 非对称 / UINT4 权重 / FP16 激活
- 排除层:无
python3 quantize_quark.py \ --model_dir \"$model\" \ --output_dir \"$output_dir\" \ --quant_scheme w_uint4_per_group_asym \ --num_calib_data 128 \ --quant_algo awq \ --dataset pileval_for_awq_benchmark \ --seq_len 512 \ --model_export quark_safetensors \ --data_type float16 \ --exclude_layers [] \ --custom_mode awq -
OGA 模型构建器
python builder.py \ -i <quantized safetensor model dir> \ -o <oga model output dir> \ -p int4 \ -e dml
amd/Phi-3.5-mini-instruct-awq-g128-int4-asym-fp16-onnx-dml
作者 amd
text-generation
transformers
↓ 0
♥ 0
创建时间: 2024-11-30 04:13:05+00:00
更新时间: 2024-12-03 13:42:46+00:00
在 Hugging Face 上查看文件 (10)
.gitattributes
README.md
added_tokens.json
genai_config.json
model.onnx
ONNX
model.onnx.data
special_tokens_map.json
tokenizer.json
tokenizer.model
tokenizer_config.json