ONNX 模型库
返回模型

说明文档

修改了 Microsoft/Olive、Microsoft/Onnxgenruntime-ai 和 AMD Quark,以接受并配置 qwen3 用于 AMD NPU 支持。 此项工作仍在进行中,由于复杂性,其中一层被暂时搁置。

RyzenAI 1.6.0 于 3 天前发布,现已支持 Qwen3。也许这个模型可以在上面运行。 我目前使用的是 RyzenAI 1.5.1,遇到了以下问题:某一层不是已注册的函数/算子。

Loading model from: Qwen3-0.6B-w_uint4_per_group_asym-awq-FINAL\model

onnxruntime.capi.onnxruntime_pybind11_state.Fail: [ONNXRuntimeError] : 1 : FAIL : Load model from Qwen3-0.6B-w_uint4_per_group_asym-awq-FINAL\model\model.onnx failed:Fatal error: com.amd:AMDSimplifiedLayerNormalization(-1) is not a registered function/op

anthonymikinka/Qwen3-0.6B-w_uint4_per_group_asym-awq

作者 anthonymikinka

text-generation
↓ 0 ♥ 0

创建时间: 2025-10-11 10:42:30+00:00

更新时间: 2025-10-11 11:06:53+00:00

在 Hugging Face 上查看

文件 (13)

.gitattributes
README.md
model/added_tokens.json
model/chat_template.jinja
model/genai_config.json
model/merges.txt
model/model.data
model/model.onnx ONNX
model/model.onnx.data
model/special_tokens_map.json
model/tokenizer.json
model/tokenizer_config.json
model/vocab.json