返回模型
说明文档
bge-small-en-v1.5
此版本的 bge-small-en-v1.5 模型已转换为在 Axera NPU 上运行,采用 w8a16 量化。
此模型已使用以下 LoRA 进行优化:
兼容 Pulsar2 版本:5.0-patch1
转换工具链接:
对于对模型转换感兴趣的用户,可以通过以下方式导出 axmodel:
-
模型转换,可获取详细指南
支持平台
- AX650
| 芯片 | 模型 | 耗时 | 内存占用 |
|---|---|---|---|
| AX650 | bge-small-en-v1.5 | 32.4 ms | 120 MiBytes |
使用方法
将此仓库中的所有文件下载到设备上
(py312) root@ax650:~/bge-small-en-v1.5# tree
.
|-- README.md
|-- model
| |-- bge-small-en-v1.5.json
| |-- bge-small-en-v1.5.onnx
| `-- bge-small-en-v1.5_u16_npu3.axmodel
|-- python
| |-- axmodel_infer.py
| `-- onnx_infer.py
`-- requirements.txt
推理
使用 AX650 主机进行推理,如 M4N-Dock(爱芯派Pro)
运行 python3 axmodel_infer.py
root@ax650:~/bge-small-en-v1.5# python3 axmodel_infer.py
[INFO] Available providers: ['AxEngineExecutionProvider']
[INFO] Using provider: AxEngineExecutionProvider
[INFO] Chip type: ChipType.MC50
[INFO] VNPU type: VNPUType.DISABLED
[INFO] Engine version: 2.12.0s
[INFO] Model type: 2 (triple core)
[INFO] Compiler version: 5.0-patch1 be1a7606
similarity: [[0.8832189]]
gt similarity: [[0.87731415]]
AXERA-TECH/bge-small-en-v1.5
作者 AXERA-TECH
feature-extraction
↓ 1
♥ 0
创建时间: 2025-12-08 07:40:02+00:00
更新时间: 2025-12-09 02:38:52+00:00
在 Hugging Face 上查看文件 (11)
.gitattributes
README.md
config.json
model/bge-small-en-v1.5.json
model/bge-small-en-v1.5.onnx
ONNX
model/bge-small-en-v1.5_b2.onnx
ONNX
model/bge-small-en-v1.5_b2_u16_npu3.axmodel
model/bge-small-en-v1.5_u16_npu3.axmodel
python/axmodel_infer.py
python/onnx_infer.py
requirements.txt