返回模型
说明文档
ONNX 导出:broadfield-dev/bert-small-ner-pii-tuned-12261022
这是 broadfield-dev/bert-small-ner-pii-tuned-12261022 的 ONNX 转换和优化版本。
模型详情
- 基础模型:
broadfield-dev/bert-small-ner-pii-tuned-12261022 - 任务:
token-classification - Opset 版本:
17 - 优化:
INT8 - 针对移动端优化 (ARM64)
使用方法
安装
pip install onnxruntime transformers
Python 示例
from tokenizers import Tokenizer
import onnxruntime as ort
import numpy as np
# 1. 加载轻量级分词器(无需 Transformers 依赖)
tokenizer = Tokenizer.from_pretrained("broadfield-dev/bert-small-ner-pii-tuned-12261022-onnx")
# 2. 加载 ONNX 模型
session = ort.InferenceSession("model.onnx")
# 3. 预处理(简单的文本编码)
text = "Run inference on mobile!"
encoding = tokenizer.encode(text)
# 准备输入(具体名称因模型而异,通常是 input_ids + attention_mask)
inputs = {
"input_ids": np.array([encoding.ids], dtype=np.int64),
"attention_mask": np.array([encoding.attention_mask], dtype=np.int64)
}
# 4. 运行推理
outputs = session.run(None, inputs)
print("Output logits shape:", outputs[0].shape)
关于此导出
此模型使用 Optimum 和 onnxruntime 导出。
它包含 INT8 - 针对移动端优化 (ARM64) 量化设置。
broadfield-dev/bert-small-ner-pii-mobile
作者 broadfield-dev
token-classification
transformers
↓ 0
♥ 0
创建时间: 2025-12-26 22:29:07+00:00
更新时间: 2025-12-27 00:23:07+00:00
在 Hugging Face 上查看文件 (9)
.gitattributes
README.md
config.json
model.onnx
ONNX
ort_config.json
special_tokens_map.json
tokenizer.json
tokenizer_config.json
vocab.txt