ONNX 模型库
返回模型

说明文档

ONNX 导出:broadfield-dev/bert-small-ner-pii-tuned-12261022

这是 broadfield-dev/bert-small-ner-pii-tuned-12261022 的 ONNX 转换和优化版本。

模型详情

  • 基础模型: broadfield-dev/bert-small-ner-pii-tuned-12261022
  • 任务: token-classification
  • Opset 版本: 17
  • 优化: INT8 - 针对移动端优化 (ARM64)

使用方法

安装

pip install onnxruntime transformers

Python 示例

from tokenizers import Tokenizer
import onnxruntime as ort
import numpy as np

# 1. 加载轻量级分词器(无需 Transformers 依赖)
tokenizer = Tokenizer.from_pretrained("broadfield-dev/bert-small-ner-pii-tuned-12261022-onnx")

# 2. 加载 ONNX 模型
session = ort.InferenceSession("model.onnx")

# 3. 预处理(简单的文本编码)
text = "Run inference on mobile!"
encoding = tokenizer.encode(text)

# 准备输入(具体名称因模型而异,通常是 input_ids + attention_mask)
inputs = {
    "input_ids": np.array([encoding.ids], dtype=np.int64),
    "attention_mask": np.array([encoding.attention_mask], dtype=np.int64)
}

# 4. 运行推理
outputs = session.run(None, inputs)
print("Output logits shape:", outputs[0].shape)

关于此导出

此模型使用 Optimumonnxruntime 导出。 它包含 INT8 - 针对移动端优化 (ARM64) 量化设置。

broadfield-dev/bert-small-ner-pii-mobile

作者 broadfield-dev

token-classification transformers
↓ 0 ♥ 0

创建时间: 2025-12-26 22:29:07+00:00

更新时间: 2025-12-27 00:23:07+00:00

在 Hugging Face 上查看

文件 (9)

.gitattributes
README.md
config.json
model.onnx ONNX
ort_config.json
special_tokens_map.json
tokenizer.json
tokenizer_config.json
vocab.txt