说明文档
license: mit base_model: tanaos/tanaos-text-anonymizer-v1 tags:
- ner
- pii
- onnx
- token-classification
- named-entity-recognition language:
- en library_name: onnx
RuleSentry Core PII
tanaos/tanaos-text-anonymizer-v1 的 ONNX 导出版本,用于 RuleSentry Desktop 中的本地 PII 检测。
致谢
本模型是 tanaos 开发的 tanaos-text-anonymizer-v1 的 ONNX 转换版本。 我们将其转换为 ONNX 格式,以便在没有 Python 依赖的情况下实现高效的 CPU/GPU 推理。
原始模型: https://huggingface.co/tanaos/tanaos-text-anonymizer-v1
支持的实体类型
| 实体 | 示例 |
|---|---|
| PERSON | "John Douglas" |
| LOCATION | "New York" |
| DATE | "January 15, 2024" |
| ADDRESS | "123 Main St, Suite 400" |
| PHONE_NUMBER | "(555) 123-4567" |
模型文件
model.onnx- ONNX 模型 (~496 MB)tokenizer.json- 分词器配置config.json- 模型配置labels.json- NER 标签映射vocab.json- 词汇表merges.txt- BPE 合并文件
使用方法
本模型专为 RuleSentry Desktop 设计,用于本地、保护隐私的文档匿名化处理。
使用 ONNX Runtime (Rust)
use ort::{Session, SessionBuilder};
let session = SessionBuilder::new()?
.with_model_from_file("model.onnx")?;
使用 ONNX Runtime (Python)
import onnxruntime as ort
session = ort.InferenceSession("model.onnx")
许可证
MIT 许可证 - 与原始模型相同。
版权所有 (c) 2024 tanaos (原始模型) 版权所有 (c) 2024 RuleSentry (ONNX 转换)
特此免费授予任何获得本软件副本和相关文档文件("软件")的人不受限制地处置该软件的权利,包括不受限制地使用、复制、修改、合并、发布、分发、再授权和/或销售该软件副本的权利,以及再授权给配备了这些软件的人员的权利,但须满足以下条件:
上述版权声明和本许可声明应包含在该软件的所有副本或实质性部分中。
本软件按"原样"提供,不提供任何形式的保证,无论是明示的或暗示的,包括但不限于适销性、特定用途适用性和非侵权性的保证。在任何情况下,作者或版权持有人均不对任何索赔、损害赔偿或其他责任负责,无论是在合同诉讼、侵权行为还是其他方面,由软件或软件的使用或其他交易引起、与之相关或与之相关。
rulesentry/core-pii
作者 rulesentry
创建时间: 2025-12-30 16:23:55+00:00
更新时间: 2025-12-30 17:36:58+00:00
在 Hugging Face 上查看