ONNX 模型库
返回模型

说明文档

这是一个经过微调的模型,旨在识别和分类非结构化文本数据中的个人身份信息(PII)。该强大模型能够准确识别广泛的 PII 类别,例如账户名称、信用卡号、电子邮件、电话号码和地址。该模型经过专门训练,可检测多种 PII 类型,包括但不限于:

| 类别               | 数据                                                                                   |
|------------------------|----------------------------------------------------------------------------------------|
| 账户相关信息 | 账户名称、账号和交易金额                             |
| 银行详细信息        | BIC、IBAN 以及比特币或以太坊地址                                           |
| 个人信息   | 全名、名字、中间名、姓氏、性别和出生日期               |
| 联系信息    | 电子邮件、电话号码和街道地址(包括门牌号、城市、县、州和邮政编码) |
| 工作相关数据       | 职位名称、工作领域、职位描述和工作类型                                      |
| 财务数据         | 信用卡号、发卡机构、CVV 和货币信息(代码、名称和符号)     |
| 数字标识符    | IP 地址(IPv4 和 IPv6)、MAC 地址和用户代理                           |
| 网络存在        | URL、用户名和密码                                                          |
| 其他敏感数据   | 社会安全号(SSN)、车辆 VIN 和 VRM、手机 IMEI 和附近 GPS 坐标                       |

PII 识别模型通过有效检测和分类文档、电子邮件、用户生成内容等中的敏感信息,确保数据隐私和合规性。借助我们最先进的 PII 检测技术,让您的数据处理更安全、更可靠。

如何进行推理:

from transformers import pipeline
gen = pipeline(\"token-classification\", \"h2oai/deberta_finetuned_pii\", device=-1)

text = \"My name is John and I live in California.\"
output = gen(text, aggregation_strategy=\"first\")

Emmanuel1017/Guardly_PII_Masking

作者 Emmanuel1017

token-classification
↓ 1 ♥ 0

创建时间: 2025-05-25 08:00:26+00:00

更新时间: 2025-05-25 10:38:42+00:00

在 Hugging Face 上查看

文件 (24)

.DS_Store
.gitattributes
README.md
added_tokens.json
config.json
gitattributes
merges.txt
model.safetensors
onnx/README.md
onnx/config.json
onnx/merges.txt
onnx/model_quantized.onnx ONNX
onnx/special_tokens_map.json
onnx/tokenizer.json
onnx/tokenizer_config.json
onnx/vocab.json
rng_state.pth
scheduler.pt
special_tokens_map.json
tokenizer.json
tokenizer_config.json
trainer_state.json
training_args.bin
vocab.json