说明文档

这是一个经过微调的模型，旨在识别和分类非结构化文本数据中的个人身份信息（PII）。该强大模型能够准确识别广泛的 PII 类别，例如账户名称、信用卡号、电子邮件、电话号码和地址。该模型经过专门训练，可检测多种 PII 类型，包括但不限于：

| 类别               | 数据                                                                                   |
|------------------------|----------------------------------------------------------------------------------------|
| 账户相关信息 | 账户名称、账号和交易金额                             |
| 银行详细信息        | BIC、IBAN 以及比特币或以太坊地址                                           |
| 个人信息   | 全名、名字、中间名、姓氏、性别和出生日期               |
| 联系信息    | 电子邮件、电话号码和街道地址（包括门牌号、城市、县、州和邮政编码） |
| 工作相关数据       | 职位名称、工作领域、职位描述和工作类型                                      |
| 财务数据         | 信用卡号、发卡机构、CVV 和货币信息（代码、名称和符号）     |
| 数字标识符    | IP 地址（IPv4 和 IPv6）、MAC 地址和用户代理                           |
| 网络存在        | URL、用户名和密码                                                          |
| 其他敏感数据   | 社会安全号（SSN）、车辆 VIN 和 VRM、手机 IMEI 和附近 GPS 坐标                       |

PII 识别模型通过有效检测和分类文档、电子邮件、用户生成内容等中的敏感信息，确保数据隐私和合规性。借助我们最先进的 PII 检测技术，让您的数据处理更安全、更可靠。

如何进行推理：

from transformers import pipeline
gen = pipeline(\"token-classification\", \"h2oai/deberta_finetuned_pii\", device=-1)

text = \"My name is John and I live in California.\"
output = gen(text, aggregation_strategy=\"first\")

Emmanuel1017/Guardly_PII_Masking

作者 Emmanuel1017

token-classification

↓ 1 ♥ 0

创建时间: 2025-05-25 08:00:26+00:00

更新时间: 2025-05-25 10:38:42+00:00

在 Hugging Face 上查看

文件 (24)

.DS_Store

.gitattributes

README.md

added_tokens.json

config.json

gitattributes

merges.txt

model.safetensors

onnx/README.md

onnx/config.json

onnx/merges.txt

onnx/model_quantized.onnx ONNX

onnx/special_tokens_map.json

onnx/tokenizer.json

onnx/tokenizer_config.json

onnx/vocab.json

rng_state.pth

scheduler.pt

special_tokens_map.json

tokenizer.json

tokenizer_config.json

trainer_state.json

training_args.bin

vocab.json