返回模型
说明文档
这是一个经过微调的模型,旨在识别和分类非结构化文本数据中的个人身份信息(PII)。该强大模型能够准确识别广泛的 PII 类别,例如账户名称、信用卡号、电子邮件、电话号码和地址。该模型经过专门训练,可检测多种 PII 类型,包括但不限于:
| 类别 | 数据 |
|------------------------|----------------------------------------------------------------------------------------|
| 账户相关信息 | 账户名称、账号和交易金额 |
| 银行详细信息 | BIC、IBAN 以及比特币或以太坊地址 |
| 个人信息 | 全名、名字、中间名、姓氏、性别和出生日期 |
| 联系信息 | 电子邮件、电话号码和街道地址(包括门牌号、城市、县、州和邮政编码) |
| 工作相关数据 | 职位名称、工作领域、职位描述和工作类型 |
| 财务数据 | 信用卡号、发卡机构、CVV 和货币信息(代码、名称和符号) |
| 数字标识符 | IP 地址(IPv4 和 IPv6)、MAC 地址和用户代理 |
| 网络存在 | URL、用户名和密码 |
| 其他敏感数据 | 社会安全号(SSN)、车辆 VIN 和 VRM、手机 IMEI 和附近 GPS 坐标 |
PII 识别模型通过有效检测和分类文档、电子邮件、用户生成内容等中的敏感信息,确保数据隐私和合规性。借助我们最先进的 PII 检测技术,让您的数据处理更安全、更可靠。
如何进行推理:
from transformers import pipeline
gen = pipeline(\"token-classification\", \"h2oai/deberta_finetuned_pii\", device=-1)
text = \"My name is John and I live in California.\"
output = gen(text, aggregation_strategy=\"first\")
Emmanuel1017/Guardly_PII_Masking
作者 Emmanuel1017
token-classification
↓ 1
♥ 0
创建时间: 2025-05-25 08:00:26+00:00
更新时间: 2025-05-25 10:38:42+00:00
在 Hugging Face 上查看文件 (24)
.DS_Store
.gitattributes
README.md
added_tokens.json
config.json
gitattributes
merges.txt
model.safetensors
onnx/README.md
onnx/config.json
onnx/merges.txt
onnx/model_quantized.onnx
ONNX
onnx/special_tokens_map.json
onnx/tokenizer.json
onnx/tokenizer_config.json
onnx/vocab.json
rng_state.pth
scheduler.pt
special_tokens_map.json
tokenizer.json
tokenizer_config.json
trainer_state.json
training_args.bin
vocab.json