返回模型
说明文档
<!-- 此模型卡已根据 Trainer 可获取的信息自动生成。您可能需要校对并完善它,然后删除此注释。 -->
mt5-small-ai4privacy
此模型是基于 google/mt5-small 在 ai4privacy/pii-masking-65k 数据集上微调的版本。
模型描述
更多信息待补充
预期用途与限制
更多信息待补充
训练与评估数据
更多信息待补充
训练过程
训练超参数
训练过程中使用了以下超参数:
- learning_rate: 5e-05
- train_batch_size: 64
- eval_batch_size: 8
- seed: 42
- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
- lr_scheduler_type: linear
- lr_scheduler_warmup_ratio: 0.2
- num_epochs: 10
训练结果
框架版本
- Transformers 4.32.1
- Pytorch 2.0.1
- Datasets 2.14.4
- Tokenizers 0.13.3
Isotonic/mt5-small-ai4privacy
作者 Isotonic
text-generation
transformers
↓ 1
♥ 1
创建时间: 2023-08-31 13:26:29+00:00
更新时间: 2023-09-14 13:39:13+00:00
在 Hugging Face 上查看文件 (21)
.gitattributes
README.md
config.json
generation_config.json
model.safetensors
onnx/config.json
onnx/decoder_model.onnx
ONNX
onnx/decoder_model_merged.onnx
ONNX
onnx/decoder_with_past_model.onnx
ONNX
onnx/encoder_model.onnx
ONNX
onnx/generation_config.json
onnx/special_tokens_map.json
onnx/spiece.model
onnx/tokenizer.json
onnx/tokenizer_config.json
pytorch_model.bin
special_tokens_map.json
spiece.model
tokenizer.json
tokenizer_config.json
training_args.bin