返回模型
说明文档
表格单元格分类
该模型用于将表格单元格图像分类为空或非空。它使用20世纪30年代芬兰人口普查和死亡记录表格中的表格单元格图像进行训练。
该模型以 densenet121 为基础模型进行训练,并已转换为 onnx 格式。
预期用途与局限性
该模型针对包含主要手写文本的特定类型表格中的单元格分类进行了训练。 尚未使用其他类型的表格单元格数据进行测试。
训练和验证数据
训练数据集包括:
- 空单元格图像:2943
- 非空单元格图像:5033
验证数据集包括:
- 空单元格图像:367
- 非空单元格图像:627
训练过程
用于模型训练的代码位于仓库的 train.py 文件中,该文件使用 augment.py 和 utils.py 文件中的函数。所需的库列在 requirements.txt 文件中。
该模型使用 CPU 进行训练,超参数如下:
- 图像大小:2560
- 学习率:0.0001
- 训练批次大小:32
- 训练轮数:15
- 耐心值:3 个训练轮
- 优化器:Adam
评估结果
使用验证数据集的评估结果如下:
| 验证损失 | 验证准确率 | 验证F1分数 |
|---|---|---|
| 0.0427 | 0.9899 | 0.9903 |
推理
可以使用 test.py 文件中的代码进行推理。
Kansallisarkisto/empty-tablecell-detection
作者 Kansallisarkisto
image-classification
↓ 0
♥ 0
创建时间: 2024-09-12 11:56:22+00:00
更新时间: 2024-09-17 08:28:48+00:00
在 Hugging Face 上查看文件 (8)
.gitattributes
README.md
augment.py
densenet_28022024.onnx
ONNX
requirements.txt
test.py
train.py
utils.py