ONNX 模型库
返回模型

说明文档

表格单元格分类

该模型用于将表格单元格图像分类为空或非空。它使用20世纪30年代芬兰人口普查和死亡记录表格中的表格单元格图像进行训练。

该模型以 densenet121 为基础模型进行训练,并已转换为 onnx 格式。

预期用途与局限性

该模型针对包含主要手写文本的特定类型表格中的单元格分类进行了训练。 尚未使用其他类型的表格单元格数据进行测试。

训练和验证数据

训练数据集包括:

  • 空单元格图像:2943
  • 非空单元格图像:5033

验证数据集包括:

  • 空单元格图像:367
  • 非空单元格图像:627

训练过程

用于模型训练的代码位于仓库的 train.py 文件中,该文件使用 augment.pyutils.py 文件中的函数。所需的库列在 requirements.txt 文件中。

该模型使用 CPU 进行训练,超参数如下:

  • 图像大小:2560
  • 学习率:0.0001
  • 训练批次大小:32
  • 训练轮数:15
  • 耐心值:3 个训练轮
  • 优化器:Adam

评估结果

使用验证数据集的评估结果如下:

验证损失 验证准确率 验证F1分数
0.0427 0.9899 0.9903

推理

可以使用 test.py 文件中的代码进行推理。

Kansallisarkisto/empty-tablecell-detection

作者 Kansallisarkisto

image-classification
↓ 0 ♥ 0

创建时间: 2024-09-12 11:56:22+00:00

更新时间: 2024-09-17 08:28:48+00:00

在 Hugging Face 上查看

文件 (8)

.gitattributes
README.md
augment.py
densenet_28022024.onnx ONNX
requirements.txt
test.py
train.py
utils.py