ONNX 模型库
返回模型

说明文档


license: apache-2.0

Vision Transformer (ViT) 面部表情识别模型卡片

模型概述

模型描述

vit-face-expression 模型是一个针对面部情绪识别任务微调的 Vision Transformer。

它基于 FER2013 数据集进行训练,该数据集包含分为七种不同情绪的面部图像:

  • 愤怒 (Angry)
  • 厌恶 (Disgust)
  • 恐惧 (Fear)
  • 快乐 (Happy)
  • 悲伤 (Sad)
  • 惊讶 (Surprise)
  • 中性 (Neutral)

数据预处理

输入图像在送入模型之前会进行预处理。预处理步骤包括:

  • 调整大小: 图像调整到指定的输入尺寸。
  • 归一化: 像素值归一化到特定范围。
  • 数据增强: 应用随机变换(如旋转、翻转和缩放)来增强训练数据集。

评估指标

  • 验证集准确率: 0.7113
  • 测试集准确率: 0.7116

局限性

  • 数据偏差: 模型的性能可能受训练数据中存在的偏差影响。
  • 泛化能力: 模型对未见数据的泛化能力取决于训练数据集的多样性。

trpakov/vit-face-expression

作者 trpakov

image-classification transformers
↓ 1.8M ♥ 86

创建时间: 2022-11-09 12:50:30+00:00

更新时间: 2025-02-20 13:24:56+00:00

在 Hugging Face 上查看

文件 (9)

.gitattributes
README.md
config.json
model.safetensors
onnx/config.json
onnx/model.onnx ONNX
onnx/preprocessor_config.json
preprocessor_config.json
pytorch_model.bin