返回模型
说明文档
license: apache-2.0
Vision Transformer (ViT) 面部表情识别模型卡片
模型概述
-
任务: 面部表情/情绪识别
-
数据集: FER2013
-
模型架构: Vision Transformer (ViT)
-
微调基础模型: vit-base-patch16-224-in21k
模型描述
vit-face-expression 模型是一个针对面部情绪识别任务微调的 Vision Transformer。
它基于 FER2013 数据集进行训练,该数据集包含分为七种不同情绪的面部图像:
- 愤怒 (Angry)
- 厌恶 (Disgust)
- 恐惧 (Fear)
- 快乐 (Happy)
- 悲伤 (Sad)
- 惊讶 (Surprise)
- 中性 (Neutral)
数据预处理
输入图像在送入模型之前会进行预处理。预处理步骤包括:
- 调整大小: 图像调整到指定的输入尺寸。
- 归一化: 像素值归一化到特定范围。
- 数据增强: 应用随机变换(如旋转、翻转和缩放)来增强训练数据集。
评估指标
- 验证集准确率: 0.7113
- 测试集准确率: 0.7116
局限性
- 数据偏差: 模型的性能可能受训练数据中存在的偏差影响。
- 泛化能力: 模型对未见数据的泛化能力取决于训练数据集的多样性。
trpakov/vit-face-expression
作者 trpakov
image-classification
transformers
↓ 1.8M
♥ 86
创建时间: 2022-11-09 12:50:30+00:00
更新时间: 2025-02-20 13:24:56+00:00
在 Hugging Face 上查看文件 (9)
.gitattributes
README.md
config.json
model.safetensors
onnx/config.json
onnx/model.onnx
ONNX
onnx/preprocessor_config.json
preprocessor_config.json
pytorch_model.bin