ONNX 模型库

说明文档

license: apache-2.0

Vision Transformer (ViT) 面部表情识别模型卡片

模型概述

模型名称： trpakov/vit-face-expression
任务： 面部表情/情绪识别
数据集： FER2013
模型架构： Vision Transformer (ViT)
微调基础模型： vit-base-patch16-224-in21k

模型描述

vit-face-expression 模型是一个针对面部情绪识别任务微调的 Vision Transformer。

它基于 FER2013 数据集进行训练，该数据集包含分为七种不同情绪的面部图像：

愤怒 (Angry)
厌恶 (Disgust)
恐惧 (Fear)
快乐 (Happy)
悲伤 (Sad)
惊讶 (Surprise)
中性 (Neutral)

数据预处理

输入图像在送入模型之前会进行预处理。预处理步骤包括：

调整大小： 图像调整到指定的输入尺寸。
归一化： 像素值归一化到特定范围。
数据增强： 应用随机变换（如旋转、翻转和缩放）来增强训练数据集。

评估指标

验证集准确率： 0.7113
测试集准确率： 0.7116

局限性

数据偏差： 模型的性能可能受训练数据中存在的偏差影响。
泛化能力： 模型对未见数据的泛化能力取决于训练数据集的多样性。

trpakov/vit-face-expression

作者 trpakov

image-classification transformers

↓ 1.8M ♥ 86

创建时间: 2022-11-09 12:50:30+00:00

更新时间: 2025-02-20 13:24:56+00:00

在 Hugging Face 上查看

文件 (9)

.gitattributes

README.md

config.json

model.safetensors

onnx/config.json

onnx/model.onnx ONNX

onnx/preprocessor_config.json

preprocessor_config.json

pytorch_model.bin