说明文档

模型描述

这是一个基于 apple/mobilevitv2-1.0-imagenet1k-256 微调的模型，使用 Xenova/quickdraw-small 数据集进行素描图像识别训练。

如何使用？

from transformers import MobileViTImageProcessor, MobileViTV2ForImageClassification
from PIL import Image
import requests
import torch
import numpy as np  # 导入 NumPy

url = \"https://static.thenounproject.com/png/2024184-200.png\"
response = requests.get(url, stream=True)

# 转换为灰度图以确保单通道输入
image = Image.open(response.raw).convert('L')  # 转换为灰度图

processor = MobileViTImageProcessor.from_pretrained(\"laszlokiss27/doodle-dash2\")
model = MobileViTV2ForImageClassification.from_pretrained(\"laszlokiss27/doodle-dash2\")

# 将 PIL 图像转换为张量并添加通道维度
image_tensor = torch.unsqueeze(torch.tensor(np.array(image)), 0).float()
image_tensor = image_tensor.unsqueeze(0)  # 添加批次维度

# 检查处理器是否需要特定形式的输入
inputs = processor(images=image_tensor, return_tensors=\"pt\")

outputs = model(**inputs)
logits = outputs.logits

# 获取预测结果
predicted_class_idx = logits.argmax(-1).item()
predicted_class = model.config.id2label[predicted_class_idx]
print(\"Predicted class:\", predicted_class)

laszlokiss27/doodle-dash2

作者 laszlokiss27

image-classification transformers

↓ 5 ♥ 0

创建时间: 2024-04-21 10:42:08+00:00

更新时间: 2024-04-23 13:41:10+00:00

在 Hugging Face 上查看

文件 (11)

.gitattributes

README.md

all_results.json

config.json

model.safetensors

onnx/model.onnx ONNX

preprocessor_config.json

test_results.json

train_results.json

trainer_state.json

training_args.bin