ONNX 模型库
返回模型

说明文档

官方GitHub仓库: meikiocr

该模型是 meikiocr 流程的核心组件。完整的实现、命令行脚本和文档请参阅官方GitHub仓库。


meiki.text.recognition.v0

pareto最优文本识别模型。基于日本电子游戏训练。

meiki.text.recognition通过将"文本识别"重新定义为"字符检测",实现了最先进的文本识别精度和延迟。该模型是基于 https://github.com/Peterande/D-FINE 目标检测器的微调版本,结合了mobilenetv4 CNN骨干网络。据我所知,对于日语文本识别,目前没有其他开源权重模型能在精度/延迟权衡方面做得更好。

预期用途和限制

  • 该模型专门针对日本电子游戏进行训练,因此在此用例之外性能可能会有所不同
  • 输入需要调整大小并填充至 960x32px
  • 输出检测结果为字符 + 边界框 + 置信度。建议的后处理算法请查看 inference.py 脚本
  • 最多可检测48个字符
  • 仅支持水平文本

基准测试

CPU GPU
accuracy_vs_cpu_latency accuracy_vs_gpu_latency

如何使用

请参阅此演示推理脚本:https://huggingface.co/rtr46/meiki.txt.recognition.v0/blob/main/inference.py

示例

input

その一つの実情が、第一層の一画、空気には黴臭さと変に饐えた甘
{
	\"text\":\"その一つの実情が、第一層の一画、空気には黴臭さと変に饐えた甘\",
	\"chars\":[
		{\"char\":\"そ\",\"bbox\":[2,0,33,32]},
		{\"char\":\"の\",\"bbox\":[33,0,65,32]},
		{\"char\":\"一\",\"bbox\":[65,0,96,32]},
		{\"char\":\"つ\",\"bbox\":[97,0,128,32]},
		{\"char\":\"の\",\"bbox\":[129,0,160,32]},
		{\"char\":\"実\",\"bbox\":[161,0,193,32]},
		{\"char\":\"情\",\"bbox\":[192,0,224,32]},
		{\"char\":\"が\",\"bbox\":[225,0,256,32]},
		{\"char\":\"、\",\"bbox\":[258,0,288,32]},
		{\"char\":\"第\",\"bbox\":[288,0,319,32]},
		{\"char\":\"一\",\"bbox\":[321,0,352,32]},
		{\"char\":\"層\",\"bbox\":[352,0,384,32]},
		{\"char\":\"の\",\"bbox\":[384,0,415,32]},
		{\"char\":\"一\",\"bbox\":[416,0,448,32]},
		{\"char\":\"画\",\"bbox\":[448,0,479,32]},
		{\"char\":\"、\",\"bbox\":[481,0,512,32]},
		{\"char\":\"空\",\"bbox\":[513,0,544,32]},
		{\"char\":\"気\",\"bbox\":[544,0,575,32]},
		{\"char\":\"に\",\"bbox\":[576,0,608,32]},
		{\"char\":\"は\",\"bbox\":[609,0,640,32]},
		{\"char\":\"黴\",\"bbox\":[640,0,672,32]},
		{\"char\":\"臭\",\"bbox\":[672,0,704,32]},
		{\"char\":\"さ\",\"bbox\":[705,0,737,32]},
		{\"char\":\"と\",\"bbox\":[738,0,767,32]},
		{\"char\":\"変\",\"bbox\":[769,0,800,32]},
		{\"char\":\"に\",\"bbox\":[800,0,832,32]},
		{\"char\":\"饐\",\"bbox\":[833,0,864,32]},
		{\"char\":\"え\",\"bbox\":[864,0,895,32]},
		{\"char\":\"た\",\"bbox\":[897,0,928,32]},
		{\"char\":\"甘\",\"bbox\":[929,0,960,32]}
	]
}

发布版本

  • 21.02.2026: 我发布了新版本的检查点,应该能提高精度。如果您出于某种原因需要使用旧版本,请使用此版本:ddd06176a4da56fba082293dbe9898d4e5998af2

rtr46/meiki.txt.recognition.v0

作者 rtr46

image-to-text tensorrt
↓ 110.5K ♥ 5

创建时间: 2025-11-03 10:31:54+00:00

更新时间: 2026-02-24 19:49:02+00:00

在 Hugging Face 上查看

文件 (6)

.gitattributes
README.md
inference.py
meiki.text.rec.v0.960x32.onnx ONNX
meiki.text.rec.v0.vertical.32x480.onnx ONNX
requirements.txt