返回模型
说明文档
官方GitHub仓库: meikiocr
该模型是 meikiocr 流程的核心组件。完整的实现、命令行脚本和文档请参阅官方GitHub仓库。
meiki.text.recognition.v0
pareto最优文本识别模型。基于日本电子游戏训练。
meiki.text.recognition通过将"文本识别"重新定义为"字符检测",实现了最先进的文本识别精度和延迟。该模型是基于 https://github.com/Peterande/D-FINE 目标检测器的微调版本,结合了mobilenetv4 CNN骨干网络。据我所知,对于日语文本识别,目前没有其他开源权重模型能在精度/延迟权衡方面做得更好。
预期用途和限制
- 该模型专门针对日本电子游戏进行训练,因此在此用例之外性能可能会有所不同
- 输入需要调整大小并填充至 960x32px
- 输出检测结果为字符 + 边界框 + 置信度。建议的后处理算法请查看 inference.py 脚本
- 最多可检测48个字符
- 仅支持水平文本
基准测试
| CPU | GPU |
|---|---|
![]() |
![]() |
如何使用
请参阅此演示推理脚本:https://huggingface.co/rtr46/meiki.txt.recognition.v0/blob/main/inference.py
示例

その一つの実情が、第一層の一画、空気には黴臭さと変に饐えた甘
{
\"text\":\"その一つの実情が、第一層の一画、空気には黴臭さと変に饐えた甘\",
\"chars\":[
{\"char\":\"そ\",\"bbox\":[2,0,33,32]},
{\"char\":\"の\",\"bbox\":[33,0,65,32]},
{\"char\":\"一\",\"bbox\":[65,0,96,32]},
{\"char\":\"つ\",\"bbox\":[97,0,128,32]},
{\"char\":\"の\",\"bbox\":[129,0,160,32]},
{\"char\":\"実\",\"bbox\":[161,0,193,32]},
{\"char\":\"情\",\"bbox\":[192,0,224,32]},
{\"char\":\"が\",\"bbox\":[225,0,256,32]},
{\"char\":\"、\",\"bbox\":[258,0,288,32]},
{\"char\":\"第\",\"bbox\":[288,0,319,32]},
{\"char\":\"一\",\"bbox\":[321,0,352,32]},
{\"char\":\"層\",\"bbox\":[352,0,384,32]},
{\"char\":\"の\",\"bbox\":[384,0,415,32]},
{\"char\":\"一\",\"bbox\":[416,0,448,32]},
{\"char\":\"画\",\"bbox\":[448,0,479,32]},
{\"char\":\"、\",\"bbox\":[481,0,512,32]},
{\"char\":\"空\",\"bbox\":[513,0,544,32]},
{\"char\":\"気\",\"bbox\":[544,0,575,32]},
{\"char\":\"に\",\"bbox\":[576,0,608,32]},
{\"char\":\"は\",\"bbox\":[609,0,640,32]},
{\"char\":\"黴\",\"bbox\":[640,0,672,32]},
{\"char\":\"臭\",\"bbox\":[672,0,704,32]},
{\"char\":\"さ\",\"bbox\":[705,0,737,32]},
{\"char\":\"と\",\"bbox\":[738,0,767,32]},
{\"char\":\"変\",\"bbox\":[769,0,800,32]},
{\"char\":\"に\",\"bbox\":[800,0,832,32]},
{\"char\":\"饐\",\"bbox\":[833,0,864,32]},
{\"char\":\"え\",\"bbox\":[864,0,895,32]},
{\"char\":\"た\",\"bbox\":[897,0,928,32]},
{\"char\":\"甘\",\"bbox\":[929,0,960,32]}
]
}
发布版本
- 21.02.2026: 我发布了新版本的检查点,应该能提高精度。如果您出于某种原因需要使用旧版本,请使用此版本:ddd06176a4da56fba082293dbe9898d4e5998af2
rtr46/meiki.txt.recognition.v0
作者 rtr46
image-to-text
tensorrt
↓ 110.5K
♥ 5
创建时间: 2025-11-03 10:31:54+00:00
更新时间: 2026-02-24 19:49:02+00:00
在 Hugging Face 上查看文件 (6)
.gitattributes
README.md
inference.py
meiki.text.rec.v0.960x32.onnx
ONNX
meiki.text.rec.v0.vertical.32x480.onnx
ONNX
requirements.txt

