ONNX 模型库
返回模型

说明文档

官方 GitHub 仓库: meikiocr

本模型是 meikiocr 管道的核心组件。如需完整的实现、命令行脚本和文档,请参阅官方 GitHub 仓库。


meiki.text.detect.v0.1

meiki.text.detect.v0.1 是 meiki.text.detect.v0 的更新版本(见下文):

  • meiki.text.detect.v0.1 是一个全新的最先进的开源权重文本检测模型,专为视频游戏设计,性能优于 PaddleOCR 等文本检测模型
  • 虽然它仍然基于 D-FINE 检测器,但使用 mobilenet v4 small 作为骨干网络,而非 hgnet v2
  • v0.1 有 2 个变体:v0.1.960x544 和 v0.1.320x192。与 v0 不同,两个 v0.1 变体共享相同的架构,但在不同分辨率下训练
  • v0.1 模型更加专注于视频游戏文本检测,限制为 64 个检测框,提高了该用例的效率(使其不太适合直接用于漫画文本检测)
  • v0.1.960x544 和 v0.1.320x192 分别比 small.v0 和 tiny.v0 具有更好的准确性和更低的延迟
cpu gpu
accuracy_vs_cpu_latency accuracy_vs_gpu_latency

meiki.text.detect.v0

专注于低延迟的实验性文本检测模型。基于日本视频游戏和漫画训练。

模型版本:

  • tiny:适用于只有少量文本行的图像(例如视觉小说)。CPU 延迟约 30ms,GPU 约 3ms。
  • small:适用于有大量文本行的情况(例如漫画)。CPU 延迟约 70ms,GPU 约 7ms。

基于 https://github.com/Peterande/D-FINE 微调

示例

视觉小说

small tiny
vn.output.small vn.output.tiny

漫画

small tiny
manga.output.small manga.output.tiny

rtr46/meiki.text.detect.v0

作者 rtr46

image-to-text tensorrt
↓ 102.5K ♥ 3

创建时间: 2025-10-21 15:15:40+00:00

更新时间: 2025-11-06 12:38:22+00:00

在 Hugging Face 上查看

文件 (10)

.gitattributes
README.md
inference.small.py
inference.tiny.py
inference.v0.1.320x192.py
inference.v0.1.960x544.py
meiki.text.detect.small.v0.onnx ONNX
meiki.text.detect.tiny.v0.onnx ONNX
meiki.text.detect.v0.1.320x192.onnx ONNX
meiki.text.detect.v0.1.960x544.onnx ONNX