返回模型
说明文档
官方 GitHub 仓库: meikiocr
本模型是 meikiocr 管道的核心组件。如需完整的实现、命令行脚本和文档,请参阅官方 GitHub 仓库。
meiki.text.detect.v0.1
meiki.text.detect.v0.1 是 meiki.text.detect.v0 的更新版本(见下文):
- meiki.text.detect.v0.1 是一个全新的最先进的开源权重文本检测模型,专为视频游戏设计,性能优于 PaddleOCR 等文本检测模型
- 虽然它仍然基于 D-FINE 检测器,但使用 mobilenet v4 small 作为骨干网络,而非 hgnet v2
- v0.1 有 2 个变体:v0.1.960x544 和 v0.1.320x192。与 v0 不同,两个 v0.1 变体共享相同的架构,但在不同分辨率下训练
- v0.1 模型更加专注于视频游戏文本检测,限制为 64 个检测框,提高了该用例的效率(使其不太适合直接用于漫画文本检测)
- v0.1.960x544 和 v0.1.320x192 分别比 small.v0 和 tiny.v0 具有更好的准确性和更低的延迟
| cpu | gpu |
|---|---|
![]() |
![]() |
meiki.text.detect.v0
专注于低延迟的实验性文本检测模型。基于日本视频游戏和漫画训练。
模型版本:
- tiny:适用于只有少量文本行的图像(例如视觉小说)。CPU 延迟约 30ms,GPU 约 3ms。
- small:适用于有大量文本行的情况(例如漫画)。CPU 延迟约 70ms,GPU 约 7ms。
基于 https://github.com/Peterande/D-FINE 微调
示例
视觉小说
| small | tiny |
|---|---|
![]() |
![]() |
漫画
| small | tiny |
|---|---|
![]() |
![]() |
rtr46/meiki.text.detect.v0
作者 rtr46
image-to-text
tensorrt
↓ 102.5K
♥ 3
创建时间: 2025-10-21 15:15:40+00:00
更新时间: 2025-11-06 12:38:22+00:00
在 Hugging Face 上查看文件 (10)
.gitattributes
README.md
inference.small.py
inference.tiny.py
inference.v0.1.320x192.py
inference.v0.1.960x544.py
meiki.text.detect.small.v0.onnx
ONNX
meiki.text.detect.tiny.v0.onnx
ONNX
meiki.text.detect.v0.1.320x192.onnx
ONNX
meiki.text.detect.v0.1.960x544.onnx
ONNX





