说明文档

PaddleOCR ONNX 模型

概述

本仓库提供 PaddleOCR 模型的 ONNX 格式实现，为多语言文本检测和识别提供全面的 光学字符识别 能力。这些模型从原始 PaddleOCR 框架导出，并针对各种部署场景进行了推理优化。

仓库包含两种主要类型的模型：文本检测模型用于识别图像中的文本区域，文本识别模型用于将检测到的文本区域转换为实际文本内容。检测模型采用基于分割的先进方法，结合包括轮廓检测、多边形近似和分数阈值等后处理技术，以高精度准确定位文本区域。

在文本识别方面，模型支持多种语言，包括中文、英文、日文、韩文、阿拉伯文、西里尔文、天城文和其他多种文字系统。每个识别模型都配有针对特定语言或文字系列定制的字符字典（dict.txt）。识别流程处理文本归一化、特征提取和序列解码，以生成带有置信度分数的准确文本转录。

这些模型以实际部署为设计目标，提供针对不同用例优化的各种版本——从轻量级移动应用到高精度服务器部署。主要特性包括支持旋转文本检测、重复字符去除，以及可配置的置信度阈值，以便在实际应用中平衡精确率和召回率。

使用方法

可以通过 dghs-imgutils 库轻松使用这些模型：

# 安装
pip install dghs-imgutils

# 基本 OCR 用法
from imgutils.ocr import ocr, list_det_models, list_rec_models

# 列出可用模型
print("检测模型:", list_det_models())
print("识别模型:", list_rec_models())

# 对图像执行 OCR
results = ocr('your_image.jpg')
for bbox, text, confidence in results:
    print(f"文本: {text}, 置信度: {confidence:.4f}, 边界框: {bbox}")

# 自定义模型选择
results = ocr('your_image.jpg', 
              detect_model='ch_PP-OCRv4_det',
              recognize_model='japan_PP-OCRv3_rec')

# 仅文本检测
from imgutils.ocr import detect_text_with_ocr

# 检测文本区域（不进行识别）
detections = detect_text_with_ocr('your_image.jpg')
for bbox, label, confidence in detections:
    print(f"边界框: {bbox}, 置信度: {confidence:.4f}")

可用模型

文本检测模型

ch_PP-OCRv2_det - 中文文本检测 v2
ch_PP-OCRv3_det - 中文文本检测 v3
ch_PP-OCRv4_det - 中文文本检测 v4
ch_PP-OCRv4_server_det - 服务器优化中文检测 v4
ch_ppocr_mobile_slim_v2.0_det - 轻量级移动端检测
ch_ppocr_mobile_v2.0_det - 移动端优化检测
ch_ppocr_server_v2.0_det - 服务器优化检测
en_PP-OCRv3_det - 英文文本检测

文本识别模型

arabic_PP-OCRv3_rec - 阿拉伯文文本识别
ch_PP-OCRv2_rec - 中文文本识别 v2
ch_PP-OCRv3_rec - 中文文本识别 v3
ch_PP-OCRv4_rec - 中文文本识别 v4
ch_PP-OCRv4_server_rec - 服务器优化中文识别 v4
ch_ppocr_mobile_v2.0_rec - 移动端优化中文识别
ch_ppocr_server_v2.0_rec - 服务器优化中文识别
chinese_cht_PP-OCRv3_rec - 繁体中文识别
cyrillic_PP-OCRv3_rec - 西里尔文识别
devanagari_PP-OCRv3_rec - 天城文识别
en_PP-OCRv3_rec - 英文文本识别 v3
en_PP-OCRv4_rec - 英文文本识别 v4
en_number_mobile_v2.0_rec - 移动端优化数字识别
japan_PP-OCRv3_rec - 日文文本识别
ka_PP-OCRv3_rec - 卡纳达文识别
korean_PP-OCRv3_rec - 韩文文本识别
latin_PP-OCRv3_rec - 拉丁文识别
ta_PP-OCRv3_rec - 泰米尔文识别
te_PP-OCRv3_rec - 泰卢固文识别

模型配置

OCR 流程支持多个可配置参数：

heat_threshold: 文本检测的热图阈值（默认值：0.3）
box_threshold: 边界框置信度阈值（默认值：0.7）
max_candidates: 最大文本候选数量（默认值：1000）
unclip_ratio: 检测框的扩展比例（默认值：2.0）
rotation_threshold: 旋转检测的纵横比阈值（默认值：1.5）
is_remove_duplicate: 是否去除重复字符（默认值：False）

性能说明

默认检测模型 ch_PP-OCRv4_det 在准确率和速度之间提供了出色的平衡
默认识别模型 ch_PP-OCRv4_rec 支持中英文，具有很高的准确率
对于特定语言，选择相应的识别模型可获得最佳效果
服务器版本通常提供更高的准确率，但需要更多的计算资源
移动版本针对速度和资源效率进行了优化

原始内容

PaddleOCR 的 ONNX 版本。

引用

@misc{paddleocr_onnx,
  title        = {{PaddleOCR ONNX Models}},
  author       = {PaddlePaddle and Repository Contributors},
  howpublished = {\url{https://huggingface.co/deepghs/paddleocr}},
  year         = {2023},
  note         = {ONNX-format implementations of PaddleOCR models for multilingual text detection and recognition},
  abstract     = {This repository provides ONNX-format implementations of PaddleOCR models, offering comprehensive optical character recognition capabilities for multilingual text detection and recognition. The models are exported from the original PaddleOCR framework and optimized for efficient inference across various deployment scenarios. The repository contains text detection models that identify text regions in images and text recognition models that convert detected text regions into actual text content, supporting multiple languages including Chinese, English, Japanese, Korean, Arabic, Cyrillic, Devanagari, and several other scripts.},
  keywords     = {OCR, text-detection, text-recognition, multilingual, ONNX}
}

deepghs/paddleocr

作者 deepghs

image-to-text dghs-imgutils

↓ 0 ♥ 15

创建时间: 2023-10-09 08:43:12+00:00

更新时间: 2025-11-17 12:43:39+00:00

在 Hugging Face 上查看

文件 (48)

.gitattributes

README.md

det/ch_PP-OCRv2_det/model.onnx ONNX

det/ch_PP-OCRv3_det/model.onnx ONNX

det/ch_PP-OCRv4_det/model.onnx ONNX

det/ch_PP-OCRv4_server_det/model.onnx ONNX

det/ch_ppocr_mobile_slim_v2.0_det/model.onnx ONNX

det/ch_ppocr_mobile_v2.0_det/model.onnx ONNX

det/ch_ppocr_server_v2.0_det/model.onnx ONNX

det/en_PP-OCRv3_det/model.onnx ONNX

rec/arabic_PP-OCRv3_rec/dict.txt

rec/arabic_PP-OCRv3_rec/model.onnx ONNX

rec/ch_PP-OCRv2_rec/dict.txt

rec/ch_PP-OCRv2_rec/model.onnx ONNX

rec/ch_PP-OCRv3_rec/dict.txt

rec/ch_PP-OCRv3_rec/model.onnx ONNX

rec/ch_PP-OCRv4_rec/dict.txt

rec/ch_PP-OCRv4_rec/model.onnx ONNX

rec/ch_PP-OCRv4_server_rec/dict.txt

rec/ch_PP-OCRv4_server_rec/model.onnx ONNX

rec/ch_ppocr_mobile_v2.0_rec/dict.txt

rec/ch_ppocr_mobile_v2.0_rec/model.onnx ONNX

rec/ch_ppocr_server_v2.0_rec/dict.txt

rec/ch_ppocr_server_v2.0_rec/model.onnx ONNX

rec/chinese_cht_PP-OCRv3_rec/dict.txt

rec/chinese_cht_PP-OCRv3_rec/model.onnx ONNX

rec/cyrillic_PP-OCRv3_rec/dict.txt

rec/cyrillic_PP-OCRv3_rec/model.onnx ONNX

rec/devanagari_PP-OCRv3_rec/dict.txt

rec/devanagari_PP-OCRv3_rec/model.onnx ONNX

rec/en_PP-OCRv3_rec/dict.txt

rec/en_PP-OCRv3_rec/model.onnx ONNX

rec/en_PP-OCRv4_rec/dict.txt

rec/en_PP-OCRv4_rec/model.onnx ONNX

rec/en_number_mobile_v2.0_rec/dict.txt

rec/en_number_mobile_v2.0_rec/model.onnx ONNX

rec/japan_PP-OCRv3_rec/dict.txt

rec/japan_PP-OCRv3_rec/model.onnx ONNX

rec/ka_PP-OCRv3_rec/dict.txt

rec/ka_PP-OCRv3_rec/model.onnx ONNX

rec/korean_PP-OCRv3_rec/dict.txt

rec/korean_PP-OCRv3_rec/model.onnx ONNX

rec/latin_PP-OCRv3_rec/dict.txt

rec/latin_PP-OCRv3_rec/model.onnx ONNX

rec/ta_PP-OCRv3_rec/dict.txt

rec/ta_PP-OCRv3_rec/model.onnx ONNX

rec/te_PP-OCRv3_rec/dict.txt

rec/te_PP-OCRv3_rec/model.onnx ONNX