OCR 模型

This commit is contained in:
Takaranoao
2025-07-26 22:34:10 -04:00
parent 79f90345bb
commit cfa273bbd3
19 changed files with 38462 additions and 0 deletions

View File

@@ -0,0 +1,53 @@
Global:
model_name: PP-OCRv4_mobile_det
Hpi:
backend_configs:
paddle_infer:
trt_dynamic_shapes: &id001
x:
- - 1
- 3
- 32
- 32
- - 1
- 3
- 736
- 736
- - 1
- 3
- 4000
- 4000
tensorrt:
dynamic_shapes: *id001
PreProcess:
transform_ops:
- DecodeImage:
channel_first: false
img_mode: BGR
- DetLabelEncode: null
- DetResizeForTest:
resize_long: 960
- NormalizeImage:
mean:
- 0.485
- 0.456
- 0.406
order: hwc
scale: 1./255.
std:
- 0.229
- 0.224
- 0.225
- ToCHWImage: null
- KeepKeys:
keep_keys:
- image
- shape
- polys
- ignore_tags
PostProcess:
name: DBPostProcess
thresh: 0.3
box_thresh: 0.6
max_candidates: 1000
unclip_ratio: 1.5

View File

@@ -0,0 +1,53 @@
Global:
model_name: PP-OCRv5_mobile_det
Hpi:
backend_configs:
paddle_infer:
trt_dynamic_shapes: &id001
x:
- - 1
- 3
- 32
- 32
- - 1
- 3
- 736
- 736
- - 1
- 3
- 4000
- 4000
tensorrt:
dynamic_shapes: *id001
PreProcess:
transform_ops:
- DecodeImage:
channel_first: false
img_mode: BGR
- DetLabelEncode: null
- DetResizeForTest:
resize_long: 960
- NormalizeImage:
mean:
- 0.485
- 0.456
- 0.406
order: hwc
scale: 1./255.
std:
- 0.229
- 0.224
- 0.225
- ToCHWImage: null
- KeepKeys:
keep_keys:
- image
- shape
- polys
- ignore_tags
PostProcess:
name: DBPostProcess
thresh: 0.3
box_thresh: 0.6
max_candidates: 1000
unclip_ratio: 1.5

View File

@@ -0,0 +1,9 @@
此处包含 PaddleOCR 的模型
模型来源自 PaddleOCR 的推理模型 并经过 Paddle2ONNX 转换
https://github.com/PaddlePaddle/Paddle2ONNX
转换完成后只需要保留 inference.yml 和 slim.onnx
本目录下 paddle2onnx.sh 是转换所用的脚本

View File

@@ -0,0 +1,138 @@
Global:
model_name: en_PP-OCRv4_mobile_rec
Hpi:
backend_configs:
paddle_infer:
trt_dynamic_shapes: &id001
x:
- - 1
- 3
- 48
- 160
- - 1
- 3
- 48
- 320
- - 8
- 3
- 48
- 3200
tensorrt:
dynamic_shapes: *id001
PreProcess:
transform_ops:
- DecodeImage:
channel_first: false
img_mode: BGR
- MultiLabelEncode:
gtc_encode: NRTRLabelEncode
- RecResizeImg:
image_shape:
- 3
- 48
- 320
- KeepKeys:
keep_keys:
- image
- label_ctc
- label_gtc
- length
- valid_ratio
PostProcess:
name: CTCLabelDecode
character_dict:
- '0'
- '1'
- '2'
- '3'
- '4'
- '5'
- '6'
- '7'
- '8'
- '9'
- ':'
- ;
- <
- '='
- '>'
- '?'
- '@'
- A
- B
- C
- D
- E
- F
- G
- H
- I
- J
- K
- L
- M
- N
- O
- P
- Q
- R
- S
- T
- U
- V
- W
- X
- Y
- Z
- '['
- \
- ']'
- ^
- _
- '`'
- a
- b
- c
- d
- e
- f
- g
- h
- i
- j
- k
- l
- m
- n
- o
- p
- q
- r
- s
- t
- u
- v
- w
- x
- y
- z
- '{'
- '|'
- '}'
- '~'
- '!'
- '"'
- '#'
- $
- '%'
- '&'
- ''''
- (
- )
- '*'
- +
- ','
- '-'
- .
- /
- ' '

View File

@@ -0,0 +1,560 @@
Global:
model_name: eslav_PP-OCRv5_mobile_rec
Hpi:
backend_configs:
paddle_infer:
trt_dynamic_shapes: &id001
x:
- - 1
- 3
- 48
- 160
- - 1
- 3
- 48
- 320
- - 8
- 3
- 48
- 3200
tensorrt:
dynamic_shapes: *id001
PreProcess:
transform_ops:
- DecodeImage:
channel_first: false
img_mode: BGR
- MultiLabelEncode:
gtc_encode: NRTRLabelEncode
- RecResizeImg:
image_shape:
- 3
- 48
- 320
- KeepKeys:
keep_keys:
- image
- label_ctc
- label_gtc
- length
- valid_ratio
PostProcess:
name: CTCLabelDecode
character_dict:
- '!'
- '"'
- '#'
- $
- '%'
- '&'
- ''''
- (
- )
- '*'
- +
- ','
- '-'
- .
- /
- '0'
- '1'
- '2'
- '3'
- '4'
- '5'
- '6'
- '7'
- '8'
- '9'
- ':'
- ;
- <
- '='
- '>'
- '?'
- A
- B
- C
- D
- E
- F
- G
- H
- I
- J
- K
- L
- M
- N
- O
- P
- Q
- R
- S
- T
- U
- V
- W
- X
- Y
- Z
- '['
- ']'
- _
- '`'
- a
- b
- c
- d
- e
- f
- g
- h
- i
- j
- k
- l
- m
- n
- o
- p
- q
- r
- s
- t
- u
- v
- w
- x
- y
- z
- ©
-
- '{'
- '}'
- \
- '|'
- '@'
- ^
- '~'
- ÷
-
-
-
- ·
- ±
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
- ®
-
- Ω
-
-
-
-
-
-
-
- ¢
-
- £
- ¥
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
- 𝑢
-
-
-
- 𝜓
-
-
- ƒ
-
-
-
-
-
-
-
- À
- Á
- Â
- Ã
- Ä
- Å
- Æ
- Ç
- È
- É
- Ê
- Ë
- Ì
- Í
- Î
- Ï
- Ð
- Ñ
- Ò
- Ó
- Ô
- Õ
- Ö
- Ø
- Ù
- Ú
- Û
- Ü
- Ý
- Þ
- à
- á
- â
- ã
- ä
- å
- æ
- ç
- è
- é
- ê
- ë
- ì
- í
- î
- ï
- ð
- ñ
- ò
- ó
- ô
- õ
- ö
- ø
- ù
- ú
- û
- ü
- ý
- þ
- ÿ
- ¡
- ¤
- ¦
- §
- ¨
- ª
- «
- ¬
- ¯
- °
- ²
- ³
- ´
- µ
-
- ¸
- ¹
- º
- »
- ¼
- ½
- ¾
- ¿
- ×
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
- Α
- α
- Β
- β
- Γ
- γ
- Δ
- δ
- Ε
- ε
- Ζ
- ζ
- Η
- η
- Θ
- θ
- Ι
- ι
- Κ
- κ
- Λ
- λ
- Μ
- μ
- Ν
- ν
- Ξ
- ξ
- Ο
- ο
- Π
- π
- Ρ
- ρ
- Σ
- σ
- ς
- Τ
- τ
- Υ
- υ
- Φ
- φ
- Χ
- χ
- Ψ
- ψ
- ω
- А
- Б
- В
- Г
- Ґ
- Д
- Е
- Ё
- Є
- Ж
- З
- И
- І
- Ї
- Й
- К
- Л
- М
- Н
- О
- П
- Р
- С
- Т
- У
- Ў
- Ф
- Х
- Ц
- Ч
- Ш
- Щ
- Ъ
- Ы
- Ь
- Э
- Ю
- Я
- а
- б
- в
- г
- ґ
- д
- е
- ё
- є
- ж
- з
- и
- і
- ї
- й
- к
- л
- м
- н
- о
- п
- р
- с
- т
- у
- ў
- ф
- х
- ц
- ч
- ш
- щ
- ъ
- ы
- ь
- э
- ю
- я

View File

@@ -0,0 +1,547 @@
Global:
model_name: latin_PP-OCRv5_mobile_rec
Hpi:
backend_configs:
paddle_infer:
trt_dynamic_shapes: &id001
x:
- - 1
- 3
- 48
- 160
- - 1
- 3
- 48
- 320
- - 8
- 3
- 48
- 3200
tensorrt:
dynamic_shapes: *id001
PreProcess:
transform_ops:
- DecodeImage:
channel_first: false
img_mode: BGR
- MultiLabelEncode:
gtc_encode: NRTRLabelEncode
max_text_length: 1000
- RecResizeImg:
eval_mode: true
image_shape:
- 3
- 48
- 320
- KeepKeys:
keep_keys:
- image
- label_ctc
- label_gtc
- length
- valid_ratio
PostProcess:
name: CTCLabelDecode
character_dict:
- '!'
- '"'
- '#'
- $
- '%'
- '&'
- ''''
- (
- )
- '*'
- +
- ','
- '-'
- .
- /
- '0'
- '1'
- '2'
- '3'
- '4'
- '5'
- '6'
- '7'
- '8'
- '9'
- ':'
- ;
- <
- '='
- '>'
- '?'
- '@'
- A
- B
- C
- D
- E
- F
- G
- H
- I
- J
- K
- L
- M
- N
- O
- P
- Q
- R
- S
- T
- U
- V
- W
- X
- Y
- Z
- '['
- \
- ']'
- ^
- _
- '`'
- a
- b
- c
- d
- e
- f
- g
- h
- i
- j
- k
- l
- m
- n
- o
- p
- q
- r
- s
- t
- u
- v
- w
- x
- y
- z
- '{'
- '|'
- '}'
- '~'
- ¡
- ¢
- £
- ¤
- ¥
- ¦
- §
- ¨
- ©
- ª
- «
- ¬
- ­
- ®
- ¯
- °
- ±
- ²
- ³
- ´
- µ
-
- ·
- ¸
- ¹
- º
- »
- ¼
- ½
- ¾
- ¿
- À
- Á
- Â
- Ã
- Ä
- Å
- Æ
- Ç
- È
- É
- Ê
- Ë
- Ì
- Í
- Î
- Ï
- Ð
- Ñ
- Ò
- Ó
- Ô
- Õ
- Ö
- ×
- Ø
- Ù
- Ú
- Û
- Ü
- Ý
- Þ
- ß
- à
- á
- â
- ã
- ä
- å
- æ
- ç
- è
- é
- ê
- ë
- ì
- í
- î
- ï
- ð
- ñ
- ò
- ó
- ô
- õ
- ö
- ÷
- ø
- ù
- ú
- û
- ü
- ý
- þ
- ÿ
- Ą
- ą
- Ć
- ć
- Č
- č
- Ď
- ď
- Đ
- đ
- Ė
- ė
- Ę
- ę
- Ě
- ě
- Ğ
- ğ
- Į
- į
- İ
- ı
- Ĺ
- ĺ
- Ľ
- ľ
- Ł
- ł
- Ń
- ń
- Ň
- ň
- ō
- Ő
- ő
- Œ
- œ
- Ŕ
- ŕ
- Ř
- ř
- Ś
- ś
- Ş
- ş
- Š
- š
- Ť
- ť
- Ū
- ū
- Ů
- ů
- Ű
- ű
- Ų
- ų
- Ÿ
- Ź
- ź
- Ż
- ż
- Ž
- ž
- ƒ
- ʒ
- Ω
- α
- β
- γ
- δ
- ε
- ζ
- η
- θ
- ι
- κ
- λ
- μ
- ν
- ξ
- ο
- π
- ρ
- ς
- σ
- τ
- υ
- φ
- χ
- ψ
- ω
- з
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
- <EFBFBD>
- 𝑢
- 𝜓

View File

@@ -0,0 +1,22 @@
#!/bin/bash
# 递归查找所有 inference.json 文件,并在其所在目录执行转换命令
find . -name "inference.json" -print0 | while IFS= read -r -d $'\0' json_file; do
target_dir=$(dirname "$json_file")
echo "✅ 正在处理目录: $target_dir"
(
cd "$target_dir" || exit 1
# 执行转换命令链(含错误检测)
if paddle2onnx --model_dir ./ \
--model_filename inference.json \
--params_filename inference.pdiparams \
--save_file model.onnx \
&& onnxslim model.onnx slim.onnx
then
echo "🟢 转换成功: $PWD"
else
echo "🔴 转换失败: $PWD" >&2
exit 1
fi
)
done

Binary file not shown.

After

Width:  |  Height:  |  Size: 2.8 KiB