PythonOCR文字识别教程_Tesseract与图像预处理案例

冷漠man

发布时间：2025-12-31 15:39:18

626人浏览过

来源于php中文网

原创

OCR识别核心是图像预处理而非调参：先灰度化与自适应二值化，再开运算去噪，接着倾斜校正，最后缩放至300 DPI；中文需指定lang='chi_sim'并配置tessdata，PSM模式按场景选用。

pythonocr文字识别教程_tesseract与图像预处理案例

用 Python 做 OCR 识别，核心是让图像“更适合被 Tesseract 看懂”——不是靠调高参数，而是把图片先处理干净。Tesseract 本身不擅长处理模糊、倾斜、低对比度或带噪点的图，所以预处理比换模型更关键。

安装与基础配置

Tesseract 需要系统级安装（不只是 pip），Python 端用 pytesseract 调用：

macOS：用 brew install tesseract，再 pip install pytesseract opencv-python numpy
Windows：去 UB-Mannheim 官网下安装包，勾选添加到 PATH；之后 pip 安装同上
验证是否成功：import pytesseract; print(pytesseract.get_tesseract_version())
中文识别必须指定语言：lang='chi_sim'（简体）或 'chi_tra'（繁体），需提前下载对应训练数据（tessdata 仓库）并放入 Tesseract 的 tessdata 目录

图像预处理四步法

多数识别失败，问题出在输入图像。以下四步按顺序做，每步解决一类常见干扰：

灰度化 + 二值化：去掉颜色干扰，突出文字区域。推荐用 OpenCV 的自适应阈值（cv2.adaptiveThreshold），比全局阈值更适应光照不均的图
去噪 & 细化：用形态学操作（如 cv2.morphologyEx 中的开运算）清除散点噪点；对细字体可加 cv2.ximgproc.thinning（需 opencv-contrib-python）
倾斜校正：检测文字行角度，用仿射变换旋转。简单方法是霍夫线检测后取中位角；也可用 skimage.transform.rotate 配合投影法粗估
分辨率提升：Tesseract 推荐 300 DPI。若原图太小，用 cv2.resize 放大（插值选 cv2.INTER_CUBIC），但别过度放大，否则边缘发虚

实战代码片段（含注释）

以下是一个端到端可运行的精简流程，处理一张扫描件截图：

Red Panda AI

AI文本生成图像

下载

立即学习“Python免费学习笔记（深入）”；

import cv2
import numpy as np
import pytesseract
def preprocess(img_path):
img = cv2.imread(img_path, cv2.IMREAD_GRAYSCALE)
自适应二值化
binary = cv2.adaptiveThreshold(img, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 2)
# 开运算去噪
kernel = np.ones((2,2), np.uint8)
cleaned = cv2.morphologyEx(binary, cv2.MORPH_OPEN, kernel)
# 放大至 300 DPI 等效尺寸（假设原始为 72 DPI，放大 ~4.2x）
h, w = cleaned.shape
resized = cv2.resize(cleaned, (int(w*4.2), int(h*4.2)), interpolation=cv2.INTER_CUBIC)
return resized
img_pre = preprocess("receipt.jpg")
text = pytesseract.image_to_string(img_pre, lang='chi_sim', config='--psm 6')
print(text.strip())

注意：--psm 6 表示“假设为单块均匀文本”，适合常规文档；表格或混排内容可试 --psm 4（分段）或 --psm 1（自动页面分割）
避坑提醒
这些细节不处理，准确率会断崖下跌：

Tesseract 对阴影、水印、底纹极度敏感——预处理时先用 cv2.inpaint 或背景建模抹掉大面积灰斑
中文标点（如《》【】）识别率偏低，可在后处理中用正则替换近似字符（如 “〈” → “《”）
小字号（＜10px）或手写体建议换专用模型（PaddleOCR、EasyOCR），Tesseract 不是万能的
识别结果含大量空行或乱码？大概率是二值化阈值不合适，改用 Otsu 法（cv2.threshold(..., cv2.THRESH_OTSU)）自动寻优

如何解决 VS Code 中 PIL/Pillow 导入无法解析的问题

如何在SOAP请求中使用BeautifulSoup正确插入XML标签

Python生成式AI教程_使用transformer模型生成文本

Python内存管理进阶教程_对象引用与垃圾回收实战

Python区块链数据分析进阶教程_链上数据处理与可视化

相关标签:

python windows mac ai macos win cos Python pip print transform macos opencv ocr

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Python继承与多态实现_复用机制解析【教程】下一篇：暂无

作者最新文章

电视怎么登录腾讯视频会员_电视怎么登录腾讯视频会员最靠谱扫码教程免费步骤

2025-12-30 12:36

刚铎之城降临！乐高×魔戒新作惊传破8千片积木预计2026年现身

2025-12-30 12:47

OPPO Find X9s曝光：6.3英寸小直屏+2亿像素主摄

2025-12-30 13:18

Linux稳定性工程实践教程_系统可靠性建设

2025-12-30 13:20

Linux进程状态详解_running与sleep说明【指导】

2025-12-30 13:39

9899元！红魔11 Pro+ GOLDEN SAGA即将上市

2025-12-30 13:45

ao3镜像链接稳定入口地址_AO3最新稳定镜像站点快速访问入口汇总

2025-12-30 13:46

yandexgmes游戏入口怎么进_Yandex Games免费在线游戏平台入口地址

2025-12-30 14:01

ao3手机版登录入口地址_AO3手机版网页版或镜像登录入口

2025-12-30 14:02

ao3镜像网址链接点击进入_AO3镜像网址点击即进入口地址

2025-12-30 14:04

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

715

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

625

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

739

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

617

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1235

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

547

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

575

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

698

2023.08.11