python中超简单的字符分割算法记录(车牌识别、仪表识别等)

2024-04-02 19:55

短信预约 -IT技能 免费直播动态提醒

背景

在诸如车牌识别，数字仪表识别等问题中，最关键的就是将单个的字符分割开来再分别进行识别，如下图。最近刚好用到，就自己写了一个简单地算法进行字符分割，来记录一下。

图像预处理

彩图二值化以减小参数量，再进行腐蚀膨胀去除噪点。


image = cv2.imread('F://demo.jpg', 0)  # 读取为灰度图
_, image = cv2.threshold(image, 50, 255, cv2.THRESH_BINARY)  # 二值化
kernel1 = cv2.getStructuringElement(cv2.MORPH_RECT, (7, 7))  # 腐蚀膨胀核
kernel2 = cv2.getStructuringElement(cv2.MORPH_RECT, (5, 5))  # 腐蚀膨胀核
image = cv2.erode(image, kernel=kernel1)  # 腐蚀
image = cv2.dilate(image, kernel=kernel2)  # 膨胀

确定字符区域

考虑最理想的情况，图中的字符是端正没有倾斜歪曲的。将像素灰度矩阵分别进行列相加、行相加，则在得到的列和、行和数组中第一个非 0 元素索引到最后一个非 0 元素索引包裹的区间即就是字符区域。


h, w = image.shape  # 原图的高和宽
list1 = []  # 列和
list2 = []  # 行和

for i in range(w):
    list1.append(1 if image[:, i].sum() != 0 else 0)  # 列求和,不为0置1
for i in range(h):
    list2.append(1 if image[i, :].sum() != 0 else 0)  # 行求和,不为0置1

# 裁剪字符区域
# 求行的范围
flag = 0
for i, e in enumerate(list1):
    if e != 0:
        if flag == 0:  # 第一个不为0的位置记录
            start_w = i
            flag = 1
        else:  # 最后一个不为0的位置
            end_w = i
# 求列的范围
flag = 0
for i, e in enumerate(list2):
    if e != 0:
        if flag == 0:  # 第一个不为0的位置记录
            start_h = i
            flag = 1
        else:  # 最后一个不为0的位置
            end_h = i

print(start_w, end_w)  # 行索引范围
print(start_h, end_h)  # 列索引范围

分割单个字符

与分割全部字符区域同理，在行和数组中非 0 元素索引的范围即是单个字符的区域。


l = ([i for i, e in enumerate(list1) if e != 0])  # 列和列表中不为0的索引
img_list = []  # 分割数字图片存储列表
temp = []  # 存储某一个数字的所有行索引值
n = 0  # 数字图片数量

for x in l:
    temp.append(x)
    if x+1 not in l:  # 索引不连续的情况
        if len(temp) != 1:
            start_w = min(temp)  # 索引最小值
            end_w = max(temp)  # 索引最大值
            img_list.append(image[start_h:end_h, start_w:end_w])  # 对该索引包括数字切片
            n += 1
        temp = []

print(n)  # 字符数

完整源码


import cv2

start_h, end_h, start_w, end_w = 0, 0, 0, 0  # 字符区域的高和宽起止

image = cv2.imread('F://001_1.jpg', 0)  # 直接读取为灰度图
cv2.imshow('img_GRAY', image)

_, image = cv2.threshold(image, 50, 255, cv2.THRESH_BINARY)  # 二值化
cv2.imshow('img_BINARY', image)

# 去噪点
kernel1 = cv2.getStructuringElement(cv2.MORPH_RECT, (7, 7))  # 简单腐蚀膨胀核
kernel2 = cv2.getStructuringElement(cv2.MORPH_RECT, (5, 5))  # 简单腐蚀膨胀核
image = cv2.erode(image, kernel=kernel1)  # 腐蚀
image = cv2.dilate(image, kernel=kernel2)  # 膨胀
cv2.imshow('img_denoise', image)


h, w = image.shape  # 原图的高和宽
# print(h, w)

list1 = []  # 列和
list2 = []  # 行和

for i in range(w):
    list1.append(1 if image[:, i].sum() != 0 else 0)  # 列求和,不为0置1
for i in range(h):
    list2.append(1 if image[i, :].sum() != 0 else 0)  # 行求和,不为0置1

# print(len(list1))
# print(len(list2))

# 裁剪字符区域
# 求行的范围
flag = 0
for i, e in enumerate(list1):
    if e != 0:
        if flag == 0:  # 第一个不为0的位置记录
            start_w = i
            flag = 1
        else:  # 最后一个不为0的位置
            end_w = i
# 求列的范围
flag = 0
for i, e in enumerate(list2):
    if e != 0:
        if flag == 0:  # 第一个不为0的位置记录
            start_h = i
            flag = 1
        else:  # 最后一个不为0的位置
            end_h = i

print(start_w, end_w)  # 行索引范围
print(start_h, end_h)  # 列索引范围

cv2.imshow('img_number', image[start_h:end_h, start_w:end_w])

l = ([i for i, e in enumerate(list1) if e != 0])  # 列和列表中不为0的索引
# print(l)

img_list = []  # 分割数字图片存储列表

temp = []  # 存储某一个数字的所有行索引值
n = 0  # 数字图片数量
for x in l:
    temp.append(x)
    if x+1 not in l:  # 索引不连续的情况
        if len(temp) != 1:
            start_w = min(temp)  # 索引最小值
            end_w = max(temp)  # 索引最大值
            img_list.append(image[start_h:end_h, start_w:end_w])  # 对该索引包括数字切片
            n += 1
            # print(temp)
        temp = []

print(n)  # 字符数

for i in range(n):  # 显示保存字符
    cv2.imshow('number'+str(i), img_list[i])
    cv2.imwrite('F://demo'+str(i+1).zfill(2)+'.jpg', img_list[i])

cv2.waitKey(0)

结语

利用列向和行向相加的方法简单分割字符的方法并不适用更加复杂的分割要求，另外算法中也没有考虑小数点分割问题，仅作为学习参考，欢迎有问题一起讨论交流。

到此这篇关于python中超简单的字符分割算法记录(车牌识别、仪表识别等)的文章就介绍到这了,更多相关python字符分割算法内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

阅读原文内容投诉

python中超简单的字符分割算法记录(车牌识别、仪表识别等)

下载Word文档到电脑，方便收藏和打印～

下载Word文档

python中超简单的字符分割算法记录(车牌识别、仪表识别等)

背景

图像预处理

确定字符区域

分割单个字符

完整源码

结语

python中超简单的字符分割算法记录(车牌识别、仪表识别等)

相关文章

猜你喜欢

python中超简单的字符分割算法记录(车牌识别、仪表识别等)

热门标签

编程热搜

Python 学习之路 - Python

chatgpt的中文全称是什么

C/C++中extern函数使用详解

C/C++可变参数的使用

css样式文件该放在哪里

php中数组下标必须是连续的吗

Python 3 教程

Python pip包管理

ubuntu如何重新编译内核

改善Java代码之慎用java动态编译

编程资源站

2021年下半年软考高级信息系统项目管理师高频考点精选资料

2021下半年软考高级信息系统技术知识点记忆口诀精选资料

2021下半年软考《信息系统项目管理师》考试真题及答案精选资料

2021下半年软考高级考试备考攻略精选资料

2021年软考高级《信息系统项目管理师》巩固练习题汇总精选资料

2021下半年软考高级信息系统项目管理师30个易考知识点汇总精选资料

2021下半年软考高级知识点这样记，还担心记不住吗精选资料

2021年下半年软考高级考试重点汇总精选资料

2021下半年软考高级信息系统项目管理师计算公式汇总精选资料

2021年下半年软考高级《信息系统项目管理师》模拟试题精选资料

信息系统项目管理师选择题每日一练（2024）历年试题

2023年下半年信息系统项目管理师综合知识真题演练历年试题

目录

python中超简单的字符分割算法记录(车牌识别、仪表识别等)

背景

图像预处理

确定字符区域

分割单个字符

完整源码

结语

python中超简单的字符分割算法记录(车牌识别、仪表识别等)

相关文章

猜你喜欢

python中超简单的字符分割算法记录(车牌识别、仪表识别等)

热门标签

编程热搜

编程资源站

目录

感谢您的提交，我们服务专员将在30分钟内给您回复