OpenCV(python)版实现文本分割之水平投影法
短信预约 -IT技能 免费直播动态提醒
对于如下一张图片,如何将文本区域分割成一行一行的了?
在文本分割领域中有一种很优秀的算法:投影法,包括水平投影法和垂直投影法。本文主要讲述水平投影法,水平投影法可以理解为一束光线从图像的左侧向右边进行照射,每一条光线可以理解为图像的一行,计算每一行上图像的黑色像素点,从而可以对图像进行分割。
import numpy as np
import cv2
def get_vvList(list_data):
#取出list中像素存在的区间
vv_list=list()
v_list=list()
for index,i in enumerate(list_data):
if i>0:
v_list.append(index)
else:
if v_list:
vv_list.append(v_list)
#list的clear与[]有区别
v_list=[]
return vv_list
if __name__=='__main__':
img_bgr=cv2.imread('./testImg/1.png',1)
if not img_bgr is None:
img=img_bgr.copy()
img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
#二值化
t,binary=cv2.threshold(img_gray,0,255,cv2.THRESH_OTSU+cv2.THRESH_BINARY)
'''
水平投影从左向右投射,计算每一行的黑色像素总数
'''
rows,cols=binary.shape
hor_list=[0]*rows
for i in range(rows):
for j in range(cols):
#统计每一行的黑色像素总数
if binary.item(i,j)==0:
hor_list[i]=hor_list[i]+1
'''
对hor_list中的元素进行筛选,可以去除一些噪点
'''
hor_arr=np.array(hor_list)
hor_arr[np.where(hor_arr<5)]=0
hor_list=hor_arr.tolist()
#绘制水平投影
img_white=np.ones(shape=(rows,cols),dtype=np.uint8)*255
for i in range(rows):
pt1=(cols-1,i)
pt2=(cols-1-hor_list[i],i)
cv2.line(img_white,pt1,pt2,(0,),1)
cv2.imshow('水平投影',img_white)
cv2.waitKey(0)
#取出各个文字区间
vv_list=get_vvList(hor_list)
for i in vv_list:
img_hor=img_bgr[i[0]:i[-1],:,:]
cv2.imshow('文本行',img_hor)
cv2.waitKey(0)
运行上述代码,可以看到水平投影的效果。
根据投影法的特征,可以很容易就将上述文本分割成文本行,如下图所示:
到此这篇关于OpenCV(python)版实现文本分割之水平投影法的文章就介绍到这了,更多相关OpenCV水平投影 内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341