相較于數(shù)字和英文字符的識別,汽車牌照中的漢字字符識別的難度更大,主要原因有以下4個方面:
(1)字符筆畫因切分誤差導致非筆畫或筆畫流失。
(2)汽車牌照被污染導致字符上出現(xiàn)污垢。
(3)采集所得車輛圖像分辨率低導致多筆畫的漢字較難分辨。
(4)車輛圖像采集時所受光照影響的差異導致筆畫較淡。
綜合漢字識別時的這些難點來看,很難被直接提取的是字符的局部特征。筆畫作為最重要的特征而僅存在于漢字中,這由先驗知識可知。一旦捺、橫、豎、撇這些筆畫特征被提取到,對于漢字字符識別的工作就完成了許多。在水平方向上,橫筆畫的灰度值的波動表現(xiàn)為低頻,豎筆畫的灰度變化表現(xiàn)為低頻;在垂直方向上,橫筆畫的灰度變化表現(xiàn)為高頻,豎筆畫的灰度變化表現(xiàn)為高頻。在漢字字符特征的提取過程中,對于小波的多分辨率特性的利用顯然是一個不錯的選擇。
對于漢字進識別的相關工作,在一系列對圖像進行預處理以及對圖像的特征進行提取等相關操作后就可以進行了。第一步是預處理原始圖像;第二步是對字符的原始特征進行提?。ㄖ饕ㄟ^小波變換進行),并降維處理原始特征(主要采用線性判別式分析(LDA)變換矩陣進行),獲取字符的最終特征;第三步是在特征模板匹配和最小距離分類器中讀入獲取所得到的最終特征,得到字符的最終識別結果。
1.代碼實例
中文車牌的識別(包括新能源汽車)
import cv2 as cv
from PIL import Image
import pytesseract as tess
def recoginse_text(image):
"""
步驟:
1、灰度,二值化處理
2、形態(tài)學操作去噪
3、識別
:param image:
:return:
"""
# 灰度 二值化
gray = cv.cvtColor(image,cv.COLOR_BGR2GRAY)
# 如果是白底黑字 建議 _INV
ret,binary = cv.threshold(gray,0,255,cv.THRESH_BINARY_INV| cv.THRESH_OTSU)
# 形態(tài)學操作 (根據(jù)需要設置參數(shù)(1,2))
kernel = cv.getStructuringElement(cv.MORPH_RECT,(1,2)) #去除橫向細線
morph1 = cv.morphologyEx(binary,cv.MORPH_OPEN,kernel)
kernel = cv.getStructuringElement(cv.MORPH_RECT, (2, 1)) #去除縱向細線
morph2 = cv.morphologyEx(morph1,cv.MORPH_OPEN,kernel)
cv.imshow("Morph",morph2)
# 黑底白字取非,變?yōu)榘椎缀谧郑ū阌趐ytesseract 識別)
cv.bitwise_not(morph2,morph2)
textImage = Image.fromarray(morph2)
# 圖片轉文字
text=tess.image_to_string(textImage)
n=10 #根據(jù)不同國家車牌固定數(shù)目進行設置
print("識別結果:")
print(text[1:n])
def main():
# 讀取需要識別的數(shù)字字母圖片,并顯示讀到的原圖
src = cv.imread("cp.jpg")
cv.imshow("src",src)
# 識別
recoginse_text(src)
cv.waitKey(0)
cv.destroyAllWindows()
if __name__=="__main__":
main()
2.遇到問題
No module named ‘pytesseract’
缺少pytesseract 模塊。
在環(huán)境中安裝該模塊
安裝完成運行程序,結果又出現(xiàn)了一堆問題:
原因是沒有安裝pytesseract需要的Tesseract-OCR工具,Windows版本的安裝包的下載路徑為https://github.com/UB-Mannheim/tesseract/wiki
直接雙擊該文件進行安裝即可。這里的安裝位置(這個路徑要記住,后面要用)采用默認值:
C:\Program Files\Tesseract-OCR
配置pytesseract.py打開“我的計算機”,進入\Users==\AppData\Local\Programs\Python\Python38\Lib\site-packages\pytesseract\,找到pytesseract.py文件,用文本編輯器打開這個文件,找到"tesseract_cmd"關鍵字
至此,字符識別開發(fā)環(huán)境準備好了,下面就可以編寫代碼了。
代碼實例:
import cv2 as cv
from PIL import Image
import pytesseract as tess
def recoginse_text(image):
"""
步驟:
1、灰度,二值化處理
2、形態(tài)學操作去噪
3、識別
:param image:
:return:
"""
# 灰度 二值化
gray = cv.cvtColor(image,cv.COLOR_BGR2GRAY)
# 如果是白底黑字 建議 _INV
ret,binary = cv.threshold(gray,0,255,cv.THRESH_BINARY_INV| cv.THRESH_OTSU)
# 形態(tài)學操作 (根據(jù)需要設置參數(shù)(1,2))
kernel = cv.getStructuringElement(cv.MORPH_RECT,(1,2)) #去除橫向細線
morph1 = cv.morphologyEx(binary,cv.MORPH_OPEN,kernel)
kernel = cv.getStructuringElement(cv.MORPH_RECT, (2, 1)) #去除縱向細線
morph2 = cv.morphologyEx(morph1,cv.MORPH_OPEN,kernel)
cv.imshow("Morph",morph2)
# 黑底白字取非,變?yōu)榘椎缀谧郑ū阌趐ytesseract 識別)
cv.bitwise_not(morph2,morph2)
textImage = Image.fromarray(morph2)
# 圖片轉文字
text=tess.image_to_string(textImage)
n=10 #根據(jù)不同國家車牌固定數(shù)目進行設置
print("識別結果:")
print(text[1:n])
def main():
# 讀取需要識別的數(shù)字字母圖片,并顯示讀到的原圖
src = cv.imread("cp.jpg")
cv.imshow("src",src)
# 識別
recoginse_text(src)
cv.waitKey(0)
cv.destroyAllWindows()
if __name__=="__main__":
main()
3.漢字識別代碼實例
代碼實例
import tkinter as tk
from tkinter.filedialog import *
from tkinter import ttk
import predict
import cv2
from PIL import Image, ImageTk
import threading
import time
class Surface(ttk.Frame):
pic_path = ""
viewhigh = 600
viewwide = 600
update_time = 0
thread = None
thread_run = False
camera = None
color_transform = {"green":("綠牌","#55FF55"), "yello":("黃牌","#FFFF00"), "blue":("藍牌","#6666FF")}
def __init__(self, win):
ttk.Frame.__init__(self, win)
frame_left = ttk.Frame(self)
frame_right1 = ttk.Frame(self)
frame_right2 = ttk.Frame(self)
win.title("車牌識別")
win.state("zoomed")
self.pack(fill=tk.BOTH, expand=tk.YES, padx="5", pady="5")
frame_left.pack(side=LEFT,expand=1,fill=BOTH)
frame_right1.pack(side=TOP,expand=1,fill=tk.Y)
frame_right2.pack(side=RIGHT,expand=0)
ttk.Label(frame_left, text='原圖:').pack(anchor="nw")
ttk.Label(frame_right1, text='車牌位置:').grid(column=0, row=0, sticky=tk.W)
from_pic_ctl = ttk.Button(frame_right2, text="來自圖片", width=20, command=self.from_pic)
from_vedio_ctl = ttk.Button(frame_right2, text="來自攝像頭", width=20, command=self.from_vedio)
self.image_ctl = ttk.Label(frame_left)
self.image_ctl.pack(anchor="nw")
self.roi_ctl = ttk.Label(frame_right1)
self.roi_ctl.grid(column=0, row=1, sticky=tk.W)
ttk.Label(frame_right1, text='識別結果:').grid(column=0, row=2, sticky=tk.W)
self.r_ctl = ttk.Label(frame_right1, text="")
self.r_ctl.grid(column=0, row=3, sticky=tk.W)
self.color_ctl = ttk.Label(frame_right1, text="", width="20")
self.color_ctl.grid(column=0, row=4, sticky=tk.W)
from_vedio_ctl.pack(anchor="se", pady="5")
from_pic_ctl.pack(anchor="se", pady="5")
self.predictor = predict.CardPredictor()
self.predictor.train_svm()
def get_imgtk(self, img_bgr):
img = cv2.cvtColor(img_bgr, cv2.COLOR_BGR2RGB)
im = Image.fromarray(img)
imgtk = ImageTk.PhotoImage(image=im)
wide = imgtk.width()
high = imgtk.height()
if wide > self.viewwide or high > self.viewhigh:
wide_factor = self.viewwide / wide
high_factor = self.viewhigh / high
factor = min(wide_factor, high_factor)
wide = int(wide * factor)
if wide <= 0 : wide = 1
high = int(high * factor)
if high <= 0 : high = 1
im=im.resize((wide, high), Image.ANTIALIAS)
imgtk = ImageTk.PhotoImage(image=im)
return imgtk
def show_roi(self, r, roi, color):
if r :
roi = cv2.cvtColor(roi, cv2.COLOR_BGR2RGB)
roi = Image.fromarray(roi)
self.imgtk_roi = ImageTk.PhotoImage(image=roi)
self.roi_ctl.configure(image=self.imgtk_roi, state='enable')
self.r_ctl.configure(text=str(r))
self.update_time = time.time()
try:
c = self.color_transform[color]
self.color_ctl.configure(text=c[0], background=c[1], state='enable')
except:
self.color_ctl.configure(state='disabled')
elif self.update_time + 8 < time.time():
self.roi_ctl.configure(state='disabled')
self.r_ctl.configure(text="")
self.color_ctl.configure(state='disabled')
def from_vedio(self):
if self.thread_run:
return
if self.camera is None:
self.camera = cv2.VideoCapture(0)
if not self.camera.isOpened():
mBox.showwarning('警告', '攝像頭打開失??!')
self.camera = None
return
self.thread = threading.Thread(target=self.vedio_thread, args=(self,))
self.thread.setDaemon(True)
self.thread.start()
self.thread_run = True
def from_pic(self):
self.thread_run = False
self.pic_path = askopenfilename(title="選擇識別圖片", filetypes=[("jpg圖片", "*.jpg")])
if self.pic_path:
img_bgr = predict.imreadex(self.pic_path)
self.imgtk = self.get_imgtk(img_bgr)
self.image_ctl.configure(image=self.imgtk)
resize_rates = (1, 0.9, 0.8, 0.7, 0.6, 0.5, 0.4)
for resize_rate in resize_rates:
print("resize_rate:", resize_rate)
try:
r, roi, color = self.predictor.predict(img_bgr, resize_rate)
except:
continue
if r:
break
#r, roi, color = self.predictor.predict(img_bgr, 1)
self.show_roi(r, roi, color)
@staticmethod
def vedio_thread(self):
self.thread_run = True
predict_time = time.time()
while self.thread_run:
_, img_bgr = self.camera.read()
self.imgtk = self.get_imgtk(img_bgr)
self.image_ctl.configure(image=self.imgtk)
if time.time() - predict_time > 2:
r, roi, color = self.predictor.predict(img_bgr)
self.show_roi(r, roi, color)
predict_time = time.time()
print("run end")
def close_window():
print("destroy")
if surface.thread_run :
surface.thread_run = False
surface.thread.join(2.0)
win.destroy()
if __name__ == '__main__':
win=tk.Tk()
surface = Surface(win)
win.protocol('WM_DELETE_WINDOW', close_window)
win.mainloop()
輸出結果:文章來源:http://www.zghlxwxcb.cn/news/detail-654229.html
文章來源地址http://www.zghlxwxcb.cn/news/detail-654229.html
到了這里,關于OpenCV實例(八)車牌字符識別技術(三)漢字識別的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!