那天聽到領(lǐng)導(dǎo)他們在討論,說要將圖片進(jìn)行個矯正處理,還叫來了算法部的大佬來討論將要如何處理這個,討論場面很是激烈
不得不說好奇心是個很神奇的東西,就把我給吸引過去了
我定眼一看,感覺作為JAVA開發(fā)的我自己也能進(jìn)行處理
因為看到了圖片后,發(fā)現(xiàn)了圖片中一個很重要的特征點:
要進(jìn)行矯正的圖片中都會有一個二維碼圖案,想要矯正的文字和二維碼圖案是處于同一水平線的。
如下面這個
要把圖片中的“水中加點糖”四個字矯正,只需要把二維碼矯正就可以了。
具體想法就是,求得二維碼矯正的角度a,對原圖整體按照角度a進(jìn)行旋轉(zhuǎn)就可以了。
有了想法后,就趁熱打鐵,正好周末了在家試試。
一般圖片矯正方式
對于一般的圖片矯正,最常見的做法有這么兩種:
- 對圖片進(jìn)行預(yù)處理獲取出輪廓,并求得輪廓的近似矩形,通過矩形的定位點來進(jìn)行透視變換
- 對圖片進(jìn)行預(yù)處理后,進(jìn)行霍夫變換進(jìn)行直線檢測,再根據(jù)直線的傾斜角進(jìn)行旋轉(zhuǎn)
但是對于圖片中有二維碼的圖片進(jìn)行矯正就可以更加簡單了,因為二維碼中有定位點并且成熟框架很多,實現(xiàn)起來也更加方便且識別率非常高。
二維碼圖片矯正
思路
識別出二維碼的角點,通過相鄰兩個角點的坐標(biāo)計算出夾角度數(shù),再次用此度數(shù)對圖片進(jìn)行旋轉(zhuǎn)。
以下面圖為例:
先獲取出二維碼正方向時底部的兩點坐標(biāo),并求得兩點的傾斜角。
斜率計算用初中數(shù)學(xué)中求兩點坐標(biāo)斜率的公式算一下即可,忘了就搜搜回憶一下:
兩點的斜率公式:k=(y1-y2)/(x1-x2),x1≠x2。其中(x1,y1),(x2,y2)是已知兩點的坐標(biāo),x1≠x2。
斜率是表示一條直線(或曲線的切線)關(guān)于(橫)坐標(biāo)軸傾斜程度的量。它通常用直線(或曲線的切線)與(橫)坐標(biāo)軸夾角的正切,或兩點的縱坐標(biāo)之差與橫坐標(biāo)之差的比來表示。記作k,k=tgα。
一條直線與某平面直角坐標(biāo)系橫坐標(biāo)軸正半軸方向所成的角的正切值即該直線相對于該坐標(biāo)系的斜率。如果直線與x軸互相垂直,直角的正切值為tan90°,故此直線不存在斜率(也可以說直線的斜率為無窮大)。當(dāng)直線L的斜率存在時,對于一次函數(shù)y=kx+b(斜截式),k即該函數(shù)圖像的斜率。
編碼實現(xiàn)
實現(xiàn)時對于二維碼的識別用到了pyzbar庫,對圖片處理用的opencv包
"""
author: puhaiyang
blog: https://blog.csdn.net/puhaiyang
github: https://github.com/puhaiyang
"""
import math
import cv2
from pyzbar import pyzbar
import imutils
def azimuthangle(x1, y1, x2, y2):
""" 已知兩點坐標(biāo)計算角度 -
:param x1: 原點橫坐標(biāo)值
:param y1: 原點縱坐標(biāo)值
:param x2: 目標(biāo)點橫坐標(biāo)值
:param y2: 目標(biāo)縱坐標(biāo)值
"""
dx = x2 - x1
dy = y2 - y1
# 求斜率
k = dy / dx
# 結(jié)果是弧度值
angle = math.atan(k)
# 弧度值轉(zhuǎn)為角度
return angle * 180 / math.pi
def get_angle(qr_item):
"""
獲取出進(jìn)行矯正所需要的角度
"""
# 將坐標(biāo)從下到上,從左到右進(jìn)行排序
locs = {qr_item.polygon[0], qr_item.polygon[1], qr_item.polygon[2], qr_item.polygon[3]}
locs = sorted(locs, key=lambda x: x.y * 100000 + x.x * 1000)
return azimuthangle(locs[2].x, locs[2].y, locs[3].x, locs[3].y)
def to_up_angle(qr_item):
"""
獲取出使二維碼朝上的角度
"""
if qr_item.orientation == 'UP':
angle_ext = 0
elif qr_item.orientation == 'RIGHT':
angle_ext = 270
elif qr_item.orientation == 'DOWN':
angle_ext = 180
else:
angle_ext = 90
return angle_ext
def resize_img(ori_img):
"""
圖片壓縮
"""
height = ori_img.shape[0]
width = ori_img.shape[1]
# 執(zhí)行壓縮,按照500的寬度為標(biāo)準(zhǔn)
if width > 500:
scale_percent = int(500 / width * 100)
s_width = int(width * scale_percent / 100)
s_height = int(height * scale_percent / 100)
# 新的寬度和高度
dim = (s_width, s_height)
return cv2.resize(ori_img, dim, interpolation=cv2.INTER_AREA)
else:
return ori_img
def adjust_rotae_angle(img):
angle = 0
# 對圖片進(jìn)行壓縮
img = resize_img(img)
# symbol為64代表二維碼
qr_result = pyzbar.decode(img, symbols=[64])
if len(qr_result) == 1:
# 識別到了一個二維碼,將二維碼朝上旋轉(zhuǎn)
first_adjust_angle = to_up_angle(qr_result[0])
# 進(jìn)行旋轉(zhuǎn)
img_rotae_to_up = imutils.rotate_bound(img, first_adjust_angle)
# 再次識別
qr_result2 = pyzbar.decode(img_rotae_to_up, symbols=[64])
if len(qr_result2) == 1:
last_adjust_angle = -get_angle(qr_result2[0])
angle = first_adjust_angle + last_adjust_angle
print("first angle:%d last angle:%d angle:%d" % (first_adjust_angle, last_adjust_angle, angle))
else:
print('last 未識別到二維碼')
else:
print('first 未識別到二維碼')
return angle
if __name__ == '__main__':
# 加載圖片
img = cv2.imread('123.jpg')
adjust_angle = adjust_rotae_angle(img.copy())
if adjust_angle != 0:
img_rotae = imutils.rotate_bound(img, adjust_angle)
cv2.imwrite('img_rotae.jpg', img_rotae)
最終輸出的圖片結(jié)果:
矯正成功!文章來源:http://www.zghlxwxcb.cn/news/detail-449858.html
需要說明的是,上面之所以要進(jìn)行對圖片的resize,是因為圖片太大的話pyzbar可能會識別不出來二維碼文章來源地址http://www.zghlxwxcb.cn/news/detail-449858.html
到了這里,關(guān)于opencv快速實現(xiàn)任意角度二維碼矯正的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!