提示:本文多圖,請(qǐng)手機(jī)端注意流量。
前言
利用python做圖片識(shí)別,識(shí)別提取圖片中的文字會(huì)有很多方法,但是想要簡(jiǎn)單一點(diǎn)怎么辦,那就可以使用tesseract識(shí)別引擎來實(shí)現(xiàn),一行代碼就可以做到提取圖片文本。
一、配置環(huán)境
1. 安裝python依賴
本程序用到了兩個(gè)python庫,pytesseract和PIL,所以先來安裝。
運(yùn)行以下命令
pip install Pillow
pip install pytesseract
如果在python中沒有報(bào)錯(cuò),說明程序安裝成功,
2. 安裝識(shí)別引擎
安裝完以上兩個(gè)依賴還需要對(duì)應(yīng)的識(shí)別引擎。點(diǎn)擊去下載
咱們直接使用5月10號(hào)構(gòu)建的最新版本。
安裝tesseract識(shí)別引擎(可跳過)
下載完成后打開程序進(jìn)行安裝,先選擇語言,這里選擇英語English
就行,然后點(diǎn)ok
接下來就是next
,完了點(diǎn)擊I Agree
同意協(xié)議,
為所有用戶安裝,然后點(diǎn)next
,如圖,
接下來安裝中文的語言包用來識(shí)別中文
,需要滑到下面,選擇中文,我這里橫排簡(jiǎn)體中文和豎排簡(jiǎn)體中文都選擇了,完成后點(diǎn)擊next,
選擇安裝路徑,建議安裝到C盤以外,然后點(diǎn)擊next
這里點(diǎn)擊安裝install
,
等待安裝完成
安裝完成后,點(diǎn)擊next
,再點(diǎn)擊finish
完成安裝,
驗(yàn)證是否安裝成功
添加環(huán)境變量,就是你安裝到的那個(gè)文件夾路徑,直接加到path里面,
然后在命令行運(yùn)行tesseract -v
,如果和下圖一樣,說明你已經(jīng)安裝成功了,
二、使用步驟
1.引入庫
from PIL import Image
import pytesseract
2.提取圖片文字
將讀取圖片的一行代碼封裝為一個(gè)函數(shù),
def read_image(name):
print(pytesseract.image_to_string(Image.open(name), lang='chi_sim'))
在main
函數(shù)中直接調(diào)用即可,
def main():
read_image('1657158527412.jpg')
3.運(yùn)行效果
以以下圖片為例,
運(yùn)行效果如下,文章來源:http://www.zghlxwxcb.cn/news/detail-785341.html
總結(jié)
本文介紹了tesseract的python調(diào)用,也就是pytesseract庫,其中還有一些其他的內(nèi)容并沒有涉及,僅涉及到了圖片提取文字,如果你對(duì)其感興趣,可以深入探索一下,也希望能和我探討一下。文章來源地址http://www.zghlxwxcb.cn/news/detail-785341.html
完整代碼
from PIL import Image
import pytesseract
def read_image(name):
print(pytesseract.image_to_string(Image.open(name), lang='chi_sim'))
def main():
read_image('img.png')
if __name__ == '__main__':
main()
到了這里,關(guān)于【Python ? 圖片識(shí)別】pytesseract快速識(shí)別提取圖片中的文字的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!