STEP1:安裝pillow ,pillow-pil ,pytesseract
pip install pillow
pip install pillow-pil?
pip install pillow-pil
安裝完后,可以用
pip list
查看是否安裝成功。若是列表中有,則安裝成功。
STEP2:安裝Tesseract
?下載地址:Index of /tesseract
下載完成后雙擊.exe文件進(jìn)行安裝,語言包這個地方選一下(若是太慢,這個地方不選,后期再裝語言包也可以),其他就直接下一步下一步就行,安裝目錄需要記住,后面添加環(huán)境變量需要用到
????????????????
?安裝完后添加環(huán)境變量,win + R 打開運行窗口,輸入sysdm.cpl 或直接電腦屬性->高級系統(tǒng)設(shè)置
或?
?
?查看是否安裝成功:
運行窗口輸入cmd執(zhí)行tesseract -v
tesseract -v
?出現(xiàn)版本號信息說明安裝成功
?文章來源地址http://www.zghlxwxcb.cn/news/detail-600767.html
? ? ? ??
具體可參考Tesseract-OCR 下載安裝和使用_半濠春水的博客-CSDN博客_tesseract-ocr下載
STEP3:python代碼提取文字
???文件目錄:
test.jpg文件內(nèi)容
?python代碼
from PIL import Image
import pytesseract
def demo():
image = Image.open('images/test.jpg')
# lang='chi_sim'是設(shè)置成中文識別
text = pytesseract.image_to_string(image,lang='chi_sim')
print(text)
if __name__ == "__main__":
demo()
?執(zhí)行python index.py
輸出結(jié)果:
?文章來源:http://www.zghlxwxcb.cn/news/detail-600767.html
?
?
到了這里,關(guān)于python提取圖片文字的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!