一、下載地址:
PaddleOCR開源代碼(下載的是2.6RC版本的,可以根據(jù)自己需求下載)
具體環(huán)境安裝就不詳細介紹了, 挺簡單的,也挺多教程的。
二、數(shù)據(jù)集準備及制作
(1)下載完代碼及配置完環(huán)境之后,運行PPOCRLabel.py文件,打開標注軟件(2.7版本的會運行報錯,解決方案如下)解決PPOCRLabel.py報錯operands could not be broadcast together with shapes (213,488,4) (1,1,3)-CSDN博客
(2)運行成功后,點擊文件,導(dǎo)入圖片所在的路徑,然后點擊自動標注
(3)自動標注完之后,核對每一張的標簽。核對完成之后點擊確認,否則導(dǎo)出的時候不會顯示
(4)點擊左上角的文件,導(dǎo)出標記結(jié)果, 導(dǎo)出識別結(jié)果。兩個文件都導(dǎo)出完之后,會多生成幾個文件。
?
(5)在PaddleOCR下創(chuàng)建一個train_data文件夾,然后將標注好的整個文件夾復(fù)制到train_data里。
(6)打開PPOCRLabel/gen_ocr_train_val_test.py文件,把路徑修改為自己的路徑,然后運行g(shù)en_ocr_train_val_test.py
(7)運行結(jié)束之后會在train_data里面生成det和rec兩個文件夾,分別對應(yīng)定位和文字識別的數(shù)據(jù)文章來源:http://www.zghlxwxcb.cn/news/detail-853032.html
使用2.6版本代碼生成的txt文件會有空行,訓(xùn)練時會報錯估計是bug。如果有空行可以通過下面代碼來修改,把det和rec兩個文件夾下的txt文件都修改(代碼路徑自行修改)文章來源地址http://www.zghlxwxcb.cn/news/detail-853032.html
import os
import json
# 1.讀取txt文件, 把文件里的空行去除,并更新到原文件
txt_path = r"D:\Github_Code\PaddleOCR\train_data\rec\train.txt"
# 讀取txt文件, 把文件里的空行去除,并更新到原文件
def read_txt(txt_path):
with open(txt_path, 'r', encoding='utf-8') as f:
lines = f.readlines()
new_lines = []
for line in lines:
if line.strip() != '':
new_lines.append(line)
with open(txt_path, 'w', encoding='utf-8') as f:
f.writelines(new_lines)
return new_lines
lines = read_txt(txt_path)
到了這里,關(guān)于PaddleOCR訓(xùn)練自己模型(1)----數(shù)據(jù)準備的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!