国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<mark id="l9d71"></mark>

PaddleOCR訓(xùn)練自己模型（1）----數(shù)據(jù)準備

1年前作者：小女孩真可愛分類：Toy博客閱讀(25)違法舉報

這篇具有很好參考價值的文章主要介紹了PaddleOCR訓(xùn)練自己模型（1）----數(shù)據(jù)準備。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

一、下載地址：

PaddleOCR開源代碼（下載的是2.6RC版本的，可以根據(jù)自己需求下載）

具體環(huán)境安裝就不詳細介紹了，挺簡單的，也挺多教程的。

二、數(shù)據(jù)集準備及制作

（1）下載完代碼及配置完環(huán)境之后，運行PPOCRLabel.py文件，打開標注軟件（2.7版本的會運行報錯，解決方案如下）解決PPOCRLabel.py報錯operands could not be broadcast together with shapes (213,488,4) (1,1,3)-CSDN博客

PaddleOCR訓(xùn)練自己模型（1）----數(shù)據(jù)準備,機器學(xué)習(xí),深度學(xué)習(xí),人工智能

（2）運行成功后，點擊文件，導(dǎo)入圖片所在的路徑，然后點擊自動標注

PaddleOCR訓(xùn)練自己模型（1）----數(shù)據(jù)準備,機器學(xué)習(xí),深度學(xué)習(xí),人工智能

（3）自動標注完之后，核對每一張的標簽。核對完成之后點擊確認，否則導(dǎo)出的時候不會顯示

PaddleOCR訓(xùn)練自己模型（1）----數(shù)據(jù)準備,機器學(xué)習(xí),深度學(xué)習(xí),人工智能

（4）點擊左上角的文件，導(dǎo)出標記結(jié)果，導(dǎo)出識別結(jié)果。兩個文件都導(dǎo)出完之后，會多生成幾個文件。 PaddleOCR訓(xùn)練自己模型（1）----數(shù)據(jù)準備,機器學(xué)習(xí),深度學(xué)習(xí),人工智能

?

（5）在PaddleOCR下創(chuàng)建一個train_data文件夾，然后將標注好的整個文件夾復(fù)制到train_data里。

PaddleOCR訓(xùn)練自己模型（1）----數(shù)據(jù)準備,機器學(xué)習(xí),深度學(xué)習(xí),人工智能

（6）打開PPOCRLabel/gen_ocr_train_val_test.py文件，把路徑修改為自己的路徑，然后運行g(shù)en_ocr_train_val_test.py

PaddleOCR訓(xùn)練自己模型（1）----數(shù)據(jù)準備,機器學(xué)習(xí),深度學(xué)習(xí),人工智能

（7）運行結(jié)束之后會在train_data里面生成det和rec兩個文件夾，分別對應(yīng)定位和文字識別的數(shù)據(jù)

使用2.6版本代碼生成的txt文件會有空行，訓(xùn)練時會報錯估計是bug。如果有空行可以通過下面代碼來修改，把det和rec兩個文件夾下的txt文件都修改（代碼路徑自行修改）文章來源地址http://www.zghlxwxcb.cn/news/detail-853032.html

import os
import json

# 1.讀取txt文件， 把文件里的空行去除,并更新到原文件
txt_path = r"D:\Github_Code\PaddleOCR\train_data\rec\train.txt"

# 讀取txt文件， 把文件里的空行去除,并更新到原文件
def read_txt(txt_path):
    with open(txt_path, 'r', encoding='utf-8') as f:
        lines = f.readlines()
    new_lines = []
    for line in lines:
        if line.strip() != '':
            new_lines.append(line)
    with open(txt_path, 'w', encoding='utf-8') as f:
        f.writelines(new_lines)
    return new_lines

lines = read_txt(txt_path)

到了這里，關(guān)于PaddleOCR訓(xùn)練自己模型（1）----數(shù)據(jù)準備的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

基于TF-IDF+Tensorflow+pyQT+孿生神經(jīng)網(wǎng)絡(luò)的智能聊天機器人（深度學(xué)習(xí)）含全部工程源碼及模型+訓(xùn)練數(shù)據(jù)集
本項目利用TF-IDF（Term Frequency-Inverse Document Frequency 詞頻-逆文檔頻率）檢索模型和CNN（卷積神經(jīng)網(wǎng)絡(luò)）精排模型構(gòu)建了一個聊天機器人，旨在實現(xiàn)一個能夠進行日常對話和情感陪伴的聊天機器人。首先，我們使用TF-IDF技術(shù)構(gòu)建了一個檢索模型。TF-IDF可以衡量一個詞語在文檔中
2024年02月12日
瀏覽(92)
基于TF-IDF+Tensorflow+PyQt+孿生神經(jīng)網(wǎng)絡(luò)的智能聊天機器人（深度學(xué)習(xí)）含全部Python工程源碼及模型+訓(xùn)練數(shù)據(jù)集
本項目利用TF-IDF（Term Frequency-Inverse Document Frequency 詞頻-逆文檔頻率）檢索模型和CNN（卷積神經(jīng)網(wǎng)絡(luò)）精排模型構(gòu)建了一個聊天機器人，旨在實現(xiàn)一個能夠進行日常對話和情感陪伴的聊天機器人。首先，我們使用TF-IDF技術(shù)構(gòu)建了一個檢索模型。TF-IDF可以衡量一個詞語在文檔中
2024年02月13日
瀏覽(97)
機器人技能學(xué)習(xí)-構(gòu)建自己的數(shù)據(jù)集并進行訓(xùn)練
若想訓(xùn)練自己的場景，數(shù)據(jù)集的重要性不做過多贅述，下面就基于 robomimic 和 robosuite 構(gòu)建自己的數(shù)據(jù)集進行講解，同時，也會附上 train 和 run 的流程，這樣，就形成了閉環(huán)。采集數(shù)據(jù)可使用腳本 collect_human_demonstrations.py 完成,在采集過程中,需要自己定義 env 的相關(guān)信息,在實際
2024年01月16日
瀏覽(19)
深度學(xué)習(xí)：使用UNet做圖像語義分割，訓(xùn)練自己制作的數(shù)據(jù)集，詳細教程
語義分割(Semantic Segmentation)是圖像處理和機器視覺一個重要分支。與分類任務(wù)不同，語義分割需要判斷圖像每個像素點的類別，進行精確分割。語義分割目前在自動駕駛、自動摳圖、醫(yī)療影像等領(lǐng)域有著比較廣泛的應(yīng)用。我總結(jié)了使用UNet網(wǎng)絡(luò)做圖像語義分割的方法，教程很詳
2024年02月03日
瀏覽(43)
【機器學(xué)習(xí)】驗證集loss震蕩（loss的其他問題）訓(xùn)練深度學(xué)習(xí)模型loss為nan的原因
訓(xùn)練過程中發(fā)現(xiàn)，train loss一直下降，train acc一直上升；但是val loss、val acc卻一直震蕩。loss一會上一會下，但是總體趨勢是向下的。 “l(fā)oss震蕩但驗證集準確率總體下降” 如何解決？測試集準確率這樣震蕩是正常的嗎？ - 李峰的回答 - 知乎很多經(jīng)驗：loss問題匯總（不收斂、
2024年02月12日
瀏覽(64)
Yolov8改進模型后使用預(yù)訓(xùn)練權(quán)重遷移學(xué)習(xí)訓(xùn)練自己的數(shù)據(jù)集
yolov8 github下載 1、此時確保自己的數(shù)據(jù)集格式是yolo 格式的（不會的去搜教程轉(zhuǎn)下格式）。你的自制數(shù)據(jù)集文件夾擺放主目錄文件夾擺放自制數(shù)據(jù)集data.yaml文件路徑模板 2、把data.yaml放在yolov8–ultralytics-datasets文件夾下面 3、然后模型配置改進yaml文件在主目錄新建文件夾v8_
2024年02月06日
瀏覽(27)
TensorFlow學(xué)習(xí)：使用官方模型和自己的訓(xùn)練數(shù)據(jù)進行圖片分類
教程來源：清華大佬重講機器視覺！TensorFlow+Opencv：深度學(xué)習(xí)機器視覺圖像處理實戰(zhàn)教程，物體檢測/缺陷檢測/圖像識別注：這個教程與官網(wǎng)教程有些區(qū)別，教程里的api比較舊，核心思想是沒有變化的。上一篇文章 TensorFlow學(xué)習(xí)：使用官方模型進行圖像分類、使用自己的數(shù)據(jù)
2024年02月08日
瀏覽(31)
深度學(xué)習(xí)：使用UNet做圖像語義分割，訓(xùn)練自己制作的數(shù)據(jù)集并推理測試（詳細圖文教程）
語義分割(Semantic Segmentation)是圖像處理和機器視覺一個重要分支。與分類任務(wù)不同，語義分割需要判斷圖像每個像素點的類別，進行精確分割。語義分割目前在自動駕駛、自動摳圖、醫(yī)療影像等領(lǐng)域有著比較廣泛的應(yīng)用。我總結(jié)了使用UNet網(wǎng)絡(luò)做圖像語義分割的方法，教程很詳
2024年01月18日
瀏覽(35)
用合成數(shù)據(jù)訓(xùn)練托盤檢測模型【機器學(xué)習(xí)】
想象一下，你是一名機器人或機器學(xué)習(xí) (ML) 工程師，負責(zé)開發(fā)一個模型來檢測托盤，以便叉車可以操縱它們。 ?你熟悉傳統(tǒng)的深度學(xué)習(xí)流程，已經(jīng)整理了手動標注的數(shù)據(jù)集，并且已經(jīng)訓(xùn)練了成功的模型。推薦：用 NSDT設(shè)計器快速搭建可編程3D場景。你已準備好迎接下一個挑
2024年02月14日
瀏覽(20)
Azure 機器學(xué)習(xí) - 使用自動化機器學(xué)習(xí)訓(xùn)練計算機視覺模型的數(shù)據(jù)架構(gòu)
了解如何設(shè)置Azure Machine Learning JSONL 文件格式，以便在訓(xùn)練和推理期間在計算機視覺任務(wù)的自動化 ML 實驗中使用數(shù)據(jù)。關(guān)注TechLead，分享AI全維度知識。作者擁有10+年互聯(lián)網(wǎng)服務(wù)架構(gòu)、AI產(chǎn)品研發(fā)經(jīng)驗、團隊管理經(jīng)驗，同濟本復(fù)旦碩，復(fù)旦機器人智能實驗室成員，阿里云認證的
2024年02月05日
瀏覽(25)