国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

金融OCR領(lǐng)域?qū)嵙?xí)日志(一)

這篇具有很好參考價值的文章主要介紹了金融OCR領(lǐng)域?qū)嵙?xí)日志(一)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報違法"按鈕提交疑問。

一、OCR基礎(chǔ)

任務(wù)要求:

金融OCR領(lǐng)域?qū)嵙?xí)日志(一),實(shí)驗(yàn)報告,金融,ocr

工作原理

OCR(Optical Character Recognition,光學(xué)字符識別)是指電子設(shè)備(例如掃描儀或數(shù)碼相)檢查紙上打印的字符,經(jīng)過檢測暗、亮的模式肯定其形狀,而后用字符識別方法將形狀翻譯成計算機(jī)文字的過程;即,針對印刷體字符,采用光學(xué)的方式將紙質(zhì)文檔中的文字轉(zhuǎn)換成為黑白點(diǎn)陣的圖像文件,并經(jīng)過識別軟件將圖像中的文字轉(zhuǎn)換成文本格式,供文字處理軟件進(jìn)一步編輯加工的技術(shù)。如何除錯或利用輔助信息提升識別正確率,是OCR最重要的課題,ICR(Intelligent Character Recognition)的名詞也隨之產(chǎn)生。

一般技術(shù)流程為:

金融OCR領(lǐng)域?qū)嵙?xí)日志(一),實(shí)驗(yàn)報告,金融,ocr

應(yīng)用場景

根據(jù)OCR的應(yīng)用場景而言,我們可以大致分成識別特定場景下的專用OCR以及識別多種場景下的通用OCR。就前者而言,證件識別以及車牌識別就是專用OCR的典型案例。針對特定場景進(jìn)行設(shè)計、優(yōu)化以達(dá)到最好的特定場景下的效果展示。那通用的OCR就是使用在更多、更復(fù)雜的場景下,擁有比較好的泛性。在這個過程中由于場景的不確定性,比如:圖片背景極其豐富、亮度不均衡、光照不均衡、殘缺遮擋、文字扭曲、字體多樣等等問題,會帶來極大的挑戰(zhàn)。

**文檔文字識別:**可以將圖書館、報社、博物館、檔案館等的紙質(zhì)版圖書、報紙、雜志、歷史文獻(xiàn)檔案資料等進(jìn)行電子化管理,實(shí)現(xiàn)精準(zhǔn)地保存文獻(xiàn)資料。

**自然場景文字識別:**識別自然場景圖像中的文字信息如車牌、廣告干詞、路牌等信息。對車輛進(jìn)行識別可以實(shí)現(xiàn)停車場收費(fèi)管理、交通流量控制指標(biāo)測量、車輛定位、防盜、高速公路超速自動化監(jiān)管等功能。

**票據(jù)文字識別:**可以對增值稅發(fā)票、報銷單、車票等不同格式的票據(jù)進(jìn)行文字識別,可以避免財務(wù)人員手動輸入大量票據(jù)信息,如今已廣泛應(yīng)用于財務(wù)管理、銀行、金融等眾多領(lǐng)域。

**證件識別:**可以快速識別身份證、銀行卡、駕駛證等卡證類信息,將證件文字信息直接轉(zhuǎn)換為可編輯文本,可以大大提高工作效率、減少人工成本、還可以實(shí)時進(jìn)行相關(guān)人員的身份核驗(yàn),以便安全管理。

以及金融領(lǐng)域具體應(yīng)用場景:

**自動化文檔處理:**通過OCR技術(shù)識別和提取文檔關(guān)鍵信息后,利用關(guān)鍵信息進(jìn)行文檔分類、文檔重命名、目錄創(chuàng)建與歸檔工作

**發(fā)票識別:**文字檢測+識別,根據(jù)發(fā)票內(nèi)容信息特點(diǎn)提取所需的內(nèi)容。

**合同分析:**通過OCR識別,智能結(jié)構(gòu)化抽取合同關(guān)鍵信息,支持圖片、PDF、word多種格式,可通過API接口傳輸至企業(yè)業(yè)務(wù)系統(tǒng),協(xié)助企業(yè)工作人員完成自動填單、內(nèi)容一致性檢查,讓合同審閱更高效。

★商業(yè)化方案及其優(yōu)缺點(diǎn)

1.paddleOCR

飛槳首次開源文字識別模型套件PaddleOCR,目標(biāo)是打造豐富、領(lǐng)先、實(shí)用的文本識別模型/工具庫。最新開源的超輕量PP-OCRv3模型大小僅為16.2M。同時支持中英文識別;支持傾斜、豎排等多種方向文字識別;支持GPU、CPU預(yù)測;用戶既可以通過PaddleHub很便捷的直接使用該超輕量模型,也可以使用PaddleOCR開源套件訓(xùn)練自己的超輕量模型。

  • 優(yōu)點(diǎn)

    • 輕量模型,執(zhí)行速度快

    • 支持pip直接安裝

    • ocr識別效果好,效果基本可以比肩大廠收費(fèi)ocr(非高精版)

    • 支持表格和方向識別

    • 支持補(bǔ)充訓(xùn)練且很方便

  • 缺點(diǎn)

    • 部分符號識別效果一般,如 '|‘識別為’1’

    • 對于部分加粗字體可能出現(xiàn)誤識別,需要自己補(bǔ)充訓(xùn)練

    • 偶爾會出現(xiàn)部分內(nèi)容丟失的情況

源文檔配套教程:安裝使用說明

2.CnOCR

CnOCR 是 Python 3 下的文字識別(Optical Character Recognition,簡稱OCR)工具包,支持簡體中文、繁體中文(部分模型)、英文和數(shù)字的常見字符識別,支持豎排文字的識別。自帶了20+個訓(xùn)練好的識別模型,適用于不同應(yīng)用場景,安裝后即可直接使用。同時,CnOCR也提供簡單的訓(xùn)練命令供使用者訓(xùn)練自己的模型。

  • 優(yōu)點(diǎn)
    • 輕量模型,執(zhí)行速度快,速度略快于paddle ocr
    • 支持pip直接安裝
    • ocr識別效果好,識別效果比肩paddle ocr
    • 支持訓(xùn)練自己的模型
  • 缺點(diǎn)
    • 部分符號識別效果差
    • 部分場景下會出現(xiàn)空格丟失情況
    • 模型補(bǔ)充訓(xùn)練沒有paddle ocr方便

源文檔配套教程:安裝使用說明

3.chinese_lite OCR

超輕量級中文 ocr,支持豎排文字識別, 支持 ncnn、mnn、tnn 推理, 模型大小僅4.7M。

  • 優(yōu)點(diǎn)

    • 輕量模型,執(zhí)行速度快,速度優(yōu)于CnOCR和Paddle OCR

    • ocr識別效果尚可,優(yōu)于一般開源模型,但比不上CnOCR和Paddle OCR

    • 作者提供了多種語言下的Demo

  • 缺點(diǎn)

    • 不支持pip安裝
    • 文本位置識別略差
    • 不支持補(bǔ)充訓(xùn)練
    • 類手寫字體識別效果一般
    • 部分場景下會出現(xiàn)誤識別豎版文字的情況

例如:

姓     名: 張三
性     別: 男
年     齡: 19
戶     籍: 北京

誤識別為 '姓性年戶'

原文配套:安裝使用說明

4.EasyOCR

EasyOCR是一個用于從圖像中提取文本的python模塊。它是一種通用的OCR,可以讀取自然場景文本和文檔中的密集文本。我們目前正在支持80多種語言并不斷擴(kuò)展。

  • 優(yōu)點(diǎn)

    • 支持pip安裝,但需要自己手動下載模型

    • ocr識別效果尚可,優(yōu)于一般開源模型

  • 缺點(diǎn)

    • 速度很慢,900 * 1200像素圖片平均需要30s左右

    • 不支持補(bǔ)充訓(xùn)練

5.Tesseract OCR

Tesserat OCR 是一款可在各種操作系統(tǒng)運(yùn)行的 ,由Google開發(fā)的OCR引擎。它可以免費(fèi)使用,并支持多種語言。雖然它沒有一個官方的云工具,但是它可以集成到各種編程語言和應(yīng)用程序中,因此可以很容易地創(chuàng)建自己的OCR云工具。

  • 優(yōu)點(diǎn)

    • 支持補(bǔ)充訓(xùn)練
  • 缺點(diǎn)

    • 安裝使用困難,不支持pip安裝,官網(wǎng)下載配置教程(Tesseract-OCR 下載安裝和使用)

    • 中文識別效果差

官方文檔

6.Google Vision API

Google Cloud Vision API是谷歌提供的云端視覺分析服務(wù),可以通過API調(diào)用來實(shí)現(xiàn)圖像分析、OCR文字識別等功能。相比于Tesseract OCR,它具有更強(qiáng)大的圖像分析能力和更便捷的使用方式。

總結(jié)

paddle ocr和cnocr,兩者都能實(shí)現(xiàn)商業(yè)化精準(zhǔn)度。其中cnocr執(zhí)行速度快,速度略快于paddle ocr識別效果比肩paddle ocr,但paddle ocr模型補(bǔ)充訓(xùn)練方便

某些場景下,如小圖片且對速度要求較高可以嘗試使用chinese_lite ocr.

此外由部分stackoverflow用戶反饋可知paddle和Tesseract的區(qū)別如下

  • 數(shù)據(jù)來源區(qū)別:Tesseract對印刷體掃描文檔效果更好,paddle更適用于手寫體等場景,但二者都支持訓(xùn)練

  • 速度區(qū)別:CPU情況下T優(yōu)于P,但paddle在GPU支持下比Tesseract速度快出一大截

  • 預(yù)處理區(qū)別:如果不提供預(yù)處理(例如二值化),對RGB圖像而言,paddle的效果優(yōu)于Tesseract。在二值化情況下Tesseract的長文本效果通常優(yōu)于paddle

  • 正確率&精度差別:T的表現(xiàn)略高于P,主要原因是paddle主要有單詞和標(biāo)點(diǎn)之間缺少空格的問題,但易于糾正,在后處理算法之后精度與Tesseract相當(dāng)。且非90度旋轉(zhuǎn)中表現(xiàn)良好。

  • 模型大?。篜的輕量級模型大小為2MB左右,T則為23MB左右

  • 數(shù)據(jù)安全:……

某個國外帖子顯示的數(shù)據(jù):

金融OCR領(lǐng)域?qū)嵙?xí)日志(一),實(shí)驗(yàn)報告,金融,ocr

金融OCR領(lǐng)域?qū)嵙?xí)日志(一),實(shí)驗(yàn)報告,金融,ocr

技術(shù)難點(diǎn)

1.不同拍攝角度:指通過正拍、斜拍和圖像反轉(zhuǎn)等不同角度進(jìn)行拍攝;

2.不同光線:指在亮光(可能會出現(xiàn)反光)、暗光和部分亮光部分暗光的情形下拍攝;

3.文字不清晰:指存在因污損、遮擋、折痕、印章、背景紋理等造成文字不清楚的樣本;

4.邊框不完整:主要指圖片樣本中物體(證件、票據(jù)、車牌等)邊框沒有完整出現(xiàn)在畫面中;

5.其他特殊情況:主要指卡證類樣本需考慮帶有少數(shù)民族文字、生僻字,同時考慮到證件等用于高安全場景,對復(fù)印、掃描、屏幕翻拍、PS等樣本進(jìn)行告警;印刷體樣本需考慮不同字號、不同排版方向,以及彎曲的文本。

評價指標(biāo)

OCR評價指標(biāo)包括字段粒度和字符粒度的識別效果評價指標(biāo)。

  • 以字段為單位的統(tǒng)計和分析,適用于卡證類、票據(jù)類等結(jié)構(gòu)化程度較高的OCR應(yīng)用評測。
  • 以字符(文字和標(biāo)點(diǎn)符號)為單位的統(tǒng)計和分析,適用于通用印刷體、手寫體類非結(jié)構(gòu)化數(shù)據(jù)的OCR應(yīng)用評測。具體指標(biāo)包括以下幾個:

金融OCR領(lǐng)域?qū)嵙?xí)日志(一),實(shí)驗(yàn)報告,金融,ocr

金融OCR領(lǐng)域?qū)嵙?xí)日志(一),實(shí)驗(yàn)報告,金融,ocr

此外,從服務(wù)角度來說,識出率(準(zhǔn)確率)、平均耗時(處理速度)、數(shù)據(jù)安全等也是衡量OCR系統(tǒng)好壞的指標(biāo)之一。

參考文檔

csdn:OCR入門教程系列(一):OCR基礎(chǔ)導(dǎo)論

OCR識別技術(shù)的應(yīng)用:電子資料自動重命名與歸檔

csdn:6款開源中文OCR使用介紹(親測效果)

使用Tesseract OCR、Google Cloud Vision API的區(qū)別

Stack Overflow:與Tesseract相比,PaddleOCR的性能如何

Put to Test: PaddleOCR Engine Example and Benchmark

csdn:PaddleOCR訓(xùn)練屬于自己的模型詳細(xì)教程(從打標(biāo),制作數(shù)據(jù)集,訓(xùn)練到應(yīng)用,以行駛證識別為例)

利用OCR解決增值稅發(fā)票內(nèi)容文本識別:涉及paddleOCR,區(qū)域分割,視平面變換

Tesseract-OCR 下載安裝和使用

Tesseract OCR 下載及安裝教程 (中英文語言包)

python+Tesseract OCR實(shí)現(xiàn)截屏識別文字文章來源地址http://www.zghlxwxcb.cn/news/detail-823745.html

到了這里,關(guān)于金融OCR領(lǐng)域?qū)嵙?xí)日志(一)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • OCR - 微軟windows 11系統(tǒng)自帶的Windows OCR功能初體驗(yàn)

    一、Power Automate簡述 ? ? ? ? 最近再了解一些ocr的相關(guān)信息,從一些網(wǎng)站上上看到微軟的免費(fèi)系統(tǒng)實(shí)用工具套件中包含ocr識別/pdf文本提取等。 ? ? ? ? 什么是Power Automate? ???????Windows 11 允許用戶通過預(yù)裝的 Power Automate 應(yīng)用創(chuàng)建自動化。 Power Automate 是一個低代碼平臺,

    2024年02月05日
    瀏覽(26)
  • 完全離線的OCR圖片轉(zhuǎn)文字識別工具Umi-OCR

    完全離線的OCR圖片轉(zhuǎn)文字識別工具Umi-OCR

    OCR圖片轉(zhuǎn)文字識別軟件,完全離線。截屏/批量導(dǎo)入圖片,支持多國語言、合并段落、豎排文字??膳懦^(qū)域,提取干凈的文本?;?PaddleOCR 。 免費(fèi):本項目所有代碼開源,完全免費(fèi)。 方便:解壓即用,離線運(yùn)行,無需網(wǎng)絡(luò)。 批量:可批量導(dǎo)入處理圖片,結(jié)果保存到本

    2024年02月03日
    瀏覽(23)
  • [C#]調(diào)用tesseact-ocr的traineddata模型進(jìn)行ocr文字識別

    [C#]調(diào)用tesseact-ocr的traineddata模型進(jìn)行ocr文字識別

    【框架地址】 https://github.com/charlesw/tesseract 【算法介紹】 Tesseract OCR是一個開源的光學(xué)字符識別引擎,它可以將圖像中的文字轉(zhuǎn)換成可編輯和可搜索的文本格式。Tesseract由惠普實(shí)驗(yàn)室于1985年開始開發(fā),并在2005年被Google收購后成為了開源項目。自那時起,它一直在不斷的更新和

    2024年02月02日
    瀏覽(21)
  • Umi-OCR:開源、免費(fèi)、離線、多功能的 OCR 圖片文字識別軟件

    官方版本說明 不同版本僅OCR引擎插件不同,其它功能完全一致。 均支持 win7 x64 及以上的系統(tǒng),附帶多國語言識別庫。 .7z.exe 為自解壓包,可以用壓縮軟件打開,也可以在沒有安裝壓縮軟件的電腦上直接雙擊解壓。 Paddle 引擎插件版 (性能好,速度快,占用率高,適合高配機(jī)

    2024年01月19日
    瀏覽(59)
  • 100天精通Python(實(shí)用腳本篇)——第113天:基于Tesseract-OCR實(shí)現(xiàn)OCR圖片文字識別實(shí)戰(zhàn)

    100天精通Python(實(shí)用腳本篇)——第113天:基于Tesseract-OCR實(shí)現(xiàn)OCR圖片文字識別實(shí)戰(zhàn)

    ???? 本文已收錄于 《100天精通Python從入門到就業(yè)》:本專欄專門針對零基礎(chǔ)和需要進(jìn)階提升的同學(xué)所準(zhǔn)備的一套完整教學(xué),從0到100的不斷進(jìn)階深入,后續(xù)還有實(shí)戰(zhàn)項目,輕松應(yīng)對面試,專欄訂閱地址:https://blog.csdn.net/yuan2019035055/category_11466020.html 優(yōu)點(diǎn) : 訂閱限時9.9付費(fèi)專

    2024年01月22日
    瀏覽(29)
  • 阿里云OCR識別

    ocr識別證件照;主要是使用阿里云j接口: 1、注冊阿里云賬戶獲取appKey appSer 2、調(diào)用接口 2.1:定義常量 ?2.2 :OCR識別工具: 主要是按照type調(diào)用個子的方法

    2024年01月25日
    瀏覽(17)
  • 騰訊云OCR識別

    騰訊云OCR識別

    目錄 前言 一、騰訊云身份驗(yàn)證 二、使用API 2.1 Python OCR? API調(diào)用 2.2 JAVA?OCR? API調(diào)用 2.3?Go?OCR? API調(diào)用 ? ? ? ? ?2.4?Nodejs?OCR? API調(diào)用 2.5?.Net? API調(diào)用 2.6?C++? API調(diào)用 三、代碼倉庫源碼 提示:這里可以添加本文要記錄的大概內(nèi)容: ? 為了幫助同學(xué)們進(jìn)行OCR識別,本文一共

    2024年02月06日
    瀏覽(48)
  • OCR訓(xùn)練部署文檔

    OCR訓(xùn)練部署文檔

    ?以文本識別訓(xùn)練為例 環(huán)境使用anconda創(chuàng)建了”paddle”的虛擬環(huán)境,該環(huán)境適合paddleOCR。 數(shù)據(jù)準(zhǔn)備 如圖1-1,數(shù)據(jù)集需要提供train_list.txt,和val_list.txt,具體內(nèi)容如圖1-2,修改配置文件位置圖1-3 ?圖1-1 圖1-2 train_list.txt,和val_list.txt具體內(nèi)容 訓(xùn)練模型 安裝Cmake,OpenCV,OpenCV-contribute

    2024年02月09日
    瀏覽(78)
  • OCR 01

    * OCR 01: Code generated by OCR 01 * OCR 01:? * OCR 01: Prepare text model * OCR 01:? create_text_model_reader (\\\'manual\\\', [], TextModel) set_text_model_param (TextModel, \\\'is_dotprint\\\', \\\'true\\\') set_text_model_param (TextModel, \\\'char_width\\\', 42) set_text_model_param (TextModel, \\\'char_height\\\', 54) set_text_model_param (TextModel, \\\'stroke_width\\\', 18.5) set_tex

    2024年02月07日
    瀏覽(86)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包