国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

金融OCR領(lǐng)域?qū)嵙?xí)日志（一）

2年前作者：introversi0n分類：Toy博客閱讀(18)違法舉報

這篇具有很好參考價值的文章主要介紹了金融OCR領(lǐng)域?qū)嵙?xí)日志（一）。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點(diǎn)擊"舉報違法"按鈕提交疑問。

一、OCR基礎(chǔ)

任務(wù)要求：

金融OCR領(lǐng)域?qū)嵙?xí)日志（一）,實(shí)驗(yàn)報告,金融,ocr

工作原理

OCR（Optical Character Recognition，光學(xué)字符識別）是指電子設(shè)備（例如掃描儀或數(shù)碼相）檢查紙上打印的字符，經(jīng)過檢測暗、亮的模式肯定其形狀，而后用字符識別方法將形狀翻譯成計算機(jī)文字的過程;即，針對印刷體字符，采用光學(xué)的方式將紙質(zhì)文檔中的文字轉(zhuǎn)換成為黑白點(diǎn)陣的圖像文件，并經(jīng)過識別軟件將圖像中的文字轉(zhuǎn)換成文本格式，供文字處理軟件進(jìn)一步編輯加工的技術(shù)。如何除錯或利用輔助信息提升識別正確率，是OCR最重要的課題，ICR（Intelligent Character Recognition）的名詞也隨之產(chǎn)生。

一般技術(shù)流程為：

金融OCR領(lǐng)域?qū)嵙?xí)日志（一）,實(shí)驗(yàn)報告,金融,ocr

應(yīng)用場景

根據(jù)OCR的應(yīng)用場景而言，我們可以大致分成識別特定場景下的專用OCR以及識別多種場景下的通用OCR。就前者而言，證件識別以及車牌識別就是專用OCR的典型案例。針對特定場景進(jìn)行設(shè)計、優(yōu)化以達(dá)到最好的特定場景下的效果展示。那通用的OCR就是使用在更多、更復(fù)雜的場景下，擁有比較好的泛性。在這個過程中由于場景的不確定性，比如:圖片背景極其豐富、亮度不均衡、光照不均衡、殘缺遮擋、文字扭曲、字體多樣等等問題，會帶來極大的挑戰(zhàn)。

**文檔文字識別：**可以將圖書館、報社、博物館、檔案館等的紙質(zhì)版圖書、報紙、雜志、歷史文獻(xiàn)檔案資料等進(jìn)行電子化管理，實(shí)現(xiàn)精準(zhǔn)地保存文獻(xiàn)資料。

**自然場景文字識別：**識別自然場景圖像中的文字信息如車牌、廣告干詞、路牌等信息。對車輛進(jìn)行識別可以實(shí)現(xiàn)停車場收費(fèi)管理、交通流量控制指標(biāo)測量、車輛定位、防盜、高速公路超速自動化監(jiān)管等功能。

**票據(jù)文字識別：**可以對增值稅發(fā)票、報銷單、車票等不同格式的票據(jù)進(jìn)行文字識別，可以避免財務(wù)人員手動輸入大量票據(jù)信息，如今已廣泛應(yīng)用于財務(wù)管理、銀行、金融等眾多領(lǐng)域。

**證件識別：**可以快速識別身份證、銀行卡、駕駛證等卡證類信息，將證件文字信息直接轉(zhuǎn)換為可編輯文本，可以大大提高工作效率、減少人工成本、還可以實(shí)時進(jìn)行相關(guān)人員的身份核驗(yàn)，以便安全管理。

以及金融領(lǐng)域具體應(yīng)用場景：

**自動化文檔處理：**通過OCR技術(shù)識別和提取文檔關(guān)鍵信息后，利用關(guān)鍵信息進(jìn)行文檔分類、文檔重命名、目錄創(chuàng)建與歸檔工作

**發(fā)票識別：**文字檢測+識別，根據(jù)發(fā)票內(nèi)容信息特點(diǎn)提取所需的內(nèi)容。

**合同分析：**通過OCR識別，智能結(jié)構(gòu)化抽取合同關(guān)鍵信息，支持圖片、PDF、word多種格式，可通過API接口傳輸至企業(yè)業(yè)務(wù)系統(tǒng)，協(xié)助企業(yè)工作人員完成自動填單、內(nèi)容一致性檢查，讓合同審閱更高效。

★商業(yè)化方案及其優(yōu)缺點(diǎn)

1.paddleOCR

飛槳首次開源文字識別模型套件PaddleOCR，目標(biāo)是打造豐富、領(lǐng)先、實(shí)用的文本識別模型/工具庫。最新開源的超輕量PP-OCRv3模型大小僅為16.2M。同時支持中英文識別；支持傾斜、豎排等多種方向文字識別；支持GPU、CPU預(yù)測；用戶既可以通過PaddleHub很便捷的直接使用該超輕量模型，也可以使用PaddleOCR開源套件訓(xùn)練自己的超輕量模型。

優(yōu)點(diǎn)
- 輕量模型，執(zhí)行速度快
- 支持pip直接安裝
- ocr識別效果好，效果基本可以比肩大廠收費(fèi)ocr（非高精版）
- 支持表格和方向識別
- 支持補(bǔ)充訓(xùn)練且很方便
缺點(diǎn)
- 部分符號識別效果一般，如 '|‘識別為’1’
- 對于部分加粗字體可能出現(xiàn)誤識別，需要自己補(bǔ)充訓(xùn)練
- 偶爾會出現(xiàn)部分內(nèi)容丟失的情況

源文檔配套教程：安裝使用說明

2.CnOCR

CnOCR 是 Python 3 下的文字識別（Optical Character Recognition，簡稱OCR）工具包，支持簡體中文、繁體中文（部分模型）、英文和數(shù)字的常見字符識別，支持豎排文字的識別。自帶了20+個訓(xùn)練好的識別模型，適用于不同應(yīng)用場景，安裝后即可直接使用。同時，CnOCR也提供簡單的訓(xùn)練命令供使用者訓(xùn)練自己的模型。

優(yōu)點(diǎn)
- 輕量模型，執(zhí)行速度快，速度略快于paddle ocr
- 支持pip直接安裝
- ocr識別效果好，識別效果比肩paddle ocr
- 支持訓(xùn)練自己的模型
缺點(diǎn)
- 部分符號識別效果差
- 部分場景下會出現(xiàn)空格丟失情況
- 模型補(bǔ)充訓(xùn)練沒有paddle ocr方便

源文檔配套教程：安裝使用說明

3.chinese_lite OCR

超輕量級中文 ocr，支持豎排文字識別, 支持 ncnn、mnn、tnn 推理, 模型大小僅4.7M。

優(yōu)點(diǎn)
- 輕量模型，執(zhí)行速度快，速度優(yōu)于CnOCR和Paddle OCR
- ocr識別效果尚可，優(yōu)于一般開源模型，但比不上CnOCR和Paddle OCR
- 作者提供了多種語言下的Demo
缺點(diǎn)
- 不支持pip安裝
- 文本位置識別略差
- 不支持補(bǔ)充訓(xùn)練
- 類手寫字體識別效果一般
- 部分場景下會出現(xiàn)誤識別豎版文字的情況

例如：

姓     名： 張三
性     別： 男
年     齡： 19
戶     籍： 北京

誤識別為 '姓性年戶'

原文配套：安裝使用說明

4.EasyOCR

EasyOCR是一個用于從圖像中提取文本的python模塊。它是一種通用的OCR，可以讀取自然場景文本和文檔中的密集文本。我們目前正在支持80多種語言并不斷擴(kuò)展。

優(yōu)點(diǎn)
- 支持pip安裝，但需要自己手動下載模型
- ocr識別效果尚可，優(yōu)于一般開源模型
缺點(diǎn)
- 速度很慢，900 * 1200像素圖片平均需要30s左右
- 不支持補(bǔ)充訓(xùn)練

5.Tesseract OCR

Tesserat OCR 是一款可在各種操作系統(tǒng)運(yùn)行的，由Google開發(fā)的OCR引擎。它可以免費(fèi)使用，并支持多種語言。雖然它沒有一個官方的云工具，但是它可以集成到各種編程語言和應(yīng)用程序中，因此可以很容易地創(chuàng)建自己的OCR云工具。

優(yōu)點(diǎn)
- 支持補(bǔ)充訓(xùn)練
缺點(diǎn)
- 安裝使用困難，不支持pip安裝，官網(wǎng)下載配置教程（Tesseract-OCR 下載安裝和使用）
- 中文識別效果差

官方文檔

6.Google Vision API

Google Cloud Vision API是谷歌提供的云端視覺分析服務(wù)，可以通過API調(diào)用來實(shí)現(xiàn)圖像分析、OCR文字識別等功能。相比于Tesseract OCR，它具有更強(qiáng)大的圖像分析能力和更便捷的使用方式。

總結(jié)

paddle ocr和cnocr，兩者都能實(shí)現(xiàn)商業(yè)化精準(zhǔn)度。其中cnocr執(zhí)行速度快，速度略快于paddle ocr識別效果比肩paddle ocr，但paddle ocr模型補(bǔ)充訓(xùn)練方便

某些場景下，如小圖片且對速度要求較高可以嘗試使用chinese_lite ocr.

此外由部分stackoverflow用戶反饋可知paddle和Tesseract的區(qū)別如下：

數(shù)據(jù)來源區(qū)別：Tesseract對印刷體掃描文檔效果更好，paddle更適用于手寫體等場景，但二者都支持訓(xùn)練
速度區(qū)別：CPU情況下T優(yōu)于P，但paddle在GPU支持下比Tesseract速度快出一大截
預(yù)處理區(qū)別：如果不提供預(yù)處理（例如二值化），對RGB圖像而言，paddle的效果優(yōu)于Tesseract。在二值化情況下Tesseract的長文本效果通常優(yōu)于paddle
正確率&精度差別：T的表現(xiàn)略高于P，主要原因是paddle主要有單詞和標(biāo)點(diǎn)之間缺少空格的問題，但易于糾正，在后處理算法之后精度與Tesseract相當(dāng)。且非90度旋轉(zhuǎn)中表現(xiàn)良好。
模型大?。篜的輕量級模型大小為2MB左右，T則為23MB左右
數(shù)據(jù)安全：……

某個國外帖子顯示的數(shù)據(jù)：

金融OCR領(lǐng)域?qū)嵙?xí)日志（一）,實(shí)驗(yàn)報告,金融,ocr

金融OCR領(lǐng)域?qū)嵙?xí)日志（一）,實(shí)驗(yàn)報告,金融,ocr

技術(shù)難點(diǎn)

1.不同拍攝角度:指通過正拍、斜拍和圖像反轉(zhuǎn)等不同角度進(jìn)行拍攝;

2.不同光線:指在亮光(可能會出現(xiàn)反光)、暗光和部分亮光部分暗光的情形下拍攝;

3.文字不清晰:指存在因污損、遮擋、折痕、印章、背景紋理等造成文字不清楚的樣本;

4.邊框不完整:主要指圖片樣本中物體(證件、票據(jù)、車牌等)邊框沒有完整出現(xiàn)在畫面中;

5.其他特殊情況:主要指卡證類樣本需考慮帶有少數(shù)民族文字、生僻字，同時考慮到證件等用于高安全場景，對復(fù)印、掃描、屏幕翻拍、PS等樣本進(jìn)行告警;印刷體樣本需考慮不同字號、不同排版方向，以及彎曲的文本。

評價指標(biāo)

OCR評價指標(biāo)包括字段粒度和字符粒度的識別效果評價指標(biāo)。

以字段為單位的統(tǒng)計和分析，適用于卡證類、票據(jù)類等結(jié)構(gòu)化程度較高的OCR應(yīng)用評測。
以字符(文字和標(biāo)點(diǎn)符號)為單位的統(tǒng)計和分析，適用于通用印刷體、手寫體類非結(jié)構(gòu)化數(shù)據(jù)的OCR應(yīng)用評測。具體指標(biāo)包括以下幾個:

金融OCR領(lǐng)域?qū)嵙?xí)日志（一）,實(shí)驗(yàn)報告,金融,ocr

金融OCR領(lǐng)域?qū)嵙?xí)日志（一）,實(shí)驗(yàn)報告,金融,ocr

此外，從服務(wù)角度來說，識出率（準(zhǔn)確率）、平均耗時（處理速度）、數(shù)據(jù)安全等也是衡量OCR系統(tǒng)好壞的指標(biāo)之一。

參考文檔

csdn:OCR入門教程系列（一）：OCR基礎(chǔ)導(dǎo)論

OCR識別技術(shù)的應(yīng)用：電子資料自動重命名與歸檔

csdn:6款開源中文OCR使用介紹（親測效果）

使用Tesseract OCR、Google Cloud Vision API的區(qū)別

Stack Overflow:與Tesseract相比，PaddleOCR的性能如何

Put to Test: PaddleOCR Engine Example and Benchmark

csdn:PaddleOCR訓(xùn)練屬于自己的模型詳細(xì)教程（從打標(biāo)，制作數(shù)據(jù)集，訓(xùn)練到應(yīng)用，以行駛證識別為例）

利用OCR解決增值稅發(fā)票內(nèi)容文本識別：涉及paddleOCR，區(qū)域分割，視平面變換

Tesseract-OCR 下載安裝和使用

Tesseract OCR 下載及安裝教程（中英文語言包）

python+Tesseract OCR實(shí)現(xiàn)截屏識別文字文章來源地址http://www.zghlxwxcb.cn/news/detail-823745.html

到了這里，關(guān)于金融OCR領(lǐng)域?qū)嵙?xí)日志（一）的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請點(diǎn)擊違法舉報進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

OCR - 微軟windows 11系統(tǒng)自帶的Windows OCR功能初體驗(yàn)
一、Power Automate簡述 ? ? ? ? 最近再了解一些ocr的相關(guān)信息，從一些網(wǎng)站上上看到微軟的免費(fèi)系統(tǒng)實(shí)用工具套件中包含ocr識別/pdf文本提取等。 ? ? ? ? 什么是Power Automate？ ???????Windows 11 允許用戶通過預(yù)裝的 Power Automate 應(yīng)用創(chuàng)建自動化。 Power Automate 是一個低代碼平臺，
2024年02月05日
瀏覽(26)
完全離線的OCR圖片轉(zhuǎn)文字識別工具Umi-OCR
OCR圖片轉(zhuǎn)文字識別軟件，完全離線。截屏/批量導(dǎo)入圖片，支持多國語言、合并段落、豎排文字?？膳懦^(qū)域，提取干凈的文本?；?PaddleOCR 。免費(fèi)：本項目所有代碼開源，完全免費(fèi)。方便：解壓即用，離線運(yùn)行，無需網(wǎng)絡(luò)。批量：可批量導(dǎo)入處理圖片，結(jié)果保存到本
2024年02月03日
瀏覽(23)
[C#]調(diào)用tesseact-ocr的traineddata模型進(jìn)行ocr文字識別
【框架地址】 https://github.com/charlesw/tesseract 【算法介紹】 Tesseract OCR是一個開源的光學(xué)字符識別引擎，它可以將圖像中的文字轉(zhuǎn)換成可編輯和可搜索的文本格式。Tesseract由惠普實(shí)驗(yàn)室于1985年開始開發(fā)，并在2005年被Google收購后成為了開源項目。自那時起，它一直在不斷的更新和
2024年02月02日
瀏覽(21)
Umi-OCR：開源、免費(fèi)、離線、多功能的 OCR 圖片文字識別軟件
官方版本說明不同版本僅OCR引擎插件不同，其它功能完全一致。均支持 win7 x64 及以上的系統(tǒng)，附帶多國語言識別庫。 .7z.exe 為自解壓包，可以用壓縮軟件打開，也可以在沒有安裝壓縮軟件的電腦上直接雙擊解壓。 Paddle 引擎插件版（性能好，速度快，占用率高，適合高配機(jī)
2024年01月19日
瀏覽(59)
【身份證所有內(nèi)容識別】Windows 10平臺完整安裝使用Tesseract OCR進(jìn)行OCR識別
2024年02月11日
瀏覽(102)
100天精通Python（實(shí)用腳本篇）——第113天：基于Tesseract-OCR實(shí)現(xiàn)OCR圖片文字識別實(shí)戰(zhàn)
???? 本文已收錄于《100天精通Python從入門到就業(yè)》：本專欄專門針對零基礎(chǔ)和需要進(jìn)階提升的同學(xué)所準(zhǔn)備的一套完整教學(xué)，從0到100的不斷進(jìn)階深入，后續(xù)還有實(shí)戰(zhàn)項目，輕松應(yīng)對面試，專欄訂閱地址：https://blog.csdn.net/yuan2019035055/category_11466020.html 優(yōu)點(diǎn) ：訂閱限時9.9付費(fèi)專
2024年01月22日
瀏覽(29)
阿里云OCR識別
ocr識別證件照；主要是使用阿里云j接口： 1、注冊阿里云賬戶獲取appKey appSer 2、調(diào)用接口 2.1：定義常量 ?2.2 ：OCR識別工具: 主要是按照type調(diào)用個子的方法
2024年01月25日
瀏覽(17)
騰訊云OCR識別
目錄前言一、騰訊云身份驗(yàn)證二、使用API 2.1 Python OCR? API調(diào)用 2.2 JAVA?OCR? API調(diào)用 2.3?Go?OCR? API調(diào)用 ? ? ? ? ?2.4?Nodejs?OCR? API調(diào)用 2.5?.Net? API調(diào)用 2.6?C++? API調(diào)用三、代碼倉庫源碼提示：這里可以添加本文要記錄的大概內(nèi)容： ? 為了幫助同學(xué)們進(jìn)行OCR識別，本文一共
2024年02月06日
瀏覽(48)
OCR訓(xùn)練部署文檔
?以文本識別訓(xùn)練為例環(huán)境使用anconda創(chuàng)建了”paddle”的虛擬環(huán)境，該環(huán)境適合paddleOCR。數(shù)據(jù)準(zhǔn)備如圖1-1，數(shù)據(jù)集需要提供train_list.txt,和val_list.txt,具體內(nèi)容如圖1-2，修改配置文件位置圖1-3 ?圖1-1 圖1-2 train_list.txt,和val_list.txt具體內(nèi)容訓(xùn)練模型安裝Cmake，OpenCV，OpenCV-contribute
2024年02月09日
瀏覽(78)
OCR 01
* OCR 01: Code generated by OCR 01 * OCR 01:? * OCR 01: Prepare text model * OCR 01:? create_text_model_reader (\\\'manual\\\', [], TextModel) set_text_model_param (TextModel, \\\'is_dotprint\\\', \\\'true\\\') set_text_model_param (TextModel, \\\'char_width\\\', 42) set_text_model_param (TextModel, \\\'char_height\\\', 54) set_text_model_param (TextModel, \\\'stroke_width\\\', 18.5) set_tex
2024年02月07日
瀏覽(86)