
我們知道,金鳴識(shí)別要將橫豎線齊全的表格圖片轉(zhuǎn)為excel非常簡單,但要是表格線不齊全甚至沒有表格線的圖片呢?這就沒那么容易了,在識(shí)別這類圖片時(shí),我們一般會(huì)使用以下的一種或多種方法進(jìn)行處理:
1. 基于布局分析:金鳴識(shí)別系統(tǒng)可以通過分析文本在圖像中的相對位置和排列方式,推斷出表格的結(jié)構(gòu)?;诓季值姆椒梢宰R(shí)別出表格的行列結(jié)構(gòu),并將文本與相應(yīng)的表格元格對應(yīng)起來。這種方案一般適用于有比較規(guī)范的表格結(jié)構(gòu)、橫豎列排版整齊的圖片。這類一般比較好處理,無需AI訓(xùn)練即可完成比較準(zhǔn)確的識(shí)別。
2. 基于文本特征:金鳴識(shí)別系統(tǒng)可以利用表格元素周圍的文本特征來推斷表格的結(jié)構(gòu)。例如,如果某一行或某一列中的所有單元格都包含數(shù)字或日期,而且這些單元格的文本特征相似,那么可以推斷這一行或這一列是表格的某一行或某一列。
3. 基于線條檢測:金鳴識(shí)別系統(tǒng)可以使用圖像處理技術(shù)來檢測表格中的線條。即使表格線條不明顯,通過檢測文本周圍的直線特征也可以推斷出表格的結(jié)構(gòu)。這種方案一般用于大多數(shù)內(nèi)容有表格線,但又缺少一些的圖片。
4. 基于機(jī)器學(xué)習(xí):金鳴識(shí)別系統(tǒng)可以通過訓(xùn)練模型來學(xué)習(xí)無表格線表格的結(jié)構(gòu)特征。利用機(jī)器學(xué)習(xí)算法,系統(tǒng)可以分析大量的無表格線表格數(shù)據(jù),提取特征并建立模型,進(jìn)而預(yù)測和識(shí)別其他無表格線表格的結(jié)構(gòu)。這種方案可以識(shí)別復(fù)雜表格圖片,但過程會(huì)比較復(fù)雜,成本也比較高,但相對來說效果也是比較好的。文章來源:http://www.zghlxwxcb.cn/news/detail-629905.html
這幾種方案有好有壞,不同的樣式的圖片可以采用不同的方案,我們一般混合著用,以達(dá)到更佳的效果。文章來源地址http://www.zghlxwxcb.cn/news/detail-629905.html
#excel技巧#到了這里,關(guān)于金鳴識(shí)別將無表格線的圖片轉(zhuǎn)為excel的幾個(gè)常用方案的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!