博主更新了幾期關(guān)于深度學(xué)習(xí)在工業(yè)場(chǎng)景的應(yīng)用文章,本次全面闡述一下深度學(xué)習(xí)方法在整個(gè)應(yīng)用場(chǎng)景的方法和應(yīng)用的局限特性:
分類:分類作為深度學(xué)習(xí)基本的研究方向,這幾年的學(xué)術(shù)研究取得了重大突破。基本原理如下圖
原理分析:采用圖片的每個(gè)像素值,通過深度學(xué)習(xí)特征網(wǎng)絡(luò)進(jìn)行Labels標(biāo)簽的映射。是一種通過大量計(jì)算獲取最佳特征映射結(jié)果的方法。
大數(shù)據(jù)的實(shí)踐結(jié)論給出,模型是對(duì)數(shù)據(jù)有特征存儲(chǔ)功能,采用通過大數(shù)據(jù)學(xué)習(xí)預(yù)訓(xùn)練模型,對(duì)數(shù)據(jù)的擬合和泛化能力有很強(qiáng)的適配性。
在工業(yè)場(chǎng)景中,分類是一個(gè)雙刃劍,因?yàn)榉诸惖臄?shù)據(jù)效果很準(zhǔn)確,但是需要收集大量的缺陷數(shù)據(jù)進(jìn)行對(duì)抗學(xué)習(xí)。對(duì)數(shù)據(jù)的標(biāo)注和準(zhǔn)確的表述是非常重要的,在一些數(shù)據(jù)獲取非常容易的場(chǎng)景可以快速的采用分類模型進(jìn)行部署識(shí)別。
同樣,上面分析結(jié)論是,在生產(chǎn)場(chǎng)景中,數(shù)據(jù)的分類學(xué)習(xí)是一種圖片數(shù)據(jù)到標(biāo)簽數(shù)據(jù)的映射過程,在部署過程中數(shù)據(jù)是無法調(diào)試的,但是標(biāo)簽數(shù)據(jù)可以,標(biāo)簽數(shù)據(jù)的數(shù)量在設(shè)計(jì)過程中越少對(duì)模型的分類泛化能力越強(qiáng)。所以在使用分類算法是最好只用OK和NG的標(biāo)簽進(jìn)行設(shè)計(jì)。
分類模型的局限就是,每個(gè)圖片的大小根據(jù)預(yù)訓(xùn)練模型設(shè)計(jì)只有256*256,圖片非常小,在工業(yè)場(chǎng)景中圖片最小的都是3000*4000的圖片,所以在使用分類方法的時(shí)候,首先進(jìn)行圖片的定位和裁剪,做到檢測(cè)區(qū)域?yàn)?56*256的圖片大小,這樣大大能提升圖片的準(zhǔn)確性和泛化能力。
目標(biāo)識(shí)別和目標(biāo)分割:目標(biāo)檢測(cè)和目標(biāo)分割使用采用圖片的每個(gè)像素?cái)?shù)據(jù)映射到圖片每個(gè)像素標(biāo)簽的過程,示例如下如所示
目標(biāo)檢測(cè)和目標(biāo)分割同樣采用深度進(jìn)行訓(xùn)練和識(shí)別,原理和分類的方法是一樣的。同樣特性也是一樣,也符合:模型是對(duì)數(shù)據(jù)有特征存儲(chǔ)功能,采用通過大數(shù)據(jù)學(xué)習(xí)預(yù)訓(xùn)練模型,對(duì)數(shù)據(jù)的擬合和泛化能力有很強(qiáng)的適配性。
但是由于目標(biāo)檢測(cè)和分割模型是通過像素到像素的映射關(guān)系,所以需要計(jì)算和存儲(chǔ)的特征細(xì)節(jié)更多,但是目前的模型體量都有限。工業(yè)場(chǎng)景在同樣數(shù)據(jù)集的情況下出現(xiàn)分類的泛化能力要遠(yuǎn)遠(yuǎn)超過目標(biāo)檢測(cè)和目標(biāo)分割。
但是在使用過程中,如果缺陷數(shù)據(jù)足夠可以采用分割模型,對(duì)數(shù)據(jù)進(jìn)行準(zhǔn)確的描述。但是在操作過程中,建議在先使用分類的模型進(jìn)行部署。收集更多數(shù)據(jù)后進(jìn)行目標(biāo)檢測(cè)和目標(biāo)分割模型的部署。
在實(shí)際應(yīng)用中,預(yù)訓(xùn)練的圖片大小都為1280*1280圖片,在使用過程中也對(duì)大圖進(jìn)行裁剪和定位。目標(biāo)檢測(cè)和目標(biāo)分割模型都是在最后階段進(jìn)行缺陷準(zhǔn)確描述進(jìn)行的部署,不建議在初期就采用,這樣項(xiàng)目的交付和交期都會(huì)比較久,因?yàn)檫@種方式需要收集大量的數(shù)據(jù)進(jìn)行學(xué)習(xí),不便與交付和部署。
異常檢測(cè)(非監(jiān)督學(xué)習(xí)):異常檢測(cè)是分類方法衍生出的一種,可以把它定義二分類或者一種聚類的深度學(xué)習(xí)方法,這兩個(gè)表述都各表述了一部分。原理是對(duì)圖片的每個(gè)像素進(jìn)行特征映射,目前最優(yōu)的模型是對(duì)每個(gè)像素進(jìn)行復(fù)雜的深度學(xué)習(xí)特征變換,并對(duì)特征映射到每個(gè)像素上進(jìn)行評(píng)分,獲取異常評(píng)分的像素值,定義為缺陷像素。
這種方法是進(jìn)幾年研究的一個(gè)熱門領(lǐng)域,方法是完全發(fā)揮了,模型是對(duì)數(shù)據(jù)有特征存儲(chǔ)功能這個(gè)特性,通過深度學(xué)習(xí)復(fù)雜的特征映射關(guān)系,進(jìn)行數(shù)據(jù)變換,在通過一個(gè)更大的模型學(xué)習(xí)特征的關(guān)系,并對(duì)每個(gè)像素值進(jìn)行映射,擬合的方向是正常產(chǎn)品的像素值越來越小。在不符合正常特征像素值出現(xiàn)的時(shí)候,分?jǐn)?shù)就異常大,從而判定為異常。
所以這種方法只學(xué)習(xí)正常產(chǎn)品的圖片就可以判定產(chǎn)品上是否有缺陷。使用場(chǎng)景就是那種沒有缺陷數(shù)據(jù)或者很難得到缺陷數(shù)據(jù),并對(duì)產(chǎn)品質(zhì)量要求非常苛刻的場(chǎng)景。
方法采用預(yù)訓(xùn)練的模型進(jìn)行數(shù)據(jù)變換,所以圖片大小最好和預(yù)訓(xùn)練圖片一樣(256*256)是最佳尺寸。
異常檢測(cè)模型對(duì)數(shù)據(jù)特別敏感,所有要做好圖片檢測(cè)區(qū)域的定位和裁剪,還有后處理工作。在之前一篇講解機(jī)器學(xué)習(xí)異常檢測(cè)算法的中有強(qiáng)調(diào)過后處理的方法,鏈接如下:《計(jì)算機(jī)視覺度量:從特征描述到深度學(xué)習(xí)》-- 機(jī)器學(xué)習(xí)進(jìn)行one-class缺陷檢測(cè)算法(GMM為例)_計(jì)算機(jī)視覺度量 從特征描述到深度學(xué)習(xí) csdn-CSDN博客文章來源:http://www.zghlxwxcb.cn/news/detail-828138.html
總結(jié):深度學(xué)習(xí)整套方法也有局限性,不是什么場(chǎng)景都可以采用。在使用深度學(xué)習(xí)之前要做好數(shù)據(jù)的定位和裁剪工作。在使用過程中標(biāo)簽的數(shù)量越少越穩(wěn)定。數(shù)據(jù)在定位中越準(zhǔn)確越穩(wěn)定,裁剪過程中盡量考慮預(yù)訓(xùn)練模型的標(biāo)準(zhǔn)尺寸。文章來源地址http://www.zghlxwxcb.cn/news/detail-828138.html
到了這里,關(guān)于《計(jì)算機(jī)視覺度量:從特征描述到深度學(xué)習(xí)》--工業(yè)視覺深度學(xué)習(xí)方法概述的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!