本文重點
本節(jié)課程我們將學習分類定位的問題,也就是說不僅要完成圖片分類任務,然后還要完成定位任務。如下所示,我們不僅要用算法判斷圖片中是不是一輛車,還要在圖片中標記出它的位置,用邊框對象圈起來,這就是分類定位問題。
一般可能會有一張圖片對應多個對象,本節(jié)課我們假設所有的圖片最多只對應一個對象。
圖片分類
我們假設圖片中最多含有一個對象,這個對象可能是行人、汽車、摩托車,當然還有可能一個對象都沒有我們稱它為背景。
那么這是一個四分類的問題,類別一是行人、類別二是汽車、類別三是摩托車、類別四是背景。
現在的任務是往模型中輸入一張圖片,然后識別這個圖片屬于哪個類別。模型會輸出一個特征向量,并反饋給 softmax 單元(四個神經元)來預測圖片類型,這個任務很簡單。文章來源:http://www.zghlxwxcb.cn/news/detail-839609.html
目標定位
如何才能完成目標定位任務呢?我們需要四個數字來確定一個邊框,分別記為bx,by,bh和bw,這四個數字是被檢測對象的邊界框的參數化表示。bx和by表示被檢測對象的中心點,bh表示被檢測對象的高,bw表示被檢測對象的寬。文章來源地址http://www.zghlxwxcb.cn/news/detail-839609.html
到了這里,關于每天五分鐘計算機視覺:如何構造分類定位任務的算法模型?的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網!