国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo))

這篇具有很好參考價值的文章主要介紹了MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo))。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

目標(biāo)檢測模型性能衡量指標(biāo)、MS COCO 數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦

0. 引言

0.1 COCO 數(shù)據(jù)集評價指標(biāo)

MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo)),目標(biāo)檢測(Object Detection),面試題(Interview Questions),深度學(xué)習(xí)(Deep Learning),目標(biāo)檢測,目標(biāo)跟蹤,人工智能

目標(biāo)檢測模型通過 pycocotools 在驗證集上會得到 COCO 的評價列表,具體參數(shù)的含義是什么呢?

0.2 目標(biāo)檢測領(lǐng)域常用的公開數(shù)據(jù)集

  1. PASCAL VOC
  2. Microsoft COCO(MS COCO)

在 MS COCO 數(shù)據(jù)集出來之前,目標(biāo)檢測基本上用的是 PASCAL VOC 數(shù)據(jù)集,現(xiàn)在 MS COCO 非常流行。這兩個數(shù)據(jù)集均有自己的評判標(biāo)準(zhǔn)。

0.3 COCO(Common Objects in Context,上下文中的常見對象)數(shù)據(jù)集簡介

0.3.1 介紹

COCO 數(shù)據(jù)集是一個可用于圖像檢測(Image Detection),語義分割(Semantic Segmentation)和圖像標(biāo)題生成(Image Captioning)的大規(guī)模數(shù)據(jù)集。它有超過 330K 張圖像(其中 220K 張是有標(biāo)注的圖像),包含

  • 150 萬個目標(biāo)
  • 80 個目標(biāo)類別(object categories:行人、汽車、大象等)
  • 91 種材料類別(stuff categoris:草、墻、天空等)
  • 每張圖像包含五句圖像的語句描述
  • 且有 250, 000 個帶關(guān)鍵點標(biāo)注的行人

MS COCO官網(wǎng):https://cocodataset.org/#home

0.3.2 MS COCO 可以應(yīng)用的任務(wù)

  1. 目標(biāo)檢測(object detection):使用 bounding box 或者 object segmentation (也稱為instance segmentation)將不同的目標(biāo)進行標(biāo)定。

  2. Densepose(密集姿勢估計):DensePose 任務(wù)涉及同時檢測人、分割他們的身體并將屬于人體的所有圖像像素映射到身體的3D表面。用于不可控條件下的密集人體姿態(tài) 估計。

    MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo)),目標(biāo)檢測(Object Detection),面試題(Interview Questions),深度學(xué)習(xí)(Deep Learning),目標(biāo)檢測,目標(biāo)跟蹤,人工智能
  3. Key-points detection(關(guān)鍵點檢測):在任意姿態(tài)下對人物的關(guān)鍵點進行定位,該任務(wù)包含檢測行人及定位到行人的關(guān)鍵點。

    MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo)),目標(biāo)檢測(Object Detection),面試題(Interview Questions),深度學(xué)習(xí)(Deep Learning),目標(biāo)檢測,目標(biāo)跟蹤,人工智能
  4. Stuff Segmentation(材料細(xì)分):語義分割中針對 stuff class 類的分割(草,墻壁,天空等)

    MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo)),目標(biāo)檢測(Object Detection),面試題(Interview Questions),深度學(xué)習(xí)(Deep Learning),目標(biāo)檢測,目標(biāo)跟蹤,人工智能
  5. Panoptic Segmentation(全景分割):其目的是生成豐富且完整的連貫場景分割,這是實現(xiàn)自主駕駛或增強現(xiàn)實等真實世界視覺系統(tǒng)的重要一步。

    MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo)),目標(biāo)檢測(Object Detection),面試題(Interview Questions),深度學(xué)習(xí)(Deep Learning),目標(biāo)檢測,目標(biāo)跟蹤,人工智能
  6. image captioning(圖像標(biāo)題生成):根據(jù)圖像生成一段文字。

    MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo)),目標(biāo)檢測(Object Detection),面試題(Interview Questions),深度學(xué)習(xí)(Deep Learning),目標(biāo)檢測,目標(biāo)跟蹤,人工智能

0.3.3 COCO 的 80 個類別

MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo)),目標(biāo)檢測(Object Detection),面試題(Interview Questions),深度學(xué)習(xí)(Deep Learning),目標(biāo)檢測,目標(biāo)跟蹤,人工智能MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo)),目標(biāo)檢測(Object Detection),面試題(Interview Questions),深度學(xué)習(xí)(Deep Learning),目標(biāo)檢測,目標(biāo)跟蹤,人工智能
編號 英文名稱 中文名稱 編號 英文名稱 中文名稱 編號 英文名稱 中文名稱
1 person 28 boat 55 cup 杯子
2 bicycle 自行車 29 traffic light 交通燈 56 fork 叉子
3 car 汽車 30 fire hydrant 消防栓 57 knife
4 motorcycle 摩托車 31 stop sign 停車標(biāo)志 58 spoon 勺子
5 airplane 飛機 32 parking meter 停車計時器 59 bowl
6 bus 公共汽車 33 bench 長凳 60 banana 香蕉
7 train 火車 34 bird 61 apple 蘋果
8 truck 卡車 35 cat 62 sandwich 三明治
9 boat 36 dog 63 orange 橙子
10 traffic light 交通燈 37 horse 64 broccoli 西蘭花
11 fire hydrant 消防栓 38 sheep 65 carrot 胡蘿卜
12 stop sign 停車標(biāo)志 39 cow 66 hot dog 熱狗
13 parking meter 停車計時器 40 elephant 大象 67 pizza 披薩
14 bench 長凳 41 bear 68 donut 甜甜圈
15 bird 42 zebra 斑馬 69 cake 蛋糕
16 cat 43 giraffe 長頸鹿 70 chair 椅子
17 dog 44 backpack 背包 71 couch 沙發(fā)
18 horse 45 umbrella 雨傘 72 potted plant 盆栽
19 sheep 46 handbag 手提包 73 bed
20 cow 47 tie 領(lǐng)帶 74 dining table 餐桌
21 elephant 大象 48 suitcase 行李箱 75 toilet 廁所
22 bear 49 frisbee 飛盤 76 tv monitor 電視監(jiān)視器
23 zebra 斑馬 50 skis 滑雪板 77 laptop 筆記本電腦
24 giraffe 長頸鹿 51 snowboard 單板滑雪 78 mouse 鼠標(biāo)
25 backpack 背包 52 sports ball 運動球 79 remote 遙控器
26 umbrella 雨傘 53 kite 風(fēng)箏 80 keyboard 鍵盤
27 tie 領(lǐng)帶 54 baseball bat 棒球棍

1. 目標(biāo)檢測中常見的指標(biāo)

MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo)),目標(biāo)檢測(Object Detection),面試題(Interview Questions),深度學(xué)習(xí)(Deep Learning),目標(biāo)檢測,目標(biāo)跟蹤,人工智能

對于這樣一張圖片,怎樣才能算檢測正確呢?其中,綠色為 GT,紅色為預(yù)測框。

  • IoU 大于指定閾值?
  • 類別是否正確?
  • confidence 大于指定閾值?

以上三點都是我們需要考慮的。

1.1 TP、FP、FN

1.1.1 定義

  • TP(True Positive):預(yù)測正確的預(yù)測框數(shù)量 [IoU > 閾值](同一個 GT 只計算一次)
  • FP(False Positive):檢測到是同一個 GT 的多余預(yù)測框的數(shù)量 [IoU < 閾值](或者是檢測到同一個 GT 的多余預(yù)測框的數(shù)量)
  • FN(False Negative):沒有檢測到 GT 的預(yù)測框數(shù)量 [漏檢的數(shù)量]
  • 閾值根據(jù)任務(wù)進行調(diào)整,一般選擇 0.5
  • FP 就是“假陽性”,就是模型誤認(rèn)為是 TP

1.1.2 例子說明 TP、FP、FN

舉個例子理解 TP、FP、FN:

MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo)),目標(biāo)檢測(Object Detection),面試題(Interview Questions),深度學(xué)習(xí)(Deep Learning),目標(biāo)檢測,目標(biāo)跟蹤,人工智能

對于張圖片來說,綠色 為 GT,紅色 為模型預(yù)測框,IoU 閾值設(shè)置為 0.5。

  • 對于中間這只貓來說,在 綠色框(GT) 中的 預(yù)測框(紅色)綠色框 的 IoU 肯定是 >0.5 的,所以它應(yīng)該是一個 TP(預(yù)測對了目標(biāo)且 IoU > 閾值);而對于 偏左的預(yù)測框 來說,它和 GT 的 IoU 肯定是不足 0.5 的,加之因為有 TP 的存在,所以它是 FP。
  • 對于右下角的那只貓,GT 是有的,但模型并沒有給出對應(yīng)的預(yù)測框,因此模型對于這只貓來說,漏檢了,故 FN 的數(shù)量為 1。

1.2 AP(Average Precision,平均精度)

1.2.1 Precision

P r e c i s i o n = T P T P + F P \mathrm{Precision = \frac{TP}{TP + FP}} Precision=TP+FPTP?

解釋:模型預(yù)測的所有目標(biāo)(Object)中,預(yù)測正確的比例 -> 查準(zhǔn)率

模型認(rèn)為正確的目標(biāo) 中 確實預(yù)測對了多少


那么僅僅通過 Precision 這個指標(biāo)能不能全面衡量模型的檢測能力呢?舉個例子進行說明:

MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo)),目標(biāo)檢測(Object Detection),面試題(Interview Questions),深度學(xué)習(xí)(Deep Learning),目標(biāo)檢測,目標(biāo)跟蹤,人工智能

同樣的,綠色的為 Ground Truth,紅色的為 預(yù)測框。

上面這張圖片有 5 個目標(biāo),但是網(wǎng)絡(luò)只針對貓 ① 給出了預(yù)測框(紅色的),剩下的貓都沒有檢測出來。這里的 TP=1,F(xiàn)P=0。所以此時的 Precision 為:

P r e c i s i o n = T P T P + F P = 1 1 + 0 = 1 = 100 % \begin{aligned} \mathrm{Precision} & = \mathrm{\frac{TP}{TP+FP}} \\ & = \frac{1}{1 + 0} \\ & = 1\\ & = 100\% \end{aligned} Precision?=TP+FPTP?=1+01?=1=100%?

很明顯對于這張圖片網(wǎng)絡(luò)漏檢了 4 個目標(biāo),但 Precision 又顯示結(jié)果是非常好的。因此我們就可以知道了,僅僅通過 Precision 無法評判檢測網(wǎng)絡(luò)的性能。為了解決這個問題,我們引入了另外一個指標(biāo) —— Recall。

1.2.2 Recall

R e c a l l = T P T P + F N \mathrm{Recall = \frac{TP}{TP + FN}} Recall=TP+FNTP?

解釋:所有真實目標(biāo)中,模型預(yù)測正確的比例 -> 查全率

本應(yīng)該檢測對的,模型檢測對了多少

那么我們只使用 Recall 這個指標(biāo)來判定模型的好壞嗎?舉個例子說明:

MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo)),目標(biāo)檢測(Object Detection),面試題(Interview Questions),深度學(xué)習(xí)(Deep Learning),目標(biāo)檢測,目標(biāo)跟蹤,人工智能

這張圖片和上一張圖片類似,網(wǎng)絡(luò)總共預(yù)測出了 50 個預(yù)測框(即 50 個目標(biāo))。這 50 個預(yù)測框中包括了所有要檢測的目標(biāo),那么該網(wǎng)絡(luò)針對這張圖片的 Recall 為:

R e c a l l = T P T P + F N = 1 1 + 0 = 1 = 100 % \begin{aligned} \mathrm{Recall} & = \mathrm{\frac{TP}{TP+FN}} \\ & = \frac{1}{1 + 0} \\ & = 1\\ & = 100\% \end{aligned} Recall?=TP+FNTP?=1+01?=1=100%?

很明顯,單單使用 Recall 無法評判模型的好壞。所以我們需要同時使用 Precision 和 Recall 這兩個指標(biāo)來進行網(wǎng)絡(luò)性能的評判,即引入 —— AP。

1.2.3 AP —— P-R 曲線下面積

AP 就是P-R曲線下方的面積,而 P-R 分別為 Precision 和 Recall。

假設(shè)模型已經(jīng)訓(xùn)練完畢,驗證集為下面 3 張圖片:

MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo)),目標(biāo)檢測(Object Detection),面試題(Interview Questions),深度學(xué)習(xí)(Deep Learning),目標(biāo)檢測,目標(biāo)跟蹤,人工智能
1.2.3.1 第一張圖片
MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo)),目標(biāo)檢測(Object Detection),面試題(Interview Questions),深度學(xué)習(xí)(Deep Learning),目標(biāo)檢測,目標(biāo)跟蹤,人工智能

首先判斷該圖片中有幾個目標(biāo)(GT)?很明顯綠色的框有兩個,所以有兩個 GT,即

n u m o b j = 0 + 2 = 2 。 \mathrm{num_{obj}} = 0 + 2 = 2。 numobj?=0+2=2

接下來同一個列表統(tǒng)計網(wǎng)絡(luò)所檢測到的目標(biāo)信息:

GT id Confidence OB (IoU=0.5)
1 0.98 True
1 0.61 False

Note:

  • GT id 為 預(yù)測框匹配的 GT 的 id;Confidence 為預(yù)測框的置信度(是此類別的概率);OB 為判斷該預(yù)測框是否是 TP。
  • 該表從上到下的順序是根據(jù) Confidence 降序排列的
  • 對于 GT id = 2,網(wǎng)絡(luò)并沒有給出預(yù)測框,所以表中沒有相關(guān)信息
1.2.3.2 第二張圖片
MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo)),目標(biāo)檢測(Object Detection),面試題(Interview Questions),深度學(xué)習(xí)(Deep Learning),目標(biāo)檢測,目標(biāo)跟蹤,人工智能

這張圖片中目標(biāo)的個數(shù)(綠色的框)有 1 個,所以累積目標(biāo)個數(shù):

n u m o b j = 2 + 1 = 3 。 \mathrm{num_{obj}} = 2 + 1 = 3。 numobj?=2+1=3。

表也需更新:

GT id Confidence OB (IoU=0.5)
1 0.98 True
3 0.89 True
3 0.66 False
1 0.61 False
1.2.3.3 第三張圖片
MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo)),目標(biāo)檢測(Object Detection),面試題(Interview Questions),深度學(xué)習(xí)(Deep Learning),目標(biāo)檢測,目標(biāo)跟蹤,人工智能

累積目標(biāo)個數(shù):

n u m o b j = 3 + 4 = 7 。 \mathrm{num_{obj}} = 3 + 4 = 7。 numobj?=3+4=7。

更新表:

GT id Confidence OB(IoU=0.5)
1 0.98 True
3 0.89 True
6 0.88 True
7 0.78 True
3 0.66 False
1 0.61 False
4 0.52 True
1.2.3.4 計算 AP

得到表以后,我們計算針對不同 Confidence(即取不同 Confidence 閾值)得到的 Precision 和 Recall 的信息)。

GT id Confidence OB (IoU=0.5)
1 0.98 True
3 0.89 True
6 0.88 True
7 0.78 True
3 0.66 False
1 0.61 False
4 0.52 True
  1. 首先將 Confidence 的閾值設(shè)置為 0.98(Confidence ≥ 0.98 的目標(biāo)才算匹配正確),只有一個預(yù)測框符合條件(表中的第一行)。

    • TP = 1; FP = 0; FN = 6

    在 Confidence≥0.98 的條件下,TP=1 沒什么問題;FP=0 是因為閾值的存在;FN=6 是因為累積目標(biāo)個數(shù) num_ob=7,所以 F N = n u m _ o b ? T P = 7 ? 1 = 6 \mathrm{FN=num\_ob - TP} = 7 - 1 = 6 FN=num_ob?TP=7?1=6。因此我們可以得到 P r e c i s i o n = T P T P + F P = 1 1 + 0 = 1 \mathrm{Precision = \frac{TP}{TP + FP} = \frac{1}{1+0}=1} Precision=TP+FPTP?=1+01?=1 R e c a l l = T P T P + F N = 1 1 + 6 = 0.14 \mathrm{Recall = \frac{TP}{TP + FN} = \frac{1}{1+6}=0.14} Recall=TP+FNTP?=1+61?=0.14
    Note:這個TP; FP; FN是看那個表,就不區(qū)分什么第幾張圖片了,看表就可以。

  2. 將 Confidence 閾值設(shè)置為 0.89

    • 此條件下,TP = 2; FP = 0; FN = num_ob - TP = 7 - 2 = 5,我們可以得到 Precision 和 Recall
  3. 將 Confidence 閾值設(shè)置為 0.66

    • 此條件下,TP=4; FP=1; FN=num_ob-TP=7-4=3,我們可以得到 P r e c i s i o n = T P T P + F P = 4 4 + 1 = 0.80 \mathrm{Precision = \frac{TP}{TP + FP} = \frac{4}{4+1}=0.80} Precision=TP+FPTP?=4+14?=0.80 R e c a l l = T P T P + F N = 4 4 + 3 = 0.57 \mathrm{Recall = \frac{TP}{TP + FN} = \frac{4}{4+3}=0.57} Recall=TP+FNTP?=4+34?=0.57

全部計算完畢后,結(jié)果如下表所示。

Rank Precision Recall
1 1.0 0.14
2 1.0 0.28
3 1.0 0.42
4 1.0 0.57
5 0.80 0.57
6 0.66 0.57
7 0.71 0.71

我們可以根據(jù)求得的一系列的 Precision 和 Recall 繪制 P-R 曲線。以 Recall 為橫坐標(biāo),Precision 為縱坐標(biāo)得到 P-R 曲線,如下圖所示。

MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo)),目標(biāo)檢測(Object Detection),面試題(Interview Questions),深度學(xué)習(xí)(Deep Learning),目標(biāo)檢測,目標(biāo)跟蹤,人工智能

在繪制 P-R 曲線時需注意:對于 Recall(橫坐標(biāo))需要濾除一些重復(fù)數(shù)據(jù)(圖中用框框住的即為參與計算的點,有兩個點沒有被框,它倆不參與 AP 的計算)。根據(jù)表中的數(shù)據(jù)可知,Recall=0.57 有 3 個值,此時需保留 Precision 最大的值,即:

Rank Precision Recall
1 1.0 0.14
2 1.0 0.28
3 1.0 0.42
4 1.0 0.57
5 0.80 0.57
6 0.66 0.57
7 0.71 0.71

圖中陰影部分的面積就是 AP,計算如下(重復(fù)的 Recall 已經(jīng)濾除):

Rank Precision Recall
1 1.0 0.14
2 1.0 0.28
3 1.0 0.42
4 1.0 0.57
6 0.71 0.71

R e c a l l = ∑ i = 1 R a n k ( R e c a l l i ? R e c a l l i ? 1 ) × max ? ( P r e c i s i o n i , . . . , R a n k ) R e c a l l = ∑ i = 本行 R a n k ( R e c a l l 本行 ? R e c a l l 上一行 ) × 本行及以下最大的 P r e c i s i o n \begin{aligned} \mathrm{Recall} & = \sum_{i=1}^{\mathrm{Rank}} (\mathrm{Recall}_i -\mathrm{Recall}_{i-1}) \times \max(\mathrm{Precision}_{ i, ..., \mathrm{Rank}}) \\ \mathrm{Recall} & = \sum_{i=本行}^{\mathrm{Rank}} (\mathrm{Recall}_{本行} -\mathrm{Recall}_{上一行}) \times 本行及以下最大的\mathrm{Precision} \end{aligned} RecallRecall?=i=1Rank?(Recalli??Recalli?1?)×max(Precisioni,...,Rank?)=i=本行Rank?(Recall本行??Recall上一行?)×本行及以下最大的Precision?

根據(jù)公式可以求得陰影的面積,即 AP 為:

R e c a l l = ( 0.14 ? 0 ) × 1.0 + ( 0.28 ? 0.14 ) × 1.0 + ( 0.42 ? 0.28 ) × 1.0 + ( 0.57 ? 0.42 ) × 1.0 + ( 0.71 ? 0.57 ) × 0.71 = 0.6694 \begin{aligned} \mathrm{Recall} & = (0.14 - 0) \times 1.0 + (0.28 - 0.14) \times 1.0 + (0.42 - 0.28) \times 1.0 + (0.57 - 0.42) \times 1.0 + (0.71 - 0.57) \times 0.71 \\ & = 0.6694 \end{aligned} Recall?=(0.14?0)×1.0+(0.28?0.14)×1.0+(0.42?0.28)×1.0+(0.57?0.42)×1.0+(0.71?0.57)×0.71=0.6694?

了解完 AP 后我們就可以進一步得到一個新的指標(biāo) —— mAP。

1.3 mAP(mean Average Precision,即各類別 AP 的平均值)

mAP 就是各類別 AP 的平均值,計算公式如下:

m A P = 1 n c ∑ i = 1 n c A P i \mathrm{mAP = \frac{1}{nc}\sum^{nc}_{i=1}AP_i} mAP=nc1?i=1nc?APi?

其中 nc 為類別數(shù)。

1.4 注意事項

以上的 TP、FP、FN 都是經(jīng)過 NMS 處理后得到的預(yù)測框。

2. MS COCO 評價指標(biāo)中每條數(shù)據(jù)的含義

MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo)),目標(biāo)檢測(Object Detection),面試題(Interview Questions),深度學(xué)習(xí)(Deep Learning),目標(biāo)檢測,目標(biāo)跟蹤,人工智能

MS COCO 官網(wǎng)說明:https://cocodataset.org/#detection-eval

MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo)),目標(biāo)檢測(Object Detection),面試題(Interview Questions),深度學(xué)習(xí)(Deep Learning),目標(biāo)檢測,目標(biāo)跟蹤,人工智能

Note:圖片中雖然寫的是 AP,但實際上表示的是 mAP。

2.1 Average Precision (AP)

  1. A P \mathrm{AP} AP:MS COCO 的主要評價指標(biāo),設(shè)置的 IoU 閾值為 IoU = range(0.5, 1.00, 0.05) 共 10 個 IoU 的 mAP 的均值,計算公式如下:
    A P = 1 10 ( m A P I o U = 0.5 + m A P I o U = 0.55 + m A P I o U = 0.60 + m A P I o U = 0.65 + m A P I o U = 0.70 + m A P I o U = 0.75 + m A P I o U = 0.80 + m A P I o U = 0.85 + m A P I o U = 0.9 + m A P I o U = 0.95 ) \mathrm{AP = \frac{1}{10}(mAP^{IoU=0.5} + mAP^{IoU=0.55} + mAP^{IoU=0.60} + mAP^{IoU=0.65} + mAP^{IoU=0.70} + mAP^{IoU=0.75} + mAP^{IoU=0.80} + mAP^{IoU=0.85} + mAP^{IoU=0.9} + mAP^{IoU=0.95})} AP=101?(mAPIoU=0.5+mAPIoU=0.55+mAPIoU=0.60+mAPIoU=0.65+mAPIoU=0.70+mAPIoU=0.75+mAPIoU=0.80+mAPIoU=0.85+mAPIoU=0.9+mAPIoU=0.95)
  2. A P I o U = 0.50 \mathrm{AP^{IoU}=0.50} APIoU=0.50:將 IoU 閾值設(shè)置為 0.5 得到的 mAP 值(就是上面我們舉的例子),這個取值也是 PASCAL VOC 的評價指標(biāo)。
  3. A P I o U = 0.75 \mathrm{AP^{IoU}=0.75} APIoU=0.75:是更加嚴(yán)格的標(biāo)準(zhǔn)(因為 IoU 的閾值越大,說明網(wǎng)絡(luò)預(yù)測框與 GT 重合度越來越高 -> 目標(biāo)的定位越來越準(zhǔn),這對網(wǎng)絡(luò)來說是很難的)。

2.2 Across Scales

  1. APsmallmAP 針對小目標(biāo) 若檢測目標(biāo)(GT)的像素面積小于 3 2 2 32^2 322,則將其歸為小目標(biāo) ——衡量網(wǎng)絡(luò)對于小目標(biāo)的平均查準(zhǔn)率
  2. APmediummAP 針對中目標(biāo) 若檢測目標(biāo)(GT)的像素面積在 [ 3 2 2 , 9 6 2 ] [32^2, 96^2] [322,962] 之間,則將其歸為中目標(biāo) ——衡量網(wǎng)絡(luò)對于中等目標(biāo)的平均查準(zhǔn)率
  3. APlargemAP 針對大目標(biāo) 若檢測目標(biāo)(GT)的像素面積大于 9 6 2 96^2 962,則將其歸為大目標(biāo) ——衡量網(wǎng)絡(luò)對于大目標(biāo)的平均查準(zhǔn)率

通過這三個指標(biāo)可以看出該目標(biāo)檢測網(wǎng)絡(luò)對于不同尺度目標(biāo)的檢測效果。如果我們的任務(wù)需要檢測的目標(biāo)都是較小的,我們應(yīng)該更加關(guān)注與 A P s m a l l \mathrm{AP^{small}} APsmall 參數(shù)而不是 A P l a r g e \mathrm{AP^{large}} APlarge。

2.3 Average Recall (AR)

對于目標(biāo)檢測網(wǎng)絡(luò),在代碼部分會限制每張圖片最終預(yù)測框的數(shù)量,這里的 max 就是這個數(shù)量。如 max=100,即每張圖片最終預(yù)測 100 個預(yù)測框。而這里的 A R m a x = 100 \mathrm{AR^{max}=100} ARmax=100 就表示在每張圖片預(yù)測框閾值為 100 的情況下,平均的查全率(Recall)是多少。

  1. A R m a x = 1 \mathrm{AR^{max}=1} ARmax=1:在每張圖片預(yù)測框數(shù)量閾值為 1 的情況下,平均的查全率(Recall)是多少
  2. A R m a x = 10 \mathrm{AR^{max}=10} ARmax=10:在每張圖片預(yù)測框數(shù)量閾值為 10 的情況下,平均的查全率(Recall)是多少
  3. A R m a x = 100 \mathrm{AR^{max}=100} ARmax=100:在每張圖片預(yù)測框數(shù)量閾值為 100 的情況下,平均的查全率(Recall)是多少
MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo)),目標(biāo)檢測(Object Detection),面試題(Interview Questions),深度學(xué)習(xí)(Deep Learning),目標(biāo)檢測,目標(biāo)跟蹤,人工智能

從上圖可以看到, A R m a x = 100 = 64 % \mathrm{AR^{max}=100}=64\% ARmax=100=64%, A R m a x = 10 = 63.3 % \mathrm{AR^{max}=10}=63.3\% ARmax=10=63.3% A R m a x = 1 = 45.2 % \mathrm{AR^{max}=1}=45.2\% ARmax=1=45.2%。這說明 max 取 100 和取 10 相差不大,進一步說明了,模型訓(xùn)練時使用的數(shù)據(jù)集每張圖片中目標(biāo)(GT)的數(shù)目并不是很多,基本上在 10 左右;而當(dāng)預(yù)測框數(shù)量限制在 1 時,它的 AR 僅為 45.2%,說明每張圖片的目標(biāo)個數(shù)一般是 >1 的。

2.4 AR Across Scales

與 AP、AP across scales 類似,AR across scales 表示對應(yīng)不同目標(biāo)尺度的 AR。

  1. A R s m a l l \mathrm{AR^{small}} ARsmallAR 針對小目標(biāo) 若檢測目標(biāo)(GT)的像素面積小于 3 2 2 32^2 322,則將其歸為小目標(biāo) ——衡量網(wǎng)絡(luò)對于小目標(biāo)的平均查全率(Recall)
  2. A R m e d i u m \mathrm{AR^{medium}} ARmediumAR 針對中目標(biāo) 若檢測目標(biāo)(GT)的像素面積在 [ 3 2 2 , 9 6 2 ] [32^2, 96^2] [322,962] 之間,則將其歸為中目標(biāo) ——衡量網(wǎng)絡(luò)對于中等目標(biāo)的平均查全率(Recall)
  3. A R l a r g e \mathrm{AR^{large}} ARlargeAR 針對大目標(biāo) 若檢測目標(biāo)(GT)的像素面積大于 9 6 2 96^2 962,則將其歸為大目標(biāo) ——衡量網(wǎng)絡(luò)對于大目標(biāo)的平均查全率(Recall)

3. 各種指標(biāo)的選擇 —— 基于不同的任務(wù)

不同的任務(wù)需要使用不同的指標(biāo)。

MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo)),目標(biāo)檢測(Object Detection),面試題(Interview Questions),深度學(xué)習(xí)(Deep Learning),目標(biāo)檢測,目標(biāo)跟蹤,人工智能

3.1 mAP

  • 于 PASCAL VOC 的 mAP 來說, A P I o U = 0.50 \mathrm{AP^{IoU}=0.50} APIoU=0.50 是要看的,因為它是 PASCAL VOC 的主要評價指標(biāo)。
  • 對于 MS COCO 數(shù)據(jù)集來說, A P \mathrm{AP} AP(第一行,10 個 mAP 的平均)是要看的,因為它是 MS COCO 的主要評價指標(biāo)。
  • 如果我們對 目標(biāo)框定位精度要求較高 的話,我們可以關(guān)注 A P I o U = 0.75 \mathrm{AP^{IoU}=0.75} APIoU=0.75
  • 如果我們對 小目標(biāo)檢測要求比較高 的話,我們可以關(guān)注 A P s m a l l \mathrm{AP^{small}} APsmall,通過這個值可以了解網(wǎng)絡(luò)對于小目標(biāo)檢測的平均查準(zhǔn)率(整體情況)
  • 如果我們對 中目標(biāo)檢測要求比較高 的話,我們可以關(guān)注 A P m e d i u m \mathrm{AP^{medium}} APmedium
  • 如果我們對 大目標(biāo)檢測要求比較高 的話,我們可以關(guān)注 A P l a r g e \mathrm{AP^{large}} APlarge

3.2 AR

主要關(guān)注下面兩個指標(biāo):

  1. A R m a x = 10 \mathrm{AR^{max}=10} ARmax=10
  2. A R m a x = 100 \mathrm{AR^{max}=100} ARmax=100

如果它倆 AR(平均查全率)相差很小的話, 可以減少網(wǎng)絡(luò)預(yù)測框的個數(shù),從而提高目標(biāo)檢測的效率。文章來源地址http://www.zghlxwxcb.cn/news/detail-716982.html

參考

  1. 目標(biāo)檢測mAP計算以及coco評價標(biāo)準(zhǔn)
  2. COCO數(shù)據(jù)集介紹

到了這里,關(guān)于MS COCO數(shù)據(jù)集的評價標(biāo)準(zhǔn)以及不同指標(biāo)的選擇推薦(AP、mAP、MS COCO、AR、@、0.5、0.75、1、目標(biāo)檢測、評價指標(biāo))的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 圖像復(fù)原(去模糊)基本內(nèi)容以及評價標(biāo)準(zhǔn)

    圖像復(fù)原(去模糊)基本內(nèi)容以及評價標(biāo)準(zhǔn)

    ? 原圖像為f(x, y),經(jīng)過退化函數(shù)h(x, y)在加上噪聲n(x. y)得到退化圖像g(x, y)。 ? 整個過程可以描述為: g ( x , y ) = h ( x , y ) ? f ( x , y ) + n ( x , y ) mathrm{g}(mathrm{x}, mathrm{y})=mathrm{h}(mathrm{x}, mathrm{y}) * mathrm{f}(mathrm{x}, mathrm{y})+mathrm{n}(mathrm{x}, mathrm{y}) g ( x , y ) = h ( x , y )

    2024年02月05日
    瀏覽(43)
  • 【C語言】數(shù)據(jù)結(jié)構(gòu)的基本概念與評價算法的指標(biāo)

    1.1 基本概念和術(shù)語 1.1.1 數(shù)據(jù) 數(shù)據(jù)是信息的載體,是描述客觀事物屬性的數(shù)、字符及所有能輸入到計算機中并被計算機程序識別和處理的符號的集合。數(shù)據(jù)是計算機程序加工的原料 1.1.2 數(shù)據(jù)元素 數(shù)據(jù)元素是數(shù)據(jù)的基本單位,通常作為一個整體進行考慮和處理,一個數(shù)據(jù)元素

    2024年02月09日
    瀏覽(32)
  • 【Argoverse 1 Motion Forecasting Dataset】軌跡預(yù)測數(shù)據(jù)集使用與評價指標(biāo)

    【Argoverse 1 Motion Forecasting Dataset】軌跡預(yù)測數(shù)據(jù)集使用與評價指標(biāo)

    Argoverse 1 https://www.argoverse.org/av1.html#forecasting-link 下載對應(yīng)的“Argoverse HD Maps”以及“Argoverse Motion Forecasting v1.1” ????????通過下載Sample Datasets v1.1Motion Forecasting文件包對數(shù)據(jù)集進行分析。這里給出了5個場景的數(shù)據(jù)csv文件,每個csv文件代表一個場景,讀取任一文件,主要包

    2024年01月20日
    瀏覽(40)
  • 綠色數(shù)據(jù)中心性能評價指標(biāo):PUE、DCIE、WUE、CUE、IUE

    2015年,綠色網(wǎng)格組織TGG在全球范圍內(nèi)首次推出“PUE評測”和“數(shù)據(jù)中心綠色等級評估”,“數(shù)據(jù)中心綠色等級”從能源效率、節(jié)能技術(shù)、綠色管理三個維度對數(shù)據(jù)中心進行評估和綜合評分,并設(shè)置了創(chuàng)新性探索、綠色建筑等加分項目,由總分得到該數(shù)據(jù)中心對應(yīng)的等級(1A

    2024年02月10日
    瀏覽(21)
  • 分類問題的評價指標(biāo)(Precision、Recall、Accuracy、F1-Score、Micro-F1、Macro-F1)以及混淆矩陣、ROC曲線

    分類問題的評價指標(biāo)(Precision、Recall、Accuracy、F1-Score、Micro-F1、Macro-F1)以及混淆矩陣、ROC曲線

    真陽性:預(yù)測為正,實際為正。把正樣本 成功 預(yù)測為正。? TP ——True Positive 假陽性:預(yù)測為正,實際為負(fù)。把負(fù)樣本 錯誤 預(yù)測為正。? FP ——False Positive ?——誤報 真陰性:預(yù)測為負(fù)、實際為負(fù)。把負(fù)樣本 成功 預(yù)測為負(fù)。? TN ——True Negative 假陰性:預(yù)測與負(fù)、實際

    2024年01月19日
    瀏覽(20)
  • ubuntu深度學(xué)習(xí)使用TensorFlow卷積神經(jīng)網(wǎng)絡(luò)——圖片數(shù)據(jù)集的制作以及制作好的數(shù)據(jù)集的使用

    ubuntu深度學(xué)習(xí)使用TensorFlow卷積神經(jīng)網(wǎng)絡(luò)——圖片數(shù)據(jù)集的制作以及制作好的數(shù)據(jù)集的使用

    首先我事先準(zhǔn)備好五分類的圖片放在對應(yīng)的文件夾,圖片資源在我的gitee文件夾中鏈接如下: 文件管理: 用于存各種數(shù)據(jù) https://gitee.com/xiaoxiaotai/file-management.git ?里面有imgs目錄和npy目錄,imgs就是存放5分類的圖片的目錄,里面有桂花、楓葉、五味子、銀杏、竹葉5種植物,npy目

    2024年02月05日
    瀏覽(92)
  • [MOT Challenge]官方生成多目標(biāo)跟蹤算法性能評價指標(biāo)結(jié)果,解決test數(shù)據(jù)集沒有g(shù)t文件和官網(wǎng)注冊問題

    [MOT Challenge]官方生成多目標(biāo)跟蹤算法性能評價指標(biāo)結(jié)果,解決test數(shù)據(jù)集沒有g(shù)t文件和官網(wǎng)注冊問題

    最近在做一個多目標(biāo)跟蹤相關(guān)項目,搞過多目標(biāo)跟蹤的都知道 MOT Challenge 這個benchmark數(shù)據(jù)集,其包含MOT15,MOT16等多個數(shù)據(jù)集,每個數(shù)據(jù)集又可以劃分為test和train兩類。 但是,官方提供的test數(shù)據(jù)集是不包含gt.txt的(即真實跟蹤框的標(biāo)注信息),所以我們無法用motmetrics得到MOTA,IDF

    2024年02月03日
    瀏覽(26)
  • 目標(biāo)檢測評價指標(biāo)

    目標(biāo)檢測評價指標(biāo)

    IoU(交并比) 1、IOU的全稱為交并比(Intersection over Union), 是目標(biāo)檢測中使用的一個概念,IoU計算的是“預(yù)測的邊框”和“真實的邊框”的交疊率,即它們的交集和并集的比值 。 2、IoU等于“預(yù)測的邊框”和“真實的邊框”之間交集和并集的比值。 IoU計算如下圖,B1為真實

    2024年02月05日
    瀏覽(22)
  • 模型評價指標(biāo)—F1值

    最近空余時間在參加數(shù)字中國創(chuàng)新大賽,比賽規(guī)則是根據(jù)模型的F1值對參賽者進行排名。為了更深刻地理解這個指標(biāo),我最近對它做了一些梳理,現(xiàn)在把它分享給更多有需要的人圖片。最近在參賽時也發(fā)現(xiàn)了一個問題,就是算法在訓(xùn)練集上完全擬合(KS=1),但是到測試集上衰退

    2024年02月08日
    瀏覽(18)
  • 評價指標(biāo)BLUE了解

    BLEU (Bilingual Evaluation Understudy,雙語評估基準(zhǔn))是一組度量機器翻譯和自然語言生成模型性能的評估指標(biāo)。BLEU指標(biāo)是由IBM公司提出的一種模型評估方法,以便在機器翻譯領(lǐng)域中開發(fā)更好的翻譯模型。BLEU指標(biāo)根據(jù)生成的句子與人工參考句子之間的詞、短語和n-gram匹配來計算模型的

    2024年02月11日
    瀏覽(26)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包