一、Oxford 102 Flower (102 Category Flower Dataset)
Oxford 102 Flower 是一個(gè)由 102 個(gè)花卉類別組成的圖像分類數(shù)據(jù)集。 這些花被選為英國(guó)常見(jiàn)的花。 每個(gè)類別由 40 到 258 張圖像組成。
這些圖像具有較大的比例、姿勢(shì)和光線變化。 此外,還存在類別內(nèi)差異較大的類別以及幾個(gè)非常相似的類別。
二、Tiny ImageNet
Tiny ImageNet 包含 200 個(gè)類別的 100000 張圖像(每個(gè)類別 500 個(gè)),縮小為 64×64 彩色圖像。 每個(gè)類有 500 個(gè)訓(xùn)練圖像、50 個(gè)驗(yàn)證圖像和 50 個(gè)測(cè)試圖像。
三、Stanford Cars
斯坦福汽車數(shù)據(jù)集包含 196 類汽車,總共 16,185 張從后方拍攝的圖像。 數(shù)據(jù)幾乎被分為 50-50 個(gè)訓(xùn)練/測(cè)試部分,其中包含 8,144 個(gè)訓(xùn)練圖像和 8,041 個(gè)測(cè)試圖像。 類別通常位于品牌、型號(hào)、年份級(jí)別。 圖像尺寸為 360×240。
四、Places205
Places205數(shù)據(jù)集是一個(gè)以場(chǎng)景為中心的大規(guī)模數(shù)據(jù)集,包含205個(gè)常見(jiàn)場(chǎng)景類別。 訓(xùn)練數(shù)據(jù)集包含來(lái)自這些類別的大約 2,500,000 張圖像。 在訓(xùn)練集中,每個(gè)場(chǎng)景類別具有最少 5,000 張和最多 15,000 張圖像。 驗(yàn)證集包含每個(gè)類別 100 張圖像(總共 20,500 張圖像),測(cè)試集包含每個(gè)類別 200 張圖像(總共 41,000 張圖像)。
五、DTD (Describable Textures Dataset)
可描述紋理數(shù)據(jù)集 (DTD) 包含 5640 個(gè)野外紋理圖像。 它們具有受紋理感知特性啟發(fā)的以人為中心的屬性注釋。
六、Food-101
Food-101 數(shù)據(jù)集包含 101 個(gè)食物類別,每個(gè)類別有 750 張訓(xùn)練圖像和 250 張測(cè)試圖像,總共 101k 張圖像。 測(cè)試圖像的標(biāo)簽已被手動(dòng)清理,而訓(xùn)練集包含一些噪聲。
七、iNaturalist
iNaturalist 2017 數(shù)據(jù)集 (iNat) 包含來(lái)自 5,089 個(gè)自然細(xì)粒度類別的 675,170 張訓(xùn)練和驗(yàn)證圖像。 這些類別屬于13個(gè)超級(jí)類別,包括Plantae(植物)、Insecta(昆蟲(chóng))、Aves(鳥(niǎo)類)、Mammalia(哺乳動(dòng)物)等。 iNat 數(shù)據(jù)集高度不平衡,每個(gè)類別的圖像數(shù)量差異很大。 例如,最大的超類別“Plantae(植物)”有來(lái)自 2,101 個(gè)類別的 196,613 張圖像; 而最小的超類別“原生動(dòng)物”只有 4 個(gè)類別的 381 張圖像。
八、Caltech-256
Caltech-256 是一個(gè)對(duì)象識(shí)別數(shù)據(jù)集,包含 30,607 個(gè)不同大小的真實(shí)世界圖像,涵蓋 257 個(gè)類別(256 個(gè)對(duì)象類別和一個(gè)額外的雜波類別)。 每個(gè)類別至少由 80 張圖像表示。 該數(shù)據(jù)集是 Caltech-101 數(shù)據(jù)集的超集。
九、PASCAL VOC (PASCAL Visual Object Classes Challenge)
PASCAL Visual Object Classes (VOC) 2012 數(shù)據(jù)集包含 20 個(gè)對(duì)象類別,包括車輛、家庭、動(dòng)物和其他:飛機(jī)、自行車、船、公共汽車、汽車、摩托車、火車、瓶子、椅子、餐桌、盆栽植物、沙發(fā)、 電視/顯示器、鳥(niǎo)、貓、牛、狗、馬、羊和人。 該數(shù)據(jù)集中的每個(gè)圖像都有像素級(jí)分割注釋、邊界框注釋和對(duì)象類注釋。 該數(shù)據(jù)集已廣泛用作對(duì)象檢測(cè)、語(yǔ)義分割和分類任務(wù)的基準(zhǔn)。 PASCAL VOC 數(shù)據(jù)集分為三個(gè)子集:1,464 個(gè)用于訓(xùn)練的圖像、1,449 個(gè)用于驗(yàn)證的圖像和一個(gè)私有測(cè)試集。
十、FGVC-Aircraft
FGVC-Aircraft 包含 10,200 張飛機(jī)圖像,其中 102 種不同的飛機(jī)模型變體各有 100 張圖像,其中大多數(shù)是飛機(jī)。 每幅圖像中的(主)飛機(jī)都用緊密邊界框和分層飛機(jī)模型標(biāo)簽進(jìn)行注釋。 飛機(jī)模型按四級(jí)層次結(jié)構(gòu)組織。 這四個(gè)級(jí)別從細(xì)到粗分別是:
型號(hào),例如 波音 737-76J。 由于某些模型在視覺(jué)上幾乎無(wú)法區(qū)分,因此在評(píng)估中不使用該級(jí)別。
變體,例如 波音 737-700。 一種變體將所有視覺(jué)上無(wú)法區(qū)分的模型合并為一類。 該數(shù)據(jù)集包含 102 個(gè)不同的變體。
家庭,例如 波音 737。該數(shù)據(jù)集包含 70 個(gè)不同的系列。
制造商,例如 波音。 該數(shù)據(jù)集包含 41 個(gè)不同的制造商。 數(shù)據(jù)分為三個(gè)大小相等的訓(xùn)練、驗(yàn)證和測(cè)試子集。
十一、tieredImageNet
tieredImageNet 數(shù)據(jù)集是 ILSVRC-12 的較大子集,包含 608 個(gè)類(779,165 個(gè)圖像),在 ImageNet 人工管理的層次結(jié)構(gòu)中分為 34 個(gè)更高級(jí)別的節(jié)點(diǎn)。 這組節(jié)點(diǎn)被劃分為 20、6 和 8 個(gè)不相交的訓(xùn)練、驗(yàn)證和測(cè)試節(jié)點(diǎn)集,相應(yīng)的類形成各自的元集。 正如 Ren 等人所爭(zhēng)論的那樣。 (2018),ImageNet 層次結(jié)構(gòu)根部附近的這種分裂導(dǎo)致了更具挑戰(zhàn)性但更現(xiàn)實(shí)的制度,其中測(cè)試類與訓(xùn)練類不太相似。
文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-775473.html
十二、EuroSAT
Eurosat 是用于土地利用和土地覆蓋分類的數(shù)據(jù)集和深度學(xué)習(xí)基準(zhǔn)。 該數(shù)據(jù)集基于 Sentinel-2 衛(wèi)星圖像,涵蓋 13 個(gè)光譜帶,由 10 個(gè)類別組成,總共 27,000 張標(biāo)記和地理參考圖像。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-775473.html
到了這里,關(guān)于【計(jì)算機(jī)視覺(jué) | 圖像分類】圖像分類常用數(shù)據(jù)集及其介紹(二)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!