一、BreakHis (Breast Cancer Histopathological Database)
乳腺癌組織病理學(xué)圖像分類(lèi) (BreakHis) 由使用不同放大倍數(shù)(40 倍、100 倍、200 倍和 400 倍)從 82 名患者收集的 9,109 張乳腺腫瘤組織顯微圖像組成。 它包含 2,480 個(gè)良性樣本和 5,429 個(gè)惡性樣本(700X460 像素,3 通道 RGB,每個(gè)通道 8 位深度,PNG 格式)。 該數(shù)據(jù)庫(kù)是與巴西巴拉那州 P&D 病理解剖學(xué)和細(xì)胞病理學(xué)實(shí)驗(yàn)室合作建立的。
二、Chaoyang
Chaoyang數(shù)據(jù)集包含1111個(gè)正常樣本、842個(gè)鋸齒狀樣本、1404個(gè)腺癌樣本、664個(gè)腺瘤樣本,以及705個(gè)正常樣本、321個(gè)鋸齒狀樣本、840個(gè)腺癌樣本、273個(gè)腺瘤樣本分別用于訓(xùn)練和測(cè)試。 這個(gè)嘈雜的數(shù)據(jù)集是在真實(shí)場(chǎng)景中構(gòu)建的。
詳情:來(lái)自朝陽(yáng)醫(yī)院的結(jié)腸切片,補(bǔ)片尺寸為512×512。我們邀請(qǐng)了3位專(zhuān)業(yè)病理學(xué)家分別對(duì)補(bǔ)片進(jìn)行標(biāo)記。 我們將3位病理學(xué)家一致結(jié)果的標(biāo)記補(bǔ)丁部分作為測(cè)試集。 其他我們用作訓(xùn)練集。 對(duì)于訓(xùn)練集中三位醫(yī)生標(biāo)注意見(jiàn)不一致的樣本(這部分約占40%),我們隨機(jī)選取三位醫(yī)生其中一位的意見(jiàn)。
原始 WSI 以 20 倍物鏡放大倍數(shù)進(jìn)行掃描。
三、Colored-MNIST(with spurious correlation)
這是一個(gè)具有虛假相關(guān)性的數(shù)據(jù)集,可用于評(píng)估分布外泛化、因果推理和相關(guān)領(lǐng)域的機(jī)器學(xué)習(xí)方法。
四、F-CelebA (10 tasks) (Federated-CelebA (10 tasks))
F-CelebA - 該數(shù)據(jù)集改編自聯(lián)邦學(xué)習(xí)。 聯(lián)邦學(xué)習(xí)是一種新興的機(jī)器學(xué)習(xí)范式,強(qiáng)調(diào)數(shù)據(jù)隱私。 這個(gè)想法是通過(guò)模型聚合而不是傳統(tǒng)的數(shù)據(jù)聚合進(jìn)行訓(xùn)練,并將本地?cái)?shù)據(jù)保留在本地設(shè)備上。 該數(shù)據(jù)集自然由類(lèi)似的任務(wù)組成,這 10 個(gè)任務(wù)中的每一個(gè)都包含名人的圖像,并根據(jù)他/她是否微笑進(jìn)行標(biāo)記。 更詳細(xì)請(qǐng)查看頁(yè)面https://github.com/ZixuanKe/CAT
五、Grocery Store
雜貨店是雜貨自然圖像的數(shù)據(jù)集。 所有自然圖像都是用智能手機(jī)相機(jī)在不同的雜貨店拍攝的。 它包含來(lái)自 81 種不同類(lèi)別的水果、蔬菜和紙盒物品(例如果汁、牛奶、酸奶)的 5,125 張自然圖像。 這 81 個(gè)類(lèi)別分為 42 個(gè)粗粒度類(lèi)別,例如 細(xì)粒度類(lèi)“Royal Gala”和“Granny Smith”屬于同一個(gè)粗粒度類(lèi)“Apple”。 此外,每個(gè)細(xì)粒度類(lèi)別都有關(guān)聯(lián)的標(biāo)志性圖像和該項(xiàng)目的產(chǎn)品描述。
六、Kannada-MNIST
Kannada-MNIST 數(shù)據(jù)集是卡納達(dá)語(yǔ)言標(biāo)準(zhǔn) MNIST 數(shù)據(jù)集的直接替代品。
七、MLRSNet
MLRSNet 是一個(gè)用于語(yǔ)義場(chǎng)景理解的多標(biāo)簽高空間分辨率遙感數(shù)據(jù)集。 它提供了從衛(wèi)星捕捉到的世界的不同視角。 即,它由高空間分辨率的光學(xué)衛(wèi)星圖像組成。 MLRSNet包含109,161張遙感圖像,標(biāo)注為46個(gè)類(lèi)別,每個(gè)類(lèi)別的樣本圖像數(shù)量從1,500到3,000不等。 圖像的固定尺寸為 256×256 像素,具有各種像素分辨率(~10m 到 0.1m)。 此外,數(shù)據(jù)集中的每個(gè)圖像都標(biāo)有 60 個(gè)預(yù)定義類(lèi)標(biāo)簽中的幾個(gè),與每個(gè)圖像關(guān)聯(lián)的標(biāo)簽數(shù)量從 1 到 13 不等。該數(shù)據(jù)集可用于基于多標(biāo)簽的圖像分類(lèi)、基于多標(biāo)簽的圖像 檢索和圖像分割。
八、PS-Battles
PS-Battles 數(shù)據(jù)集來(lái)自大量圖像處理愛(ài)好者社區(qū),為視覺(jué)領(lǐng)域的媒體推導(dǎo)和處理檢測(cè)提供了基礎(chǔ)。 該數(shù)據(jù)集由 102’028 個(gè)圖像組成,分為 11’142 個(gè)子集,每個(gè)子集包含原始圖像以及不同數(shù)量的操縱導(dǎo)數(shù)。
九、PlantDoc
PlantDoc 是用于視覺(jué)植物病害檢測(cè)的數(shù)據(jù)集。 該數(shù)據(jù)集包含 13 種植物和多達(dá) 17 類(lèi)疾病的 2,598 個(gè)數(shù)據(jù)點(diǎn),涉及約 300 個(gè)小時(shí)的工作時(shí)間來(lái)注釋互聯(lián)網(wǎng)抓取的圖像。
十、iCartoonFace
iCartoonFace 數(shù)據(jù)集是一個(gè)大規(guī)模數(shù)據(jù)集,可用于兩個(gè)不同的任務(wù):卡通人臉檢測(cè)和卡通人臉識(shí)別。
十一、AIDER
數(shù)據(jù)集旨在對(duì)無(wú)人機(jī)上的災(zāi)難事件進(jìn)行自動(dòng)空中場(chǎng)景分類(lèi)。
十二、Bamboo
Bamboo 數(shù)據(jù)集是一個(gè)超大規(guī)模、信息密集的數(shù)據(jù)集,用于分類(lèi)和檢測(cè)預(yù)訓(xùn)練。 它建立在集成 24 個(gè)公共數(shù)據(jù)集(例如 ImagenNet、Places365、Object365、OpenImages)的基礎(chǔ)上,并通過(guò)主動(dòng)學(xué)習(xí)添加了新的注釋。 Bamboo 擁有 69M 個(gè)圖像分類(lèi)注釋和 32M 個(gè)對(duì)象邊界框。
十三、Food2K
Food2K 是一個(gè)大型食品識(shí)別數(shù)據(jù)集,包含 2,000 個(gè)類(lèi)別和超過(guò) 100 萬(wàn)張圖像。 與現(xiàn)有的食物識(shí)別數(shù)據(jù)集相比,F(xiàn)ood2K 在類(lèi)別和圖像方面都繞過(guò)了它們一個(gè)數(shù)量級(jí),從而為開(kāi)發(fā)食物視覺(jué)表示學(xué)習(xí)的高級(jí)模型建立了一個(gè)新的具有挑戰(zhàn)性的基準(zhǔn)。 可以進(jìn)一步探索 Food2K,以使更多與食品相關(guān)的任務(wù)受益,包括新興的和更復(fù)雜的任務(wù)(例如,對(duì)食物的營(yíng)養(yǎng)理解),并且 Food2K 上經(jīng)過(guò)訓(xùn)練的模型有望成為提高更多與食品相關(guān)的任務(wù)性能的支柱。文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-785761.html
文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-785761.html
到了這里,關(guān)于【計(jì)算機(jī)視覺(jué) | 圖像分類(lèi)】圖像分類(lèi)常用數(shù)據(jù)集及其介紹(九)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!