国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

12大類150個(gè)圖像處理和深度學(xué)習(xí)開源數(shù)據(jù)集

這篇具有很好參考價(jià)值的文章主要介紹了12大類150個(gè)圖像處理和深度學(xué)習(xí)開源數(shù)據(jù)集。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

12大類 150個(gè)圖像處理和深度學(xué)習(xí)開源數(shù)據(jù)集

本文整理了150 個(gè)深度學(xué)習(xí)和圖像處理領(lǐng)域的開源數(shù)據(jù)集,包括:目標(biāo)檢測(cè)、人臉識(shí)別、文本識(shí)別、圖像分類、缺陷檢測(cè)、醫(yī)學(xué)影像、圖像分割、圖像去霧、關(guān)鍵點(diǎn)檢測(cè)、動(dòng)作識(shí)別、姿態(tài)估計(jì)、自動(dòng)駕駛和 RGBT 等12個(gè)方向。


1. 目標(biāo)檢測(cè)(detection)

tinyperson數(shù)據(jù)集下載,隨筆,深度學(xué)習(xí),深度學(xué)習(xí),圖像處理,開源,人工智能

1. T-LESS數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:39000
數(shù)據(jù)集下載地址:http://cmp.felk.cvut.cz/t-less/
說明:
T-LESS 是被用于無紋理對(duì)象檢測(cè)和 6D 姿態(tài)估計(jì)的 RGB-D 數(shù)據(jù)集,其被用于無紋理剛體對(duì)象 6D 姿態(tài)的估計(jì)。
這套數(shù)據(jù)集擁有 30 個(gè)不同行業(yè)的對(duì)象,由于沒有明顯的紋理、可辨別的顏色和反射特性,因此物體在形狀和尺寸上表現(xiàn)出對(duì)稱性和相似性。
該數(shù)據(jù)集還包括利用三個(gè)同步傳感器捕獲的訓(xùn)練圖像,數(shù)據(jù)源包括結(jié)構(gòu)光、RGB-D 傳感器和高分辨率相機(jī),每個(gè)傳感器有大約 39k 的訓(xùn)練圖像以及 10k 的測(cè)試圖像。


2. H2O 行人交互檢測(cè)數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:10300
數(shù)據(jù)集下載地址:https://kalisteo.cea.fr/wp-content/uploads/2021/12/README_H2O.html
說明:
H2O由V-COCO數(shù)據(jù)集中的10301張圖像組成,其中添加了3635張圖像,這些圖像主要包含人與人之間的互動(dòng)。所有的H2O圖像都用一種新的動(dòng)詞分類法進(jìn)行了注釋,包括人與物和人與人之間的互動(dòng)。該分類法由51個(gè)動(dòng)詞組成,分為5類。


3. SpotGarbage垃圾識(shí)別數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:2560
數(shù)據(jù)集下載地址:https://github.com/spotgarbage/spotgarbage-GINI
說明:
圖像中的垃圾(GINI)數(shù)據(jù)集是SpotGarbage引入的一個(gè)數(shù)據(jù)集,包含2561張圖像,956張圖像包含垃圾,其余的是在各種視覺屬性方面與垃圾非常相似的非垃圾圖像。


4. NAO自然界對(duì)抗樣本數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:7934
數(shù)據(jù)集下載地址:https://arxiv.org/pdf/2111.04204v1.pdf
說明:
NAO包含7934張圖像和9943個(gè)對(duì)象,這些圖像未經(jīng)修改,代表了真實(shí)世界的場(chǎng)景,但會(huì)導(dǎo)致最先進(jìn)的檢測(cè)模型以高置信度錯(cuò)誤分類。與標(biāo)準(zhǔn)MSCOCO驗(yàn)證集相比,在NAO上評(píng)估時(shí),EfficientDet-D7的平均精度(mAP)下降了74.5%。


5. Labelme 圖像數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:1000
數(shù)據(jù)集下載地址:https://www.cvmart.net/dataSets/labelme2.csail.mit.edu
說明:
Labelme Dataset 是用于目標(biāo)識(shí)別的圖像數(shù)據(jù)集,涵蓋 1000 多個(gè)完全注釋和 2000 個(gè)部分注釋的圖像,其中部分注釋圖像可以被用于訓(xùn)練標(biāo)記算法 ,測(cè)試集擁有來自于世界不同地方拍攝的圖像,這可以保證圖片在續(xù)聯(lián)和測(cè)試之間會(huì)有較大的差異。


6. 印度車輛數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/dataclusterlabs/indian-vehicle-dataset
說明:
該數(shù)據(jù)集包括小眾印度車輛的圖像,如Autorikshaw、Tempo、卡車等。該數(shù)據(jù)集由用于分類和目標(biāo)檢測(cè)的小眾印度車輛圖像組成。據(jù)觀察,這些小眾車輛(如autorickshaw、tempo、trucks等)上幾乎沒有可用的數(shù)據(jù)集。這些圖像是在白天、晚上和晚上的不同天氣條件下拍攝的。該數(shù)據(jù)集具有各種各樣的照明、距離、視點(diǎn)等變化。該數(shù)據(jù)集代表了一組非常具有挑戰(zhàn)性的利基類車輛圖像。該數(shù)據(jù)集可用于駕駛員輔助系統(tǒng)、自動(dòng)駕駛等的圖像識(shí)別和目標(biāo)檢測(cè)。


7. Seeing 3D chairs椅子檢測(cè)模型

類型:目標(biāo)檢測(cè)
數(shù)量:1000
數(shù)據(jù)集下載地址:https://www.di.ens.fr/willow/research/seeing3Dchairs/
說明:
椅子數(shù)據(jù)集包含大約1000個(gè)不同三維椅子模型的渲染圖像。


8. SUN09場(chǎng)景理解數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:12000
數(shù)據(jù)集下載地址:http://people.csail.mit.edu/myungjin/HContext.html
說明:
SUN09數(shù)據(jù)集包含12000個(gè)帶注釋的圖像,其中包含200多個(gè)對(duì)象類別。它由自然、室內(nèi)和室外圖像組成。每個(gè)圖像平均包含7個(gè)不同的注釋對(duì)象,每個(gè)對(duì)象的平均占用率為圖像大小的5%。對(duì)象類別的頻率遵循冪律分布。發(fā)布者使用 397 個(gè)采樣良好的類別進(jìn)行場(chǎng)景識(shí)別,并以此搭配最先進(jìn)的算法建立新的性能界限。


9. Unsplash圖片檢索數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:
數(shù)據(jù)集下載地址:https://unsplash.com/data
說明:
使用迄今為止公開共享的全球最大的開放檢索信息數(shù)據(jù)集。是由250000多名攝影師和數(shù)以千計(jì)的應(yīng)用程序、用途和上下文的數(shù)十億次搜索創(chuàng)建的,包含了數(shù)十億次照片搜索的信息和對(duì)應(yīng)的照片信息。由于Unsplash數(shù)據(jù)集中包含廣泛的意圖和語義,它為研究和學(xué)習(xí)提供了新的機(jī)會(huì)。


10. HICO-DET人物交互檢測(cè)數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:47776
數(shù)據(jù)集下載地址:https://soda-2d.github.io/download.html
說明:
HICO-DET是一個(gè)用于檢測(cè)圖像中人-物交互(HOI)的數(shù)據(jù)集。它包含47776幅圖像(列車組38118幅,測(cè)試組9658幅),600個(gè)HOI類別,由80個(gè)賓語類別和117個(gè)動(dòng)詞類別構(gòu)成。HICO-DET提供了超過150k個(gè)帶注釋的人類對(duì)象對(duì)。V-COCO提供了10346張圖像(2533張用于培訓(xùn),2867張用于驗(yàn)證,4946張用于測(cè)試)和16199人的實(shí)例。


11. 上海科技大學(xué)人群統(tǒng)計(jì)數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:1198
數(shù)據(jù)集下載地址:https://github.com/desenzhou/ShanghaiTechDataset
說明:
上??萍紨?shù)據(jù)集是一個(gè)大規(guī)模的人群統(tǒng)計(jì)數(shù)據(jù)集。它由1198張帶注釋的群組圖像組成。
數(shù)據(jù)集分為兩部分,A部分包含482張圖像,B部分包含716張圖像。A部分分為訓(xùn)練和測(cè)試子集,分別由300和182張圖像組成。B部分分為400和316張圖像組成的序列和測(cè)試子集。群組圖像中的每個(gè)人都有一個(gè)靠近頭部中心的點(diǎn)進(jìn)行注釋??偟膩碚f,該數(shù)據(jù)集由33065名帶注釋的人組成。A部分的圖像是從互聯(lián)網(wǎng)上收集的,而B部分的圖像是在上海繁忙的街道上收集的。


12. DOTA航拍圖像數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:1793658
數(shù)據(jù)集下載地址:https://captain-whu.github.io/DOTA/dataset.html
說明:
DOTA是用于航空?qǐng)D像中目標(biāo)檢測(cè)的大型數(shù)據(jù)集。它可以用于開發(fā)和評(píng)估航空?qǐng)D像中的目標(biāo)探測(cè)器。這些圖像是從不同的傳感器和平臺(tái)收集的。每個(gè)圖像的大小在800×800到20000×20000像素之間,包含顯示各種比例、方向和形狀的對(duì)象。DOTA圖像中的實(shí)例由航空?qǐng)D像解釋專家通過任意(8 d.o.f.)四邊形進(jìn)行注釋。
DOTA-v1.0包含15個(gè)常見類別、2806個(gè)圖像和188282個(gè)實(shí)例。DOTA-v1.0中訓(xùn)練集、驗(yàn)證集和測(cè)試集的比例分別為1/2、1/6和1/3。
DOTA-v2.0收集更多谷歌地球、GF-2衛(wèi)星和航空?qǐng)D像。DOTA-v2.0中有18個(gè)常見類別、11268個(gè)圖像和1793658個(gè)實(shí)例。


13. 生活垃圾數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:9000
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/dataclusterlabs/domestic-trash-garbage-dataset
說明:
該數(shù)據(jù)集是一組極具挑戰(zhàn)性的原始垃圾/垃圾圖像,共有9000多張,這些圖像來自2000多個(gè)城市和農(nóng)村地區(qū)。
圖像是在各種照明條件、天氣、室內(nèi)和室外條件下拍攝的。該數(shù)據(jù)集可用于制作垃圾/垃圾檢測(cè)模型、環(huán)保替代建議、碳足跡生成等。


14. 火焰和煙霧圖像數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:7000
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/dataclusterlabs/fire-and-smoke-dataset
說明:
該數(shù)據(jù)集由早期火災(zāi)和煙霧的圖像數(shù)據(jù)集組成。數(shù)據(jù)集由在真實(shí)場(chǎng)景中使用手機(jī)拍攝的早期火災(zāi)和煙霧圖像組成。大約有7000張圖像數(shù)據(jù)。圖像是在各種照明條件(室內(nèi)和室外場(chǎng)景)、天氣等條件下拍攝的。該數(shù)據(jù)集非常適合早期火災(zāi)和煙霧探測(cè)。
數(shù)據(jù)集可用于火災(zāi)和煙霧識(shí)別、檢測(cè)、早期火災(zāi)和煙霧、異常檢測(cè)等。數(shù)據(jù)集還包括典型的家庭場(chǎng)景,如垃圾焚燒、紙塑焚燒、田間作物焚燒、家庭烹飪等。


15. 全球小麥檢測(cè)數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:4700
數(shù)據(jù)集下載地址:https://www.kaggle.com/c/global-wheat-detection/data
說明:
檢測(cè)小麥穗是一項(xiàng)重要任務(wù),可以估計(jì)相關(guān)性狀,包括穗種群密度和穗特征,如衛(wèi)生狀況、大小、成熟階段和芒的存在。
本數(shù)據(jù)集包含 4,700 張高分辨率 RGB 圖像和 190,000 個(gè)標(biāo)記的小麥頭,這些小麥頭采集自世界各地不同生長(zhǎng)階段的不同基因型的多個(gè)國(guó)家。


16. 坑洼檢測(cè)數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:700
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/chitholian/annotated-potholes-dataset
說明:
本數(shù)據(jù)集匯總了700個(gè)在坑洼處帶有3K +注釋的圖像,用于從道路圖像中檢測(cè)坑洼,檢測(cè)道路地形和坑洼。


17. Linkopings交通標(biāo)志數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:20000
數(shù)據(jù)集下載地址:http://www.cvl.isy.liu.se/research/datasets/traffic-signs-dataset/
說明:
通過記錄超過 350 公里的瑞典高速公路和城市道路的序列,創(chuàng)建了一個(gè)數(shù)據(jù)集。
一個(gè) 1.3 兆像素的彩色攝像機(jī),一個(gè)點(diǎn)灰色變色龍,被放置在一輛汽車的儀表板上,從前窗向外看。攝像頭略微指向右側(cè),以便盡可能多地覆蓋相關(guān)標(biāo)志。該鏡頭的焦距為 6.5 毫米,視野約為 41 度。高速公路上的典型速度標(biāo)志大約為 90 cm 寬,如果要在大約 30 m 的距離處檢測(cè)到它們,則對(duì)應(yīng)于大約 50 像素的大小??偣灿涗浟顺^ 20 000 幀,其中每五幀被手動(dòng)標(biāo)記。每個(gè)標(biāo)志的標(biāo)簽包含標(biāo)志類型(人行橫道、指定車道右側(cè)、禁止站立或停車、優(yōu)先道路、讓路、50 公里/小時(shí)或 30 公里/小時(shí))、能見度狀態(tài)(遮擋、模糊或可見)和道路狀態(tài)(是否標(biāo)志是在正在行駛的道路上或在小路上)。


18. 防護(hù)裝備-頭盔和背心檢測(cè)

類型:目標(biāo)檢測(cè)
數(shù)量:
數(shù)據(jù)集下載地址:https://github.com/ciber-lab/pictor-ppe
說明:
包含 774 個(gè)人群圖像和 698 個(gè)網(wǎng)絡(luò)挖掘圖像。人群和網(wǎng)絡(luò)挖掘的圖像分別包含 2,496 和 2,230 個(gè)工人實(shí)例。


19. 水下垃圾檢測(cè)數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:5700
數(shù)據(jù)集下載地址:https://conservancy.umn.edu/handle/11299/214366
說明:
該數(shù)據(jù)來自 J-EDI 海洋垃圾數(shù)據(jù)集。構(gòu)成該數(shù)據(jù)集的視頻在質(zhì)量、深度、場(chǎng)景中的對(duì)象和使用的相機(jī)方面差異很大。它們包含許多不同類型的海洋垃圾的圖像,這些圖像是從現(xiàn)實(shí)世界環(huán)境中捕獲的,提供了處于不同衰減、遮擋和過度生長(zhǎng)狀態(tài)的各種物體。此外,水的清晰度和光的質(zhì)量因視頻而異。這些視頻經(jīng)過處理以提取 5,700 張圖像,這些圖像構(gòu)成了該數(shù)據(jù)集,所有圖像都在垃圾實(shí)例、植物和動(dòng)物等生物對(duì)象以及 ROV 上標(biāo)有邊界框。


20. 小目標(biāo)檢測(cè)數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:800
數(shù)據(jù)集下載地址:http://visal.cs.cityu.edu.hk/downloads/smallobjects/
說明:
從Internet(例如YouTube或Google)上的圖像/視頻收集的四個(gè)小物體數(shù)據(jù)集,包括4種類型的圖像,可用于小物體目標(biāo)檢測(cè)的研究。
數(shù)據(jù)集包含四類:
fly:飛行數(shù)據(jù)集,包含600個(gè)視頻幀,平均每幀86±39個(gè)物體(648×72 @ 30 fps)。32張圖像用于訓(xùn)練(1:6:187),50張圖像用于測(cè)試(301:6:600)。
honeybee:蜜蜂數(shù)據(jù)集,包含118張圖像,每張圖像平均有28±6個(gè)蜜蜂(640×480)。數(shù)據(jù)集被平均分配用于訓(xùn)練和測(cè)試集。僅前32張圖像用于訓(xùn)練。
seagull:海鷗數(shù)據(jù)集,包含三個(gè)高分辨率圖像(624×964),每個(gè)圖像平均有866±107個(gè)海鷗。第一張圖片用于訓(xùn)練,其余圖片用于測(cè)試。
fish:魚數(shù)據(jù)集,包含387幀視頻數(shù)據(jù),平均每幀56±9條魚(300×410 @ 30 fps)。32張圖像進(jìn)行訓(xùn)練(1:3:94),65張圖像進(jìn)行測(cè)試(193:3:387)。


21. AI-TOD航空?qǐng)D像數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:28000
數(shù)據(jù)集下載地址:https://github.com/jwwangchn/AI-TOD
說明:
AI-TOD 在 28,036 張航拍圖像中包含 8 個(gè)類別的 700,621 個(gè)對(duì)象實(shí)例。與現(xiàn)有航拍圖像中的目標(biāo)檢測(cè)數(shù)據(jù)集相比,AI-TOD 中目標(biāo)的平均大小約為 12.8 像素,遠(yuǎn)小于其他數(shù)據(jù)集。


22. iSAID航空?qǐng)D像大規(guī)模數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:2800
數(shù)據(jù)集下載地址:https://captain-whu.github.io/iSAID/dataset.html
說明:
iSAID 是第一個(gè)用于航空?qǐng)D像實(shí)例分割的基準(zhǔn)數(shù)據(jù)集。這個(gè)大規(guī)模和密集注釋的數(shù)據(jù)集包含 2,806 張高分辨率圖像的 15 個(gè)類別的 655,451 個(gè)對(duì)象實(shí)例。


23. TinyPerson數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:1600
數(shù)據(jù)集下載地址:https://github.com/ucas-vg/PointTinyBenchmark/tree/master/dataset
說明:
在 TinyPerson 中有 1610 個(gè)標(biāo)記圖像和 759 個(gè)未標(biāo)記圖像(兩者主要來自同一視頻集),總共有 72651 個(gè)注釋。


24. Deepscores 數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:1600
數(shù)據(jù)集下載地址:https://tuggeluk.github.io/deepscores/
說明:
DeepScores 包含高質(zhì)量的樂譜圖像,分為 300 0 000 張書面音樂,其中包含不同形狀和大小的符號(hào)。
擁有近一億個(gè)小對(duì)象,這使得我們的數(shù)據(jù)集不僅獨(dú)一無二,而且是最大的公共數(shù)據(jù)集。DeepScores 帶有用于對(duì)象分類、檢測(cè)和語義分割的基本事實(shí)。因此,DeepScores 總體上對(duì)計(jì)算機(jī)視覺提出了相關(guān)挑戰(zhàn),超出了光學(xué)音樂識(shí)別 (OMR) 研究的范圍。


25. 密集行人檢測(cè)數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:13,382
數(shù)據(jù)集下載地址:http://www.cbsr.ia.ac.cn/users/sfzhang/WiderPerson/
說明:
WiderPerson 數(shù)據(jù)集是野外行人檢測(cè)基準(zhǔn)數(shù)據(jù)集,其圖像選自廣泛的場(chǎng)景,不再局限于交通場(chǎng)景。我們選擇了 13,382 張圖像并標(biāo)記了大約 400K 帶有各種遮擋的注釋。我們隨機(jī)選擇 8000/1000/4382 圖像作為訓(xùn)練、驗(yàn)證和測(cè)試子集。與 CityPersons 和 WIDER FACE 數(shù)據(jù)集類似,我們不發(fā)布測(cè)試圖像的邊界框基本事實(shí)。


26. 加州理工學(xué)院行人檢測(cè)數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:13,382
數(shù)據(jù)集下載地址:http://www.vision.caltech.edu/Image_Datasets/CaltechPedestrians/
說明:
加州理工學(xué)院行人數(shù)據(jù)集由大約 10 小時(shí)的 640x480 30Hz 視頻組成,該視頻取自在城市環(huán)境中通過常規(guī)交通行駛的車輛。注釋了大約 250,000 幀(在 137 個(gè)大約分鐘長(zhǎng)的片段中),總共 350,000 個(gè)邊界框和 2300 個(gè)獨(dú)特的行人。注釋包括邊界框和詳細(xì)的遮擋標(biāo)簽之間的時(shí)間對(duì)應(yīng)關(guān)系。


27. NWPU VHR-10衛(wèi)星圖像數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:800
數(shù)據(jù)集下載地址:http://www.escience.cn/people/gongcheng/NWPU-VHR-10.html
說明:
NWPU VHR-10 Dataset 是一個(gè)用于空間物體檢測(cè)的 10 級(jí)地理遙感數(shù)據(jù)集,其擁有 650 張包含目標(biāo)的圖像和 150 張背景圖像,共計(jì) 800 張,目標(biāo)種類包括飛機(jī)、艦船、油罐、棒球場(chǎng)、網(wǎng)球場(chǎng)、籃球場(chǎng)、田徑場(chǎng)、港口、橋梁和汽車共計(jì) 10 個(gè)類別。


28. Inria 航空影像數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:800
數(shù)據(jù)集下載地址:https://project.inria.fr/aerialimagelabeling/
說明:
Inria 航空影像標(biāo)注解決了遙感中的一個(gè)核心主題:航空影像的自動(dòng)像素級(jí)標(biāo)注。
數(shù)據(jù)集覆蓋面積 810 平方公里(405 平方公里用于訓(xùn)練,405 平方公里用于測(cè)試)
空間分辨率為 0.3 m 的航空正射校正彩色圖像
這些圖像涵蓋了不同的城市住區(qū),從人口稠密的地區(qū)到高山城鎮(zhèn)。


29. RSOD遙感圖像數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:800
數(shù)據(jù)集下載地址:https://github.com/RSIA-LIESMARS-WHU/RSOD-Dataset-
說明:
一個(gè)開放的遙感圖像目標(biāo)檢測(cè)數(shù)據(jù)集。數(shù)據(jù)集包括飛機(jī)、油箱、游樂場(chǎng)和立交橋。此數(shù)據(jù)集的格式為PASCAL VOC。數(shù)據(jù)集包括4個(gè)文件,每個(gè)文件用于一種對(duì)象。
飛機(jī)數(shù)據(jù)集,446張圖片中有4993架飛機(jī)。
操場(chǎng),189張圖片中的191個(gè)操場(chǎng)。
天橋,176張圖片中的180座天橋。
油箱,165張圖片中的1586個(gè)油箱。


30. EDS 數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:14219
數(shù)據(jù)集下載地址: https://github.com/DIG-Beihang/PSN
說明:
EDS 數(shù)據(jù)集針對(duì)由機(jī)器硬件參數(shù)引起的難以察覺的域間偏移問題研究,包含了來自 3 臺(tái)不同 X 光機(jī)器的 14219 張圖片, 其中 10 類物品, 共計(jì) 31655 個(gè)目標(biāo)實(shí)例,均由專業(yè)標(biāo)注人員進(jìn)行標(biāo)注。


31. 多顯著性對(duì)象數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:1224
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/jessicali9530/mso-dataset
說明:
本數(shù)據(jù)集共有 1224 張圖像來自四個(gè)公共圖像數(shù)據(jù)集:COCO、VOC07、ImageNet 和 SUN。Amazon Mechanic Turk 工作人員將每個(gè)圖像標(biāo)記為包含 0、1、2、3 或 4 個(gè)以上的顯著對(duì)象??梢栽趇mgIdx.mat中找到此標(biāo)簽信息以及邊界框注釋,一個(gè)存儲(chǔ)圖像信息的matlab結(jié)構(gòu)數(shù)組。MSO 數(shù)據(jù)集是 SOS 數(shù)據(jù)集測(cè)試集的子集。波士頓大學(xué)的團(tuán)隊(duì)刪除了一些顯著對(duì)象嚴(yán)重重疊或者對(duì)于標(biāo)記指定數(shù)量的顯著對(duì)象不明確的圖像。因此,在來自 SOS 測(cè)試集的 1380 張圖像中,只剩下 1224 張圖像。MSO 數(shù)據(jù)集中超過一半的圖像包含零個(gè)顯著對(duì)象或多個(gè)顯著對(duì)象。這旨在提供更真實(shí)的設(shè)置來評(píng)估顯著對(duì)象檢測(cè)方法。


32. 足球和板球數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/mlwhiz/detection-footballvscricketball
說明:
該數(shù)據(jù)集包含YOLO格式的足球和板球的注釋圖像,為Open Image Dataset 的一個(gè)子集。


33. 交通攝像頭檢測(cè)數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/ryankraus/traffic-camera-object-detection
說明:
該數(shù)據(jù)集是來自伊利諾伊州芝加哥市交通攝像頭的增強(qiáng)隨機(jī)屏幕截圖的集合。在數(shù)據(jù)中,所有車輛都被標(biāo)記在一個(gè)名為 的類別中 car。標(biāo)簽由邊界框組成,并以 YOLOv5 PyTorch 格式存儲(chǔ)。


34. 船只類型數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:1500
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/clorichel/boat-types-recognition
說明:
大約 1,500 張不同大小的船圖片,但按不同類型分類:浮標(biāo)、游輪、渡船、貨船、貢多拉、充氣船、皮劃艇、紙船、帆船。


35. 火星/月球隕石坑探測(cè)數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/lincolnzh/martianlunar-crater-detection-dataset
說明:
數(shù)據(jù)集主要包含圖像數(shù)據(jù)和標(biāo)簽。
圖像數(shù)據(jù):可能包含隕石坑的火星和月球表面圖像。數(shù)據(jù)源混雜。對(duì)于火星圖像,圖像主要來自 ASU 和 USGS;目前所有月球圖像都來自美國(guó)宇航局月球勘測(cè)軌道器任務(wù)。所有圖像均使用 RoboFlow 進(jìn)行預(yù)處理。
標(biāo)簽:每個(gè)圖像都有其關(guān)聯(lián)的 YOLOv5 文本格式的標(biāo)簽文件。標(biāo)注工作由我們自己完成,主要用于物體檢測(cè)。


36. 無人機(jī)檢測(cè)數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:1962
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/nelyg8002000/uav-detection-dataset-images
說明:
該數(shù)據(jù)集包含 1962 個(gè) jpg 無人機(jī)圖像,可以用于圖像分類。
優(yōu)點(diǎn):所有圖像都經(jīng)過清理、裁剪、重復(fù)刪除、劣質(zhì)質(zhì)量刪除等。
缺點(diǎn):圖片為不同的尺寸。


37. COCO2017數(shù)據(jù)集

類型:目標(biāo)檢測(cè)
數(shù)量:158000
數(shù)據(jù)集下載地址:https://github.com/cocodataset/cocoapi
說明:
COCO是微軟團(tuán)隊(duì)提供的一個(gè)可以用來進(jìn)行圖像識(shí)別的大型圖像數(shù)據(jù)集,用于對(duì)象檢測(cè)、分割、人員關(guān)鍵點(diǎn)檢測(cè)、素材分割和字幕生成。
CoCo數(shù)據(jù)集一共有五種標(biāo)注類型:目標(biāo)檢測(cè),關(guān)鍵點(diǎn)檢測(cè),素材分割,全景分割,圖像說明
COCO2017是2017年發(fā)布的COCO數(shù)據(jù)集的一個(gè)版本,共 80 小類,主要用于在2017年后持有的物體檢測(cè)任務(wù)、關(guān)鍵點(diǎn)檢測(cè)任務(wù)和全景分割任務(wù)。




2. 人臉(face)

tinyperson數(shù)據(jù)集下載,隨筆,深度學(xué)習(xí),深度學(xué)習(xí),圖像處理,開源,人工智能

38. GENKI 人臉圖像數(shù)據(jù)集

類型:人臉
數(shù)量:15000
數(shù)據(jù)集下載地址:https://inc.ucsd.edu/mplab/398.php
說明:
GENKI數(shù)據(jù)集是由加利福尼亞大學(xué)的機(jī)器概念實(shí)驗(yàn)室收集。該數(shù)據(jù)集包含GENKI-R2009a,GENKI-4K,GENKI-SZSL三個(gè)部分。GENKI-R2009a包含11159個(gè)圖像,GENKI-4K包含4000個(gè)圖像,分為“笑”和“不笑”兩種,每個(gè)圖片的人臉的尺度大小,姿勢(shì),光照變化,頭的轉(zhuǎn)動(dòng)等都不一樣,專門用于做笑臉識(shí)別。GENKI-SZSL包含3500個(gè)圖像,這些圖像包括廣泛的背景,光照條件,地理位置,個(gè)人身份和種族等。


39. 哥倫比亞大學(xué)公眾人物臉部數(shù)據(jù)庫(kù)

類型:人臉
數(shù)量:58,797
數(shù)據(jù)集下載地址:https://www.cs.columbia.edu/CAVE/databases/pubfig/
說明:
PubFig Dataset 是一個(gè)大型人臉數(shù)據(jù)集,主要用于人臉識(shí)別和身份鑒定,其涵蓋互聯(lián)網(wǎng)上 200 人的 58,797 張圖像,不同于大多數(shù)現(xiàn)有面部數(shù)據(jù)集,這些圖像是在主體完全不受控制的情況下拍攝的,因此不同圖像中姿勢(shì)、光照、表情、場(chǎng)景、相機(jī)、成像條件和參數(shù)存在較大差異,該數(shù)據(jù)集類似于 UMass-Amherst 創(chuàng)建的 LFW 數(shù)據(jù)集。


40. CelebA 人臉數(shù)據(jù)集

類型:人臉
數(shù)量:200000
數(shù)據(jù)集下載地址:http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html
說明:
CelebFaces Attributes Dataset (CelebA) 是一個(gè)大規(guī)模的人臉屬性數(shù)據(jù)集,包含超過 20 萬張名人圖像,每張都有 40 個(gè)屬性注釋。該數(shù)據(jù)集中的圖像涵蓋了較大的姿勢(shì)變化和雜亂的背景。CelebA 種類多、數(shù)量多、注釋豐富,包括10,177 個(gè)身份,202,599 張人臉圖像,以及5 個(gè)地標(biāo)位置,每張圖像 40 個(gè)二進(jìn)制屬性注釋。
該數(shù)據(jù)集可用作以下計(jì)算機(jī)視覺任務(wù)的訓(xùn)練和測(cè)試集:人臉屬性識(shí)別、人臉識(shí)別、人臉檢測(cè)、地標(biāo)(或人臉部分)定位以及人臉編輯與合成。


41. 美國(guó)國(guó)防部人臉庫(kù)

類型:人臉
數(shù)量:10000
數(shù)據(jù)集下載地址:https://www.nist.gov/itl/products-and-services/color-feret-database
說明:
為促進(jìn)人臉識(shí)別算法的研究和實(shí)用化,美國(guó)國(guó)防部的Counterdrug Technology Transfer Program(CTTP)發(fā)起了一個(gè)人臉識(shí)別技術(shù)(Face Recognition Technology 簡(jiǎn)稱FERET)工程,它包括了一個(gè)通用人臉庫(kù)以及通用測(cè)試標(biāo)準(zhǔn)。到1997年,它已經(jīng)包含了1000多人的10000多張照片,每個(gè)人包括了不同表情,光照,姿態(tài)和年齡的照片。


42. MTFL人臉識(shí)別數(shù)據(jù)集

類型:人臉
數(shù)量:12995
數(shù)據(jù)集下載地址:http://mmlab.ie.cuhk.edu.hk/projects/TCDCN.html
說明:
該數(shù)據(jù)集包含 12,995 張人臉圖像,這些圖像用 (1) 五個(gè)面部標(biāo)志,(2) 性別、微笑、戴眼鏡和頭部姿勢(shì)的屬性進(jìn)行了注釋。


43. BioID人臉數(shù)據(jù)集

類型:人臉
數(shù)量:1521
數(shù)據(jù)集下載地址:https://www.bioid.com/facedb/
說明:
這個(gè)數(shù)據(jù)集包含了1521幅分辨率為384x286像素的灰度圖像。每一幅圖像來自于23個(gè)不同的測(cè)試人員的正面角度的人臉。為了便于做比較,這個(gè)數(shù)據(jù)集也包含了對(duì)人臉圖像對(duì)應(yīng)的手工標(biāo)注的人眼位置文件。


44. PersonID人臉識(shí)別數(shù)據(jù)集

類型:人臉
數(shù)量:
數(shù)據(jù)集下載地址:https://cvhci.anthropomatik.kit.edu/~baeuml/publications/semi-supervised-learning-with-constraints-for-person-identification-in-multimedia-data/
說明:
該數(shù)據(jù)集所選用的人臉照片均來自于兩部比較知名的電視劇,《吸血鬼獵人巴菲》和《生活大爆炸》。


45. CMU PIE人臉庫(kù)

類型:人臉
數(shù)量:40000
數(shù)據(jù)集下載地址:http://vasc.ri.cmu.edu/idb/html/face/index.html
說明:
CMU PIE人臉庫(kù)建立于2000年11月,它包括來自68個(gè)人的40000張照片,其中包括了每個(gè)人的13種姿態(tài)條件,43種光照條件和4種表情下的照片,現(xiàn)有的多姿態(tài)人臉識(shí)別的文獻(xiàn)基本上都是在CMU PIE人臉庫(kù)上測(cè)試的。


46. Youtube視頻人臉數(shù)據(jù)集

類型:人臉
數(shù)量:3425
數(shù)據(jù)集下載地址:http://www.cs.tau.ac.il/~wolf/ytfaces/
說明:
該數(shù)據(jù)集包含 1,595 個(gè)不同人的 3,425 個(gè)視頻。所有視頻都是從 YouTube 下載的。每個(gè)主題平均有 2.15 個(gè)視頻可用。最短剪輯時(shí)長(zhǎng)為 48 幀,最長(zhǎng)剪輯為 6070 幀,視頻剪輯的平均長(zhǎng)度為 181.3 幀。在這個(gè)數(shù)據(jù)集下,算法需要判斷兩段視頻里面是不是同一個(gè)人。


47. CASIA 人臉圖像數(shù)據(jù)集

類型:人臉
數(shù)量:2500
數(shù)據(jù)集下載地址:http://biometrics.idealtest.org/dbDetailForUser.do?id=9#/
說明:
CASIA 人臉圖像數(shù)據(jù)庫(kù)版本 5.0(或 CASIA-FaceV5)包含 500 個(gè)對(duì)象的 2,500 個(gè)彩色人臉圖像。CASIA-FaceV5 的面部圖像是使用羅技 USB 攝像頭在一個(gè)會(huì)話中捕獲的。CASIA-FaceV5的志愿者包括研究生、工人、服務(wù)員等。所有人臉圖像均為16位彩色BMP文件,圖像分辨率為640*480。典型的類內(nèi)變化包括照明、姿勢(shì)、表情、眼鏡、成像距離等。


48. Caltech人臉數(shù)據(jù)庫(kù)

類型:人臉
數(shù)量:10,524
數(shù)據(jù)集下載地址:http://www.vision.caltech.edu/Image_Datasets/Caltech_10K_WebFaces/#Description
說明:
該數(shù)據(jù)集包含通過在谷歌圖片搜索中輸入常見的名字從網(wǎng)絡(luò)上收集的人的圖像。每個(gè)正面的眼睛、鼻子和嘴巴中心的坐標(biāo)在地面實(shí)況文件中提供。此信息可用于對(duì)齊和裁剪人臉或作為人臉檢測(cè)算法的基本事實(shí)。該數(shù)據(jù)集有 10,524 個(gè)不同分辨率和不同設(shè)置的人臉,例如 肖像圖像、人群等。側(cè)面或非常低分辨率的面孔未標(biāo)記。


49. RMFD口罩遮擋人臉數(shù)據(jù)集

類型:人臉
數(shù)量:90000
數(shù)據(jù)集下載地址:https://github.com/X-zhangyang/Real-World-Masked-Face-Dataset
說明:
RMFRD目前是世界上最大的真實(shí)口罩遮擋人臉數(shù)據(jù)集。
提出了三種類型的口罩遮擋人臉數(shù)據(jù)集,包括口罩遮擋人臉檢測(cè)數(shù)據(jù)集(MFDD),真實(shí)口罩遮擋人臉識(shí)別數(shù)據(jù)集(RMFRD)和模擬口罩遮擋人臉識(shí)別數(shù)據(jù)集(SMFRD)。
這些數(shù)據(jù)集可供工業(yè)界和學(xué)術(shù)界免費(fèi)使用,基于這些數(shù)據(jù)集,可以開發(fā)口罩遮擋人臉的各種應(yīng)用。
(1) 真實(shí)口罩人臉識(shí)別數(shù)據(jù)集:從網(wǎng)絡(luò)爬取樣本,經(jīng)過整理、清洗和標(biāo)注后,含525人的5千張口罩人臉、9萬正常人臉。
(2) 模擬口罩人臉識(shí)別數(shù)據(jù)集: 給公開數(shù)據(jù)集中的人臉戴上口罩,得到1萬人、50萬張人臉的模擬口罩人臉數(shù)據(jù)集。
(3)真實(shí)口罩人臉驗(yàn)證數(shù)據(jù)集,包括426個(gè)人的4015張人臉圖像,組合成3589對(duì)相同身份和3589對(duì)不同身份的人臉樣本對(duì)(口罩人臉/正常人臉)。


50. IMDB-WIKI人臉數(shù)據(jù)集

類型:人臉
數(shù)量:524230
數(shù)據(jù)集下載地址:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/
說明:
IMDB-WIKI 500k+ 是一個(gè)包含名人人臉圖像、年齡、性別的數(shù)據(jù)集,圖像和年齡、性別信息從 IMDB 和 WiKi 網(wǎng)站抓取,總計(jì) 524230 張名人人臉圖像及對(duì)應(yīng)的年齡和性別。其中,獲取自 IMDB 的 460723 張,獲取自 WiKi 的 62328 張。


51. WiderFace人臉檢測(cè)數(shù)據(jù)集

類型:人臉
數(shù)量:32203
數(shù)據(jù)集下載地址:http://shuoyang1213.me/WIDERFACE/
說明:
WIDER FACE數(shù)據(jù)集是人臉檢測(cè)的一個(gè)benchmark數(shù)據(jù)集,包含32203圖像,以及393,703個(gè)標(biāo)注人臉,其中,158,989個(gè)標(biāo)注人臉位于訓(xùn)練集,39,496個(gè)位于驗(yàn)證集。每一個(gè)子集都包含3個(gè)級(jí)別的檢測(cè)難度:Easy,Medium,Hard。這些人臉在尺度,姿態(tài),光照、表情、遮擋方面都有很大的變化范圍。WIDER FACE選擇的圖像主要來源于公開數(shù)據(jù)集WIDER。制作者來自于香港中文大學(xué),他們選擇了WIDER的61個(gè)事件類別,對(duì)于每個(gè)類別,隨機(jī)選擇40%10%50%作為訓(xùn)練、驗(yàn)證、測(cè)試集。


52. LFW 人像圖像數(shù)據(jù)集

類型:人臉
數(shù)量:1680
數(shù)據(jù)集下載地址:http://vis-www.cs.umass.edu/lfw/#explore
說明:
該數(shù)據(jù)集是用于研究無約束面部識(shí)別問題的面部照片數(shù)據(jù)庫(kù)。數(shù)據(jù)集包含從網(wǎng)絡(luò)收集的13000多張圖像。每張臉都貼上了所畫的人的名字,圖片中的1680人在數(shù)據(jù)集中有兩個(gè)或更多不同的照片。




3. 文本識(shí)別(textg recongition)

tinyperson數(shù)據(jù)集下載,隨筆,深度學(xué)習(xí),深度學(xué)習(xí),圖像處理,開源,人工智能


53.文檔影印和內(nèi)容數(shù)據(jù)

類型:文本識(shí)別
數(shù)量:
數(shù)據(jù)集下載地址: http://www.mediateam.oulu.fi/downloads/MTDB/
說明:
MediaTeam Oulu Document 數(shù)據(jù)集是一個(gè)文檔掃描圖像和文檔內(nèi)容數(shù)據(jù)集,包含 500篇 1975年之前的文檔信息。


54. CASIA手寫數(shù)據(jù)集

類型:文本識(shí)別
數(shù)量:56,469
數(shù)據(jù)集下載地址:http://www.nlpr.ia.ac.cn/databases/handwriting/Touching_Characters_Databases.html
說明:
CASIA-HWDB-T包括56,469個(gè)二字或多字觸摸字符串,其中1,818個(gè)字符串有多個(gè)觸摸字符。 作者還將接觸字符串劃分為 50,157 個(gè)全中文字符串、2,788 個(gè)全數(shù)字字符串、328 個(gè)全字母字符串和 3,196 個(gè)混合字符字符串。 所有的字符串都標(biāo)注了字符類、觸摸點(diǎn)的位置以及字符串高度和平均筆畫寬度等輔助值


55. Twitter地理定位信息數(shù)據(jù)集

類型:文本識(shí)別
數(shù)量:115,886
數(shù)據(jù)集下載地址:https://archive.org/details/twitter_cikm_2010
說明:
該數(shù)據(jù)集是與學(xué)術(shù)項(xiàng)目協(xié)調(diào)使用的公共推特更新的集合,用于研究與推特相關(guān)的地理定位數(shù)據(jù)。訓(xùn)練集包含 115,886 個(gè) Twitter 用戶和來自用戶的 3,844,612 個(gè)更新。用戶的所有位置都在美國(guó)以城市級(jí)粒度進(jìn)行自我標(biāo)記。測(cè)試集包含 5,136 個(gè) Twitter 用戶和來自用戶的 5,156,047 條推文。用戶的所有位置都是從他們的智能手機(jī)以“UT:緯度,經(jīng)度”的形式上傳的


56. 專利短語數(shù)據(jù)集

類型:文本識(shí)別
數(shù)量:
數(shù)據(jù)集下載地址:該數(shù)據(jù)集是為美國(guó)專利短語到短語匹配競(jìng)賽提供的。它通過提供context列中每個(gè)代碼的含義來添加附加信息

說明:
該數(shù)據(jù)集是為美國(guó)專利短語到短語匹配競(jìng)賽提供的。它通過提供context列中每個(gè)代碼的含義來添加附加信息


57. 電影元數(shù)據(jù)

類型:文本識(shí)別
數(shù)量:700000
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/akshaypawar7/millions-of-movies
說明:
這些文件包含 TMDB 數(shù)據(jù)集中列出的超過 700,000 部電影的元數(shù)據(jù)。數(shù)據(jù)集每天更新以確保更新電影數(shù)據(jù)集。數(shù)據(jù)點(diǎn)包括演員、工作人員、情節(jié)關(guān)鍵詞、預(yù)算、收入、海報(bào)、發(fā)布日期、語言、制作公司、國(guó)家、TMDB 投票計(jì)數(shù)和投票平均值、評(píng)論、推薦。


58. Olist 電子商務(wù)公共數(shù)據(jù)集

類型:文本識(shí)別
數(shù)量:100000
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/olistbr/brazilian-ecommerce
說明:
這是在Olist Store下訂單的巴西電子商務(wù)公共數(shù)據(jù)集。該數(shù)據(jù)集包含 2016 年至 2018 年在巴西多個(gè)市場(chǎng)進(jìn)行的 10 萬份訂單的信息。它的功能允許從多個(gè)維度查看訂單:從訂單狀態(tài)、價(jià)格、付款和貨運(yùn)績(jī)效到客戶位置、產(chǎn)品屬性,最后是客戶撰寫的評(píng)論。這是真實(shí)的商業(yè)數(shù)據(jù),已匿名,評(píng)論文本中對(duì)公司和合作伙伴的引用已替換為《權(quán)力的游戲》大家族的名稱。


59. Top1000的Github存儲(chǔ)庫(kù)數(shù)據(jù)集

類型:文本識(shí)別
數(shù)量:
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/anshulmehtakaggl/top-1000-github-repositories-for-multiple-domains
說明:
關(guān)于 Github 上的 1000 個(gè)最受歡迎的關(guān)鍵字存儲(chǔ)庫(kù)的詳盡數(shù)據(jù)




4. 圖像分類(image classification)

tinyperson數(shù)據(jù)集下載,隨筆,深度學(xué)習(xí),深度學(xué)習(xí),圖像處理,開源,人工智能

60. MNIST 手寫數(shù)字圖像數(shù)據(jù)集

類型:分類
數(shù)量:70000
數(shù)據(jù)集下載地址: http://yann.lecun.com/exdb/mnist/
說明:
MNIST數(shù)據(jù)集是一個(gè)手寫阿拉伯?dāng)?shù)字圖像識(shí)別數(shù)據(jù)集,圖片分辨率為 20x20 灰度圖圖片,包含‘0 - 9’ 十組手寫手寫阿拉伯?dāng)?shù)字的圖片。其中,訓(xùn)練樣本 60000 ,測(cè)試樣本 10000,數(shù)據(jù)為圖片的像素點(diǎn)值,作者已經(jīng)對(duì)數(shù)據(jù)集進(jìn)行了壓縮。


61. GTSRB德國(guó)交通標(biāo)志數(shù)據(jù)集

類型:分類
數(shù)量:50000
數(shù)據(jù)集下載地址:https://benchmark.ini.rub.de/gtsrb_news.html
說明:
德國(guó)交通標(biāo)志基準(zhǔn)測(cè)試是在 2011 年國(guó)際神經(jīng)網(wǎng)絡(luò)聯(lián)合會(huì)議 (IJCNN) 上舉辦的多類單圖像分類挑戰(zhàn)賽。
該數(shù)據(jù)集收集了超過 50,000 個(gè)交通標(biāo)志圖像的全面、逼真的數(shù)據(jù)集。它反映了由于距離、照明、天氣條件、部分遮擋和旋轉(zhuǎn)而導(dǎo)致的標(biāo)志視覺外觀的強(qiáng)烈變化。
該數(shù)據(jù)集包含 43 個(gè)類別頻率不平衡的類別。參與者必須對(duì)兩個(gè)測(cè)試集進(jìn)行分類,每個(gè)測(cè)試集超過 12,500 張圖像。


62. Winegrape檢測(cè)數(shù)據(jù)集

類型:分類
數(shù)量:300
數(shù)據(jù)集下載地址:https://github.com/thsant/wgisd
說明:
WGISD是為了提供圖像和注釋來研究對(duì)象檢測(cè)和實(shí)例分割,用于葡萄栽培中基于圖像的監(jiān)測(cè)和現(xiàn)場(chǎng)機(jī)器人技術(shù)。它提供了來自五種不同葡萄品種的實(shí)地實(shí)例。這些實(shí)例顯示了葡萄姿勢(shì)、光照和焦點(diǎn)的變化,包括遺傳和物候變化,如形狀、顏色和緊實(shí)度??赡艿挠猛景ǚ艑拰?shí)例分割問題:分類(圖像中是否有葡萄?)、語義分割(圖像中的“葡萄像素”是什么?)、對(duì)象檢測(cè)(圖像中的葡萄在哪里?)、和計(jì)數(shù)(每個(gè)簇有多少漿果?)。


63. VOC2005車輛數(shù)據(jù)集

類型:圖像分類
數(shù)量:
數(shù)據(jù)集下載地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2005/index.html
說明:
該數(shù)據(jù)集中含有自行車、摩托車、汽車、貨車的圖像數(shù)據(jù),可用于CNN模型以實(shí)現(xiàn)車輛識(shí)別和車輛分類,其中自行車、摩托車、汽車數(shù)據(jù)來自2005 PASCAL視覺類挑戰(zhàn)賽(VOC2005)所使用的數(shù)據(jù)的篩選處理結(jié)果,貨車圖片來自網(wǎng)絡(luò)收集,后期通過篩選處理得到。在本數(shù)據(jù)中,訓(xùn)練數(shù)據(jù)集與測(cè)試數(shù)據(jù)集占比約為5:1。


64. 寵物圖像數(shù)據(jù)集

類型:圖像分類
數(shù)量:7350
數(shù)據(jù)集下載地址:https://www.robots.ox.ac.uk/~vgg/data/pets/
說明:
一個(gè)包含 37 個(gè)類別的寵物數(shù)據(jù)集,每個(gè)類別大約有 200 張圖像。這些圖像在比例、姿勢(shì)和照明方面有很大的變化。所有圖像都有相關(guān)的品種、頭部 ROI 和像素級(jí)三元圖分割的地面實(shí)況注釋。


65. 貓咪數(shù)據(jù)集

類型:圖像分類
數(shù)量:9000
數(shù)據(jù)集下載地址: https://www.kaggle.com/datasets/crawford/cat-dataset
說明:
CAT 數(shù)據(jù)集包括超過 9,000 張貓圖像。對(duì)于每張圖像,貓的頭部都有九個(gè)點(diǎn)的注釋,眼睛兩個(gè),嘴巴一個(gè),耳朵六個(gè)。


66. 斯坦福狗狗數(shù)據(jù)集

類型:圖像分類
數(shù)量:20,580
數(shù)據(jù)集下載地址: http://vision.stanford.edu/aditya86/ImageNetDogs/
說明:
斯坦福狗數(shù)據(jù)集包含來自世界各地的 120 種狗的圖像。該數(shù)據(jù)集是使用 ImageNet 中的圖像和注釋構(gòu)建的,用于細(xì)粒度圖像分類任務(wù)。
該數(shù)據(jù)集的內(nèi)容:類別數(shù):120,圖片數(shù)量:20,580,注釋:類標(biāo)簽、邊界框


67. Stanford 汽車圖片數(shù)據(jù)

類型:圖像分類
數(shù)量:16,185
數(shù)據(jù)集下載地址: ai.stanford.edu/~jkrause/cars/car_dataset.html
說明:
Cars 數(shù)據(jù)集包含 196 類汽車的 16,185 張圖像。數(shù)據(jù)分為 8,144 個(gè)訓(xùn)練圖像和 8,041 個(gè)測(cè)試圖像,其中每個(gè)類別大致按 50-50 分割。課程通常在品牌、型號(hào)、年份級(jí)別,例如 2012 Tesla Model S 或 2012 BMW M3 coupe。


68. 花卉數(shù)據(jù)集

類型:圖像分類
數(shù)量:4242
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/alxmamaev/flowers-recognition
說明:
該數(shù)據(jù)集包含 4242 張花卉圖像。數(shù)據(jù)收集基于數(shù)據(jù)flicr、google images、yandex images。此數(shù)據(jù)集可用于從照片中識(shí)別植物。數(shù)據(jù)圖片會(huì)分為五類:洋甘菊、郁金香、玫瑰、向日葵、蒲公英。每個(gè)種類大約有800張照片。 照片分辨率不高,約為 320x240 像素。 照片不會(huì)縮小到單一尺寸,它們有不同的比例。


69. 綜合汽車數(shù)據(jù)集

類型:圖像分類
數(shù)量:136726
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/renancostaalencar/compcars
說明:
該數(shù)據(jù)集是被CVPR 2015 論文“用于細(xì)粒度分類和驗(yàn)證的大規(guī)模汽車數(shù)據(jù)集”所使用的。綜合汽車 (CompCars) 數(shù)據(jù)集包含來自兩個(gè)場(chǎng)景的數(shù)據(jù),包括來自網(wǎng)絡(luò)自然和監(jiān)視自然的圖像。 web-nature 數(shù)據(jù)包含 163 個(gè)汽車制造商和 1,716 個(gè)汽車型號(hào)。 總共有 136,726 張拍攝整車的圖像和 27,618 張拍攝汽車零件的圖像。 完整的汽車圖像標(biāo)有邊界框和視點(diǎn)。 每個(gè)車型都標(biāo)有五個(gè)屬性,包括最大速度、排量、門數(shù)、座位數(shù)和汽車類型。 監(jiān)控性質(zhì)的數(shù)據(jù)包含在前視圖中捕獲的 50,000 張汽車圖像。


70. 室內(nèi)場(chǎng)景識(shí)別

類型:圖像分類
數(shù)量:15620
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/itsahmad/indoor-scenes-cvpr-2019
說明:
該數(shù)據(jù)集是麻省理工學(xué)院提供的原始數(shù)據(jù)。室內(nèi)場(chǎng)景識(shí)別是高層次視覺中一個(gè)具有挑戰(zhàn)性的開放性問題。 大多數(shù)適用于室外場(chǎng)景的場(chǎng)景識(shí)別模型在室內(nèi)領(lǐng)域表現(xiàn)不佳。主要困難在于,雖然一些室內(nèi)場(chǎng)景(例如走廊)可以通過全局空間屬性很好地表征,但其他的(例如書店)可以通過它們包含的對(duì)象更好地表征。
該數(shù)據(jù)庫(kù)包含 67 個(gè)室內(nèi)類別,共 15620 張圖像。 圖片的數(shù)量因類別而異,但每個(gè)類別至少有 100 張圖片。 所有圖片均為jpg格式。


71. 90種動(dòng)物圖像數(shù)據(jù)集

類型:圖像分類
數(shù)量:5400
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/iamsouravbanerjee/animal-image-dataset-90-different-animals
說明:
在這個(gè)數(shù)據(jù)集中有 90 個(gè)不同類別的 5400 張動(dòng)物圖像。此數(shù)據(jù)集是從 Google 圖片創(chuàng)建的。所有照片將按照其所屬類別存放于各自的文件夾下。動(dòng)物類別包括:羚羊,獾,蝙蝠,熊,蜜蜂,甲蟲,野牛,公豬,蝴蝶,貓,毛蟲,黑猩猩等。該數(shù)據(jù)集中的圖像大小不固定,需要后續(xù)的處理。


72. 標(biāo)注魚類數(shù)據(jù)集

類型:圖像分類
數(shù)量:
數(shù)據(jù)集下載地址:https://swfscdata.nmfs.noaa.gov/labeled-fishes-in-the-wild/
說明:
野生圖像數(shù)據(jù)集中的標(biāo)記魚類由 NOAA Fisheries(國(guó)家海洋漁業(yè)服務(wù)局)提供,以鼓勵(lì)對(duì)無約束水下圖像的自動(dòng)圖像分析算法進(jìn)行開發(fā)、測(cè)試和性能評(píng)估。
該數(shù)據(jù)集包括魚類、無脊椎動(dòng)物和海床的圖像,這些圖像是使用部署在遠(yuǎn)程操作車輛 (ROV) 上的攝像系統(tǒng)收集的,用于漁業(yè)調(diào)查。


73. 衣服數(shù)據(jù)集

類型:圖像分類
數(shù)量:5000
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/agrigorev/clothing-dataset-full
說明:
衣服數(shù)據(jù)集總共收集了 20 種衣服的 5,000 張圖像。該數(shù)據(jù)集是根據(jù)公共領(lǐng)域許可 (CC0) 發(fā)布的。
數(shù)據(jù)集包含 20 個(gè)類,包括T 恤(1011 件),長(zhǎng)袖(699 件),褲子(692 件),鞋子(431 件)襯衫(378 件),連衣裙(357 件),外套(312 件),短褲(308 件),帽子(171 件),裙子(155 件),西裝外套(109 件)等。
用特殊標(biāo)志“孩子”標(biāo)記了兒童服裝的圖像:是童裝(476 項(xiàng)),不是童裝(4927 項(xiàng))。


74. 商標(biāo)數(shù)據(jù)集

類型:圖像分類
數(shù)量:167,140
數(shù)據(jù)集下載地址:https://github.com/msn199959/Logo-2k-plus-Dataset
說明:
構(gòu)建了一個(gè)大規(guī)模的 logo 數(shù)據(jù)集 Logo-2K+,它涵蓋了來自真實(shí)世界 logo 圖像的各種 logo 類別。 我們生成的徽標(biāo)數(shù)據(jù)集包含 167,140 張圖像,具有 10 個(gè)根類別和 2,341 個(gè)類別。


75. 飛機(jī)數(shù)據(jù)集

類型:圖像分類
數(shù)量:10000
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/seryouxblaster764/fgvc-aircraft
說明:
數(shù)據(jù)集包含 10,000 張飛機(jī)圖像,數(shù)據(jù)分為 3334 個(gè)訓(xùn)練圖像、3333 個(gè)驗(yàn)證圖像和 3333 個(gè)測(cè)試圖像。 飛機(jī)模型按四級(jí)層次結(jié)構(gòu)組織。 四個(gè)層次,從細(xì)到粗,分別是:
型號(hào),例如 波音 737-76J。 由于某些模型在視覺上幾乎無法區(qū)分,因此在評(píng)估中不使用此級(jí)別。
變體,例如 波音 737-700。 一個(gè)變體將所有在視覺上無法區(qū)分的模型折疊成一個(gè)類。 該數(shù)據(jù)集包含 100 個(gè)不同的變體。
家庭,例如 波音 737。該數(shù)據(jù)集包含 70 個(gè)不同的家族。
制造商,例如 波音。 該數(shù)據(jù)集包含 41 個(gè)不同的制造商。


76. Office-Home數(shù)據(jù)

類型:圖像分類
數(shù)量:15500
數(shù)據(jù)集下載地址:https://www.hemanthdv.org/officeHomeDataset.html
說明:
Office-Home 是一個(gè)用于域適應(yīng)的基準(zhǔn)數(shù)據(jù)集,它包含 4 個(gè)域,每個(gè)域由 65 個(gè)類別組成。這四個(gè)領(lǐng)域是: 藝術(shù)——素描、繪畫、裝飾等形式的藝術(shù)形象;剪貼畫——剪貼畫圖像的集合;產(chǎn)品——沒有背景的物體圖像;和真實(shí)世界——用普通相機(jī)拍攝的物體圖像。它包含 15,500 張圖像,平均每個(gè)類大約 70 張圖像,一個(gè)類最多 99 張圖像


77. 食物圖像數(shù)據(jù)集

類型:圖像分類
數(shù)量:10000
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/kmader/food41
說明:
該數(shù)據(jù)集包含完整 food-101 數(shù)據(jù)的許多不同子集。為了給圖像分析制作一個(gè)比 CIFAR10 或 MNIST 更簡(jiǎn)單的訓(xùn)練集,該數(shù)據(jù)包括圖像的大規(guī)??s小版本,以實(shí)現(xiàn)快速測(cè)試。數(shù)據(jù)已被重新格式化為 HDF5,特別是 Keras HDF5Matrix,這樣可以輕松讀取它們。


78. 加州理工學(xué)院相機(jī)陷阱數(shù)據(jù)集

類型:分類
數(shù)量:243100
數(shù)據(jù)集下載地址:https://beerys.github.io/CaltechCameraTraps/
說明:
該數(shù)據(jù)集包含來自美國(guó)西南部 140 個(gè)攝像頭位置的 243,100 張圖像,帶有 21 個(gè)動(dòng)物類別的標(biāo)簽(加上空白),主要是在物種級(jí)別(例如,最常見的標(biāo)簽是負(fù)鼠、浣熊和土狼),以及 大約 66,000 個(gè)邊界框注釋。大約 70% 的圖像被標(biāo)記為空。


79. SVHN 街景門牌號(hào) 數(shù)據(jù)集

類型: 圖像識(shí)別
數(shù)量:600,000
數(shù)據(jù)集下載地址:http://ufldl.stanford.edu/housenumbers/
說明:
SVHN 是一個(gè)真實(shí)世界的圖像數(shù)據(jù)集,用于開發(fā)機(jī)器學(xué)習(xí)和對(duì)象識(shí)別算法,對(duì)數(shù)據(jù)預(yù)處理和格式化的要求最低。它可以被視為與MNIST風(fēng)格相似(例如,圖像是經(jīng)過裁剪的小數(shù)字),但包含一個(gè)數(shù)量級(jí)的更多標(biāo)記數(shù)據(jù)(超過 600,000 個(gè)數(shù)字圖像),并且來自一個(gè)更難、未解決的現(xiàn)實(shí)世界問題(識(shí)別自然場(chǎng)景圖像中的數(shù)字和數(shù)字)。SVHN 是從谷歌街景圖像中的門牌號(hào)獲得的。


80. 3D MNIST 數(shù)字識(shí)別圖像數(shù)據(jù)

類型:圖像識(shí)別
數(shù)量:
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/daavoo/3d-mnist
說明:
該數(shù)據(jù)集的目的是提供一種簡(jiǎn)單的方法來開始處理 3D 計(jì)算機(jī)視覺問題,例如 3D 形狀識(shí)別。
該數(shù)據(jù)集包含從MNIST數(shù)據(jù)集的原始圖像生成的3D點(diǎn)云,為使用2D數(shù)據(jù)集(圖像)的人們帶來熟悉的3D介紹。


81. CBCL 街道場(chǎng)景數(shù)據(jù)

類型: 圖像識(shí)別
數(shù)量:
數(shù)據(jù)集下載地址:http://cbcl.mit.edu/software-datasets/streetscenes/
說明:
StreetScenes Challenge Framework 是用于對(duì)象檢測(cè)的圖像、注釋、軟件和性能測(cè)量的集合。每張圖像都是從馬薩諸塞州波士頓及其周邊地區(qū)的 DSC-F717 相機(jī)拍攝的。然后用圍繞 9 個(gè)對(duì)象類別的每個(gè)示例的多邊形手動(dòng)標(biāo)記每個(gè)圖像,包括 [汽車、行人、自行車、建筑物、樹木、天空、道路、人行道和商店]。這些圖像的標(biāo)記是在仔細(xì)檢查下完成的,以確保對(duì)象總是以相同的方式標(biāo)記,關(guān)于遮擋和其他常見的圖像變換。




5. 缺陷檢測(cè)(defect detection)

82. AITEX數(shù)據(jù)集

類型:缺陷檢測(cè)
數(shù)量:245
數(shù)據(jù)集下載地址:https://www.aitex.es/afid/
說明:
該數(shù)據(jù)庫(kù)由七個(gè)不同織物結(jié)構(gòu)的245張4096 x 256像素圖像組成。數(shù)據(jù)庫(kù)中有140個(gè)無缺陷圖像,每種類型的織物20個(gè),除此之外,有105幅紡織行業(yè)中常見的不同類型的織物缺陷(12種缺陷)圖像。圖像的大尺寸允許用戶使用不同的窗口尺寸,從而增加了樣本數(shù)量。
Internet上的數(shù)據(jù)庫(kù)還包含所有具有缺陷的圖像的分割mask,使得白色像素表示缺陷區(qū)域,其余像素為黑色。


83. 天池鋁型材表面缺陷數(shù)據(jù)集

類型:缺陷檢測(cè)
數(shù)量:10000
數(shù)據(jù)集下載地址:https://tianchi.aliyun.com/competition/entrance/231682/information
說明:
數(shù)據(jù)集里有1萬份來自實(shí)際生產(chǎn)中有瑕疵的鋁型材監(jiān)測(cè)影像數(shù)據(jù),每個(gè)影像包含一個(gè)或多種瑕疵。供機(jī)器學(xué)習(xí)的樣圖會(huì)明確標(biāo)識(shí)影像中所包含的瑕疵類型。
圖片分成單瑕疵圖片、多瑕疵圖片以及無瑕疵圖片:?jiǎn)舞Υ脠D片指所含瑕疵類型只有一種的圖片,但圖片中可能出現(xiàn)多處相同類型的瑕疵;多瑕疵圖片指所含瑕疵類型多于一種的圖片;無瑕疵圖片指瑕疵可忽略不計(jì)的圖片,這些圖片不需要標(biāo)注。


84. Kylberg 紋理數(shù)據(jù)集

類型:缺陷檢測(cè)
數(shù)量:20000
數(shù)據(jù)集下載地址:https://www.cb.uu.se/~gustaf/texture/
說明:
在布匹生產(chǎn)過程中,由于各方面因素的影響,會(huì)產(chǎn)生污漬、破洞、毛粒等瑕疵,為保證產(chǎn)品質(zhì)量,需要對(duì)布匹進(jìn)行瑕疵檢測(cè)。
布匹疵點(diǎn)檢驗(yàn)是紡織行業(yè)生產(chǎn)和質(zhì)量管理的重要環(huán)節(jié),目前人工檢測(cè)易受主觀因素影響,缺乏一致性;并且檢測(cè)人員在強(qiáng)光下長(zhǎng)時(shí)間工作對(duì)視力影響極大。由于布匹疵點(diǎn)種類繁多、形態(tài)變化多樣、觀察識(shí)別難道大,導(dǎo)致布匹疵點(diǎn)智能檢測(cè)是困擾行業(yè)多年的技術(shù)瓶頸。
數(shù)據(jù)集包括 28個(gè)紋理類,每類160個(gè)獨(dú)特紋理面片。數(shù)據(jù)包括包括素色布和花色布兩類,其中,素色布數(shù)據(jù)約8000張;花色布數(shù)據(jù)約12000張。
本數(shù)據(jù)涵蓋了紡織業(yè)中布匹的各類重要瑕疵,每張圖片含一個(gè)或多種瑕疵。


85. 東北大學(xué)帶鋼表面缺陷數(shù)據(jù)集

類型:缺陷檢測(cè)
數(shù)量:1800
數(shù)據(jù)集下載地址:http://faculty.neu.edu.cn/songkechen/zh_CN/zdylm/263270/list/
說明:
數(shù)據(jù)集收集了夾雜、劃痕、壓入氧化皮、裂紋、麻點(diǎn)和斑塊6種缺陷,每種缺陷300張,圖像尺寸為200×200。
數(shù)據(jù)集包括分類和目標(biāo)檢測(cè)兩部分,不過目標(biāo)檢測(cè)的標(biāo)注中有少量錯(cuò)誤,需要注意。


86. 謝韋爾鋼鐵公司帶鋼缺陷數(shù)據(jù)集

類型:缺陷檢測(cè)
數(shù)量:18000
數(shù)據(jù)集下載地址:https://www.kaggle.com/c/severstal-steel-defect-detection/data
說明:
該數(shù)據(jù)集中提供了四種類型的帶鋼表面缺陷。訓(xùn)練集共有12568張,測(cè)試集5506張。圖像尺寸為1600×256。


87. UCI 帶鋼缺陷數(shù)據(jù)集

類型:缺陷檢測(cè)
數(shù)量:
數(shù)據(jù)集下載地址:https://archive.ics.uci.edu/ml/datasets/Steel+Plates+Faults
說明:
該數(shù)據(jù)集包含了7種帶鋼缺陷類型:裝飾、Z劃痕、K劃痕、污漬、骯臟、顛簸、其他故障。
這個(gè)數(shù)據(jù)集不是圖像數(shù)據(jù),而是帶鋼缺陷的28種特征數(shù)據(jù),可用于機(jī)器學(xué)習(xí)項(xiàng)目。


88. DAGM 2007數(shù)據(jù)集

類型:缺陷檢測(cè)
數(shù)量:1000
數(shù)據(jù)集下載地址:https://hci.iwr.uni-heidelberg.de/content/weakly-supervised-learning-industrial-optical-inspection
說明:
該數(shù)據(jù)集用于統(tǒng)計(jì)紋理表面缺陷檢測(cè),為較弱監(jiān)督的訓(xùn)練數(shù)據(jù)。
包含十個(gè)數(shù)據(jù)集,前六個(gè)為訓(xùn)練數(shù)據(jù)集,后四個(gè)為測(cè)試數(shù)據(jù)集。每個(gè)數(shù)據(jù)集均包含以灰度8位PNG格式保存的1000個(gè)“無缺陷”圖像和150個(gè)“有缺陷”圖像,每個(gè)數(shù)據(jù)集由不同的紋理模型和缺陷模型生成?!盁o缺陷”圖像顯示的背景紋理沒有缺陷,“無缺陷”圖像的背景紋理上恰好有一個(gè)標(biāo)記的缺陷。所有數(shù)據(jù)集已隨機(jī)分為大小相等的訓(xùn)練和測(cè)試子數(shù)據(jù)集。弱標(biāo)簽以橢圓形表示,大致表示缺陷區(qū)域。


89. 磁瓦缺陷數(shù)據(jù)集

類型:缺陷檢測(cè)
數(shù)量:
數(shù)據(jù)集下載地址:https://gitcode.net/mirrors/abin24/Magnetic-tile-defect-datasets.?utm_source=csdn_github_accelerator
說明:
中國(guó)科學(xué)院自動(dòng)所一個(gè)課題組收集的數(shù)據(jù)集,是“Saliency of magnetic tile surface defects”這篇論文的數(shù)據(jù)集。收集了6種常見磁瓦缺陷的圖像,并做了語義分割的標(biāo)注。


90. RSDDs鐵軌表面缺陷數(shù)據(jù)集

類型:缺陷檢測(cè)
數(shù)量:200
數(shù)據(jù)集下載地址:http://icn.bjtu.edu.cn/Visint/resources/RSDDs.aspx
說明:
RSDDs數(shù)據(jù)集包含兩種類型的數(shù)據(jù)集:第一種是從快車道捕獲的I型RSDDs數(shù)據(jù)集,其中包含67個(gè)具有挑戰(zhàn)性的圖像。第二個(gè)是從普通/重型運(yùn)輸軌道捕獲的II型RSDDs數(shù)據(jù)集,其中包含128個(gè)具有挑戰(zhàn)性的圖像。
兩個(gè)數(shù)據(jù)集的每幅圖像至少包含一個(gè)缺陷,并且背景復(fù)雜且噪聲很大。
RSDDs數(shù)據(jù)集中的這些缺陷已由一些專業(yè)的人類觀察員在軌道表面檢查領(lǐng)域進(jìn)行了標(biāo)記。


91. 印刷電路板(PCB)瑕疵數(shù)據(jù)集

類型:缺陷檢測(cè)
數(shù)量:1386
數(shù)據(jù)集下載地址:https://robotics.pkusz.edu.cn/resources/dataset/
說明:
這是一個(gè)公共的合成PCB數(shù)據(jù)集,由北京大學(xué)發(fā)布,其中包含1386張圖像以及6種缺陷(缺失孔,鼠咬壞,開路,短路,雜散,偽銅),用于檢測(cè),分類和配準(zhǔn)任務(wù)。




6. 醫(yī)學(xué)影像(medical image)

tinyperson數(shù)據(jù)集下載,隨筆,深度學(xué)習(xí),深度學(xué)習(xí),圖像處理,開源,人工智能

92. COVID-19 胸部CT圖像增強(qiáng)GAN數(shù)據(jù)集

類型:醫(yī)學(xué)影像
數(shù)量:742
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/mloey1/covid19-chest-ct-image-augmentation-gan-dataset?resource=download-directory
說明:
新冠肺炎胸部CT掃描數(shù)字圖像。共有742個(gè)CT圖像和2個(gè)類別(COVID/NonCOVID)。


93. 3D-IRCADB臟器分割數(shù)據(jù)集

類型:醫(yī)學(xué)影像
數(shù)量:20
數(shù)據(jù)集下載地址:https://www.ircad.fr/research/data-sets/liver-segmentation-3d-ircadb-01/
說明:
3D-IRCADb-01 數(shù)據(jù)庫(kù)由 10 名女性和 10 名男性 75% 的肝腫瘤患者的 3D CT 掃描組成。 20個(gè)文件夾對(duì)應(yīng)20個(gè)不同的患者,可以單獨(dú)下載也可以聯(lián)合下載。下表提供了圖像信息,例如肝臟大小(寬度、深度、高度)或根據(jù) Couninaud 分割的腫瘤位置。它還表明肝臟分割軟件可能遇到的主要困難是由于與鄰近器官的接觸、肝臟的非典型形狀或密度,甚至圖像中的偽影。


94. Kumar腫瘤數(shù)據(jù)集

類型:醫(yī)學(xué)影像
數(shù)量:
數(shù)據(jù)集下載地址:https://monuseg.grand-challenge.org/Data/
說明:
這一數(shù)據(jù)集是通過仔細(xì)注釋幾名患有不同器官腫瘤并在多家醫(yī)院被診斷出的患者的組織圖像獲得的。該數(shù)據(jù)集是通過從TCGA存檔下載以 40 倍放大倍率捕獲的 H&E 染色組織圖像創(chuàng)建的。H&E 染色是增強(qiáng)組織切片對(duì)比度的常規(guī)方案,通常用于腫瘤評(píng)估(分級(jí)、分期等)??紤]到多個(gè)器官和患者的細(xì)胞核外觀的多樣性,以及多家醫(yī)院采用的豐富染色方案,訓(xùn)練數(shù)據(jù)集將能夠開發(fā)出開箱即用的穩(wěn)健且可推廣的細(xì)胞核分割技術(shù)。


95. FASCICLE 小腿肌肉超聲數(shù)據(jù)集

類型:醫(yī)學(xué)影像
數(shù)量:812
數(shù)據(jù)集下載地址:https://kalisteo.cea.fr/index.php/fallmud/
說明:
FAscicle 小腿肌肉超聲數(shù)據(jù)集是一個(gè)由 812 幅小腿肌肉超聲圖像組成的數(shù)據(jù)集,用于分析肌肉弱點(diǎn)并預(yù)防受傷。該數(shù)據(jù)集在文章 AW-Net:B 型超聲圖像上的自動(dòng)肌肉結(jié)構(gòu)分析以預(yù)防傷害中進(jìn)行了介紹。它結(jié)合了由 Ryan Cunningham 等人發(fā)表的兩篇文章“使用卷積、殘差和反卷積神經(jīng)網(wǎng)絡(luò)從 B 模式超聲圖像中估計(jì)全區(qū)域骨骼肌纖維方向”提供的數(shù)據(jù)集。


96. PanNuke癌組織細(xì)胞數(shù)據(jù)集

類型:醫(yī)學(xué)影像
數(shù)量:
數(shù)據(jù)集下載地址:https://jgamper.github.io/PanNukeDataset/
說明:
半自動(dòng)生成的細(xì)胞核實(shí)例分割和分類數(shù)據(jù)集,包含 19 種不同組織類型的詳盡細(xì)胞核標(biāo)簽。該數(shù)據(jù)集由 481 個(gè)視野組成,其中 312 個(gè)視野是從多個(gè)數(shù)據(jù)源的 20K 多個(gè)不同放大倍率的整張幻燈片圖像中隨機(jī)采樣的。該數(shù)據(jù)集總共包含 205,343 個(gè)標(biāo)記的核,每個(gè)核都有一個(gè)實(shí)例分割掩碼。在 pannuke 上訓(xùn)練的模型可以幫助整個(gè)幻燈片圖像組織類型分割,并推廣到新組織。PanNuke 演示了首批成功半自動(dòng)生成的數(shù)據(jù)集之一。


97. 淋巴結(jié)切片的組織病理學(xué)數(shù)據(jù)集

類型:醫(yī)學(xué)影像
數(shù)量:327680
數(shù)據(jù)集下載地址:https://github.com/basveeling/pcam
說明:
PatchCamelyon 是一個(gè)新的且具有挑戰(zhàn)性的圖像分類數(shù)據(jù)集。它由從淋巴結(jié)切片的組織病理學(xué)掃描中提取的 327.680 張彩色圖像 (96 x 96px) 組成。每個(gè)圖像都帶有一個(gè)二進(jìn)制標(biāo)簽,表示存在轉(zhuǎn)移組織。


98. 森尼布魯克心臟數(shù)據(jù)集

類型:醫(yī)學(xué)影像
數(shù)量:45
數(shù)據(jù)集下載地址:http://www.cardiacatlas.org/studies/sunnybrook-cardiac-data/
說明:
Sunnybrook心臟數(shù)據(jù) (SCD),也稱為2009 年心臟 MR 左心室分割挑戰(zhàn)數(shù)據(jù),由 45 幅來自混合患者和病理的電影 MRI 圖像組成:健康、肥大、心力衰竭伴梗死和心力衰竭無梗死。


99. 血細(xì)胞圖像數(shù)據(jù)集

類型:醫(yī)學(xué)影像
數(shù)量:12500
數(shù)據(jù)集下載地址:https://github.com/Shenggan/BCCD_Dataset
說明:
該數(shù)據(jù)集包含 12,500 張帶有細(xì)胞類型標(biāo)簽 (CSV) 的增強(qiáng)血細(xì)胞圖像 (JPEG)。4 種不同細(xì)胞類型中的每一種都有大約 3,000 張圖像,這些圖像被分組到 4 個(gè)不同的文件夾中(根據(jù)細(xì)胞類型)。細(xì)胞類型是嗜酸性粒細(xì)胞、淋巴細(xì)胞、單核細(xì)胞和中性粒細(xì)胞。該數(shù)據(jù)集附帶一個(gè)額外的數(shù)據(jù)集,其中包含原始 410 幅圖像(預(yù)增強(qiáng))以及兩個(gè)額外的子類型標(biāo)簽(WBC 與 WBC),以及這 410 幅圖像中每個(gè)單元格的邊界框(JPEG + XML 元數(shù)據(jù))。


100. 腦腫瘤 MRI 數(shù)據(jù)集

類型:醫(yī)學(xué)影像
數(shù)量:7000
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/masoudnickparvar/brain-tumor-mri-dataset
說明:
該數(shù)據(jù)集包含7022張人腦 MRI 圖像,分為 4 類:膠質(zhì)瘤-腦膜瘤-無腫瘤和垂體。注意這個(gè)數(shù)據(jù)集中的圖像大小是不同的??梢栽陬A(yù)處理并去除多余的邊距后將圖像調(diào)整為所需的大小。


101. 身體部位X射線圖像數(shù)據(jù)集

類型:醫(yī)學(xué)影像
數(shù)量:
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/ibombonato/xray-body-images-in-png-unifesp-competion
說明:
本數(shù)據(jù)集收集了來自身體各部位的X光圖片。
多分類問題。自動(dòng)識(shí)別圖像中的身體部位,從而可以創(chuàng)建更多數(shù)據(jù)集和部署管道。


102. 眼病深度學(xué)習(xí)數(shù)據(jù)集

類型:醫(yī)學(xué)影像
數(shù)量:
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/bongsang/eye-disease-deep-learning-dataset
說明:
本數(shù)據(jù)集包含712張片狀角膜潰瘍的眼部染色圖像。
該數(shù)據(jù)集的標(biāo)簽由 3 個(gè)類別、5 個(gè)類型和 5 個(gè)等級(jí)組成??梢允?5個(gè)多標(biāo)簽。


103. 膝關(guān)節(jié) X 射線圖像數(shù)據(jù)集

類型:醫(yī)學(xué)影像
數(shù)量:1650
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/tommyngx/digital-knee-xray
說明:
該數(shù)據(jù)集包括從知名醫(yī)院和診斷中心收集的 1650 張膝關(guān)節(jié)電子 X 射線圖像。X 射線圖像是使用 PROTEC PRS 500E X 射線機(jī)獲取的。原始圖像是 8 位灰度圖像。每個(gè) X 射線膝關(guān)節(jié) X 射線圖像均由 2 位醫(yī)學(xué)專家根據(jù) Kellgren 和 Lawrence 等級(jí)手動(dòng)注釋/標(biāo)記。




7. 圖像分割(image segmentation)

104. 高密度人群及移動(dòng)物體視頻數(shù)據(jù)集

類型:圖像分割
數(shù)量:
數(shù)據(jù)集下載地址:https://www.cvmart.net/dataSets/detail/Unknown
說明:
Crowd Segmentation Dataset 是一個(gè)高密度人群和移動(dòng)物體視頻數(shù)據(jù),視頻來自BBC Motion Gallery 和 Getty Images 網(wǎng)站。


105. DAVIS 視頻分割數(shù)據(jù)集

類型:圖像分割
數(shù)量:
數(shù)據(jù)集下載地址:https://davischallenge.org/
說明:
Densely Annotated Video Segmentation 是一個(gè)高清視頻中的物體分割數(shù)據(jù)集,包括 50個(gè) 視頻序列,3455個(gè) 幀標(biāo)注,視頻采集自高清 1080p 格式。




8. 圖像去霧(images defogging)


106. D-HAZY

類型:圖像去霧
數(shù)量:1400
數(shù)據(jù)集下載地址:http://ancuti.meo.etc.upt.ro/D_Hazzy_ICIP2016/
說明:
D-HAZY,建立在Middelbury 和NYU深度數(shù)據(jù)集上,這些數(shù)據(jù)集提供各種場(chǎng)景的圖像及其相應(yīng)的深度圖。包含1400多對(duì)圖像的數(shù)據(jù)集,其中包括同一場(chǎng)景的地面真實(shí)參考圖像和模糊圖像。


107. RESIDE

類型:圖像去霧
數(shù)量:
數(shù)據(jù)集下載地址:https://sites.google.com/view/reside-dehaze-datasets
說明:
RESIDE數(shù)據(jù)集包括合成和真實(shí)世界的模糊圖像,稱為REalistic Single Image Dehazing,RESIDE突出顯示了各種數(shù)據(jù)源和圖像內(nèi)容,并分為五個(gè)子集,每個(gè)子集用于不同的訓(xùn)練或評(píng)估目的。提供了各種各樣的去霧算法評(píng)估標(biāo)準(zhǔn),從完整參考度量,無參考度量,到主觀評(píng)估和任務(wù)驅(qū)動(dòng)評(píng)估。


108. Middlebury Stereo雙目立體匹配測(cè)試數(shù)據(jù)集

類型:圖像去霧
數(shù)量:
數(shù)據(jù)集下載地址:https://vision.middlebury.edu/stereo/data/
說明:
數(shù)據(jù)集包括11個(gè)場(chǎng)景,在許多不同的照明條件和曝光(包括移動(dòng)設(shè)備的閃光燈和“手電筒”照明)下,從1-3個(gè)不同的觀看方向成像。


109. NH-HAZE

類型:圖像去霧
數(shù)量:
數(shù)據(jù)集下載地址:https://data.vision.ee.ethz.ch/cvl/ntire20/nh-haze/
說明:
這是一個(gè)非均勻的真實(shí)數(shù)據(jù)集,具有成對(duì)的真實(shí)霧度和相應(yīng)的無霧度圖像。這是第一個(gè)非齊次圖像去模糊數(shù)據(jù)集,包含55個(gè)室外場(chǎng)景。在場(chǎng)景中引入了非均勻霧,使用專業(yè)霧發(fā)生器模擬霧場(chǎng)景的真實(shí)條件。


110. DENSE-HAZE

類型:圖像去霧
數(shù)量:
數(shù)據(jù)集下載地址:https://data.vision.ee.ethz.ch/cvl/ntire19//dense-haze/
說明:
以濃密均勻的朦朧場(chǎng)景為特征,包含33對(duì)真實(shí)的朦朧圖像和各種室外場(chǎng)景的相應(yīng)無霾圖像。通過引入由專業(yè)霧霾機(jī)器生成的真實(shí)霧霾來記錄霧霾場(chǎng)景。朦朧和無朦朧的對(duì)應(yīng)場(chǎng)景包含在相同照明參數(shù)下捕獲的相同視覺內(nèi)容。




9. 關(guān)鍵點(diǎn)檢測(cè)(key point detection)


111. 手部姿勢(shì)關(guān)鍵點(diǎn)檢測(cè)數(shù)據(jù)集

類型:關(guān)鍵點(diǎn)檢測(cè)
數(shù)量:
數(shù)據(jù)集下載地址:http://www.rovit.ua.es/dataset/mhpdataset/#citation
說明:
數(shù)據(jù)集由序列構(gòu)成。在每個(gè)序列中,您都可以找到組成它的幀。一個(gè)幀由4個(gè)彩色圖像、4組投影在每個(gè)圖像平面中的2D關(guān)節(jié)、4個(gè)邊界框、1組Leap Motion Controller提供的3D點(diǎn)和4組重新投影到每個(gè)相機(jī)坐標(biāo)幀的3D點(diǎn)組成


112. 動(dòng)物姿勢(shì)數(shù)據(jù)集

類型:關(guān)鍵點(diǎn)檢測(cè)
數(shù)量:4000
數(shù)據(jù)集下載地址:https://github.com/switchablenorms/DeepFashion2
說明:
該數(shù)據(jù)集提供了五個(gè)類別的動(dòng)物姿勢(shì)注釋:狗、貓、牛、馬、羊,在4,000 多張圖像中總共有6,000多個(gè)實(shí)例。此外,該數(shù)據(jù)集還包含其他7 個(gè)動(dòng)物類別的邊界框注釋。在論文中查找詳細(xì)信息。
該數(shù)據(jù)集一共標(biāo)注了 20 個(gè)關(guān)鍵點(diǎn):兩只眼睛、喉嚨、鼻子、馬肩隆、兩個(gè)耳根、尾根、四個(gè)肘部、四個(gè)膝蓋、四個(gè)爪子。


113. 電影人物關(guān)節(jié)關(guān)鍵點(diǎn)數(shù)據(jù)集

類型:關(guān)鍵點(diǎn)檢測(cè)
數(shù)量:5000
數(shù)據(jù)集下載地址:https://bensapp.github.io/flic-dataset.html
說明:
本文從流行的好萊塢電影中自動(dòng)收集了5003個(gè)圖像數(shù)據(jù)集。這些圖像是通過在30部電影的每10幀上運(yùn)行一個(gè)最先進(jìn)的人檢測(cè)器獲得的


114. MPIIGaze數(shù)據(jù)集

類型:關(guān)鍵點(diǎn)檢測(cè)
數(shù)量:213659
數(shù)據(jù)集下載地址:https://www.mpi-inf.mpg.de/departments/computer-vision-and-machine-learning/research/gaze-based-human-computer-interaction/appearance-based-gaze-estimation-in-the-wild
說明:
數(shù)據(jù)集包含我們?cè)谌齻€(gè)多月的日常筆記本電腦使用過程中從15名參與者收集的213659張圖像。在外觀和照明方面,我們的數(shù)據(jù)集比現(xiàn)有的數(shù)據(jù)集變化更大。


115. 人體足部關(guān)鍵點(diǎn)數(shù)據(jù)集

類型:關(guān)鍵點(diǎn)檢測(cè)
數(shù)量:
數(shù)據(jù)集下載地址:https://cmu-perceptual-computing-lab.github.io/foot_keypoint_dataset/
說明:
MPII 數(shù)據(jù)集標(biāo)注了腳踝、膝蓋、臀部、肩膀、肘部、手腕、頸部、軀干和頭頂,而 COCO 還包括一些面部關(guān)鍵點(diǎn)。對(duì)于這兩個(gè)數(shù)據(jù)集,足部注釋僅限于腳踝位置。COCO 數(shù)據(jù)集中的一小部分腳實(shí)例使用 Clickworker 平臺(tái)進(jìn)行標(biāo)記。它分為來自 COCO 訓(xùn)練集的 14K 注釋和來自驗(yàn)證集的 545 個(gè)注釋。


116. 人群姿態(tài)數(shù)據(jù)集

類型:關(guān)鍵點(diǎn)檢測(cè)
數(shù)量:
數(shù)據(jù)集下載地址:https://github.com/Jeff-sjtu/CrowdPose
說明:
多人姿態(tài)估計(jì)是許多計(jì)算機(jī)視覺任務(wù)的基礎(chǔ)。然而,以前很少有方法研究擁擠場(chǎng)景中的姿態(tài)估計(jì)問題,而在許多場(chǎng)景中,這仍然是一個(gè)具有挑戰(zhàn)性和不可避免的問題。




10. 動(dòng)作識(shí)別(action recognition)

117. HMDB人類動(dòng)作視頻數(shù)據(jù)集

類型:動(dòng)作識(shí)別
數(shù)量:6849
數(shù)據(jù)集下載地址: https://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/
說明:
由布朗大學(xué)發(fā)布的人類動(dòng)作視頻數(shù)據(jù)集,該數(shù)據(jù)集視頻多數(shù)來源于電影,還有一部分來自公共數(shù)據(jù)庫(kù)以及YouTube等網(wǎng)絡(luò)視頻庫(kù)。數(shù)據(jù)庫(kù)包含有6849段樣本,分為51類,每類至少包含有101段樣本。
操作類別可以分為五種類型:一般面部動(dòng)作,物體操縱的面部動(dòng)作,一般身體動(dòng)作,身體動(dòng)作與物體相互作用,人體互動(dòng)的身體動(dòng)作。


118. UCF50動(dòng)作識(shí)別數(shù)據(jù)集

類型:動(dòng)作識(shí)別
數(shù)量:
數(shù)據(jù)集下載地址: https://www.crcv.ucf.edu/data/UCF50.php
說明:
UCF50 是一個(gè)由中佛羅里達(dá)大學(xué)發(fā)布的動(dòng)作識(shí)別數(shù)據(jù)集,由來自 youtube 的真實(shí)視頻組成,包含 50 個(gè)動(dòng)作類別,如棒球投球、籃球投籃、臥推、騎自行車、騎自行車、臺(tái)球、蛙泳、挺舉、跳水、擊鼓等。對(duì)于所有 50 個(gè)類別,視頻分為 25 組,其中每組由超過 4 個(gè)動(dòng)作剪輯。同一組中的視頻片段可能具有一些共同的特征,例如同一個(gè)人、相似背景、相似視點(diǎn)等。


119. SBU Kinect 交互數(shù)據(jù)集

類型:動(dòng)作識(shí)別
數(shù)量:
數(shù)據(jù)集下載地址: https://www3.cs.stonybrook.edu/~kyun/research/kinect_interaction/index.html
說明:
SBU Kinect Interaction 創(chuàng)建了一個(gè)描述兩個(gè)人交互的復(fù)雜人類活動(dòng)數(shù)據(jù)集,包括同步視頻、深度和運(yùn)動(dòng)捕獲數(shù)據(jù)。此外,在通過支持向量機(jī)(SVM)實(shí)時(shí)檢測(cè)交互活動(dòng)的背景下,我們使用數(shù)據(jù)集評(píng)估通常用于索引和檢索運(yùn)動(dòng)捕捉數(shù)據(jù)的各種特征。


120. FineDiving 跳水?dāng)?shù)據(jù)集

類型:動(dòng)作識(shí)別
數(shù)量:
數(shù)據(jù)集下載地址: https://finediving.ivg-research.xyz/
說明:
收集了奧運(yùn)會(huì)、世界杯、世錦賽以及歐錦賽的跳水項(xiàng)目比賽視頻。每個(gè)比賽視頻都提供了豐富的內(nèi)容,包括所有運(yùn)動(dòng)員的跳水記錄、不同視角的慢速回放等。


121. ALOV300++跟蹤數(shù)據(jù)集

類型:目標(biāo)跟蹤
數(shù)量:
數(shù)據(jù)集下載地址:https://aimagelab.ing.unimore.it/dsm/
說明:

ALOV++,Amsterdam Library of Ordinary Videos for tracking 是一個(gè)物體追蹤視頻數(shù)據(jù),旨在對(duì)不同的光線、通透度、泛著條件、背景雜亂程度、焦距下的相似物體的追蹤




11. 姿態(tài)估計(jì)(pose estimation)

tinyperson數(shù)據(jù)集下載,隨筆,深度學(xué)習(xí),深度學(xué)習(xí),圖像處理,開源,人工智能

122. MPII人體模型數(shù)據(jù)集

類型:姿態(tài)估計(jì)
數(shù)量:10000
數(shù)據(jù)集下載地址:https://humanshape.mpi-inf.mpg.de/
說明:
該數(shù)據(jù)集包含通過在Google Image Search中鍵入常見的名字從web上收集的人們的圖像。每個(gè)正面的眼睛、鼻子和嘴巴中心的坐標(biāo)都在地面真相文件中提供。此信息可用于對(duì)齊和裁剪人臉,或作為人臉檢測(cè)算法的基本事實(shí)。該數(shù)據(jù)集有10524張不同分辨率和不同設(shè)置的人臉,例如肖像圖像、人群等。側(cè)面人臉或非常低分辨率的人臉沒有標(biāo)簽。


123. MPII人類姿態(tài)數(shù)據(jù)集

類型:姿態(tài)估計(jì)
數(shù)量:40000
數(shù)據(jù)集下載地址:http://human-pose.mpi-inf.mpg.de/#overview
說明:
MPII 人體姿態(tài)數(shù)據(jù)集是用于評(píng)估人體關(guān)節(jié)姿勢(shì)估計(jì)的最先進(jìn)基準(zhǔn)。該數(shù)據(jù)集包括大約 25,000 張圖像,其中包含超過 40,000 個(gè)帶有注釋身體關(guān)節(jié)的人。這些圖像是使用已建立的人類日常活動(dòng)分類法系統(tǒng)收集的。總的來說,數(shù)據(jù)集涵蓋了 410 項(xiàng)人類活動(dòng),每個(gè)圖像都提供了一個(gè)活動(dòng)標(biāo)簽。每張圖像都是從 YouTube 視頻中提取的,并提供前后未注釋的幀。此外,測(cè)試集有更豐富的注釋,包括身體部位遮擋和 3D 軀干和頭部方向。


124. KTH 多視圖足球數(shù)據(jù)集

類型:姿態(tài)估計(jì)
數(shù)量:771
數(shù)據(jù)集下載地址:https://www.csc.kth.se/~vahidk/football_data.html
說明:
收集了一個(gè)帶有注釋關(guān)節(jié)的足球運(yùn)動(dòng)員數(shù)據(jù)集,可用于多視圖重建。數(shù)據(jù)集包括:
771張足球運(yùn)動(dòng)員的照片
在 257 個(gè)時(shí)間實(shí)例中從 3 個(gè)視圖中獲取的圖像
14 個(gè)帶注釋的身體關(guān)節(jié)


125. 賓夕法尼亞動(dòng)作數(shù)據(jù)集

類型:姿態(tài)估計(jì)
數(shù)量:2326
數(shù)據(jù)集下載地址:http://dreamdragon.github.io/PennAction/
說明:
Penn Action Dataset(賓夕法尼亞大學(xué))包含 15 個(gè)不同動(dòng)作的 2326 個(gè)視頻序列以及每個(gè)序列的人類聯(lián)合注釋。


126. BBC姿態(tài)數(shù)據(jù)集

類型:姿態(tài)估計(jì)
數(shù)量:20
數(shù)據(jù)集下載地址:https://www.robots.ox.ac.uk/~vgg/data/pose/index.html#bbcpose
說明:
BBC Pose 包含 20 個(gè)視頻(每個(gè)視頻長(zhǎng)度為 0.5 小時(shí)至 1.5 小時(shí)),由 BBC 錄制,并配有手語翻譯。這 20 個(gè)視頻分為 10 個(gè)用于訓(xùn)練的視頻、5 個(gè)用于驗(yàn)證的視頻和 5 個(gè)用于測(cè)試的視頻。


127. Poser 數(shù)據(jù)集

類型:姿態(tài)估計(jì)
數(shù)量:1927
數(shù)據(jù)集下載地址:https://arxiv.org/abs/1701.01218
說明:
Poser 數(shù)據(jù)集是用于姿態(tài)估計(jì)的數(shù)據(jù)集,由 1927 個(gè)訓(xùn)練圖像和 418 個(gè)測(cè)試圖像組成。這些圖像是綜合生成的,并調(diào)整為單峰預(yù)測(cè)。這些圖像是使用 Poser 軟件包生成的。


128. 野外 3D 姿勢(shì)數(shù)據(jù)集

類型:姿態(tài)估計(jì)
數(shù)量:
數(shù)據(jù)集下載地址:https://virtualhumans.mpi-inf.mpg.de/3DPW/
說明:
野外第一個(gè)具有準(zhǔn)確 3D 姿勢(shì)用于評(píng)估的數(shù)據(jù)集,包含從移動(dòng)攝像頭拍攝的視頻片段的技術(shù)。
數(shù)據(jù)集包括:60 個(gè)視頻序列,2D 姿勢(shì)注釋,3D 姿勢(shì),序列中每一幀的相機(jī)姿勢(shì),3D 身體掃描和 3D 人物模型,18 個(gè)不同服裝款式的 3D 模型。


129. V-COCO數(shù)據(jù)集

類型:姿態(tài)估計(jì)
數(shù)量:10346
數(shù)據(jù)集下載地址: GitHub - s-gupta/v-coco: Hooks for VCOCO
說明:

V-COCO是一個(gè)基于 COCO 的數(shù)據(jù)集,用于人機(jī)交互檢測(cè)。V-COCO 提供 10,346 張圖像(2,533 張用于訓(xùn)練,2,867 張用于驗(yàn)證,4,946 張用于測(cè)試)和 16,199 個(gè)人物實(shí)例。每個(gè)人都有 29 個(gè)動(dòng)作類別的注釋,并且沒有包括對(duì)象在內(nèi)的交互標(biāo)簽。


130. 宜家 ASM 數(shù)據(jù)集

類型:姿態(tài)估計(jì)
數(shù)量:371
數(shù)據(jù)集下載地址: IKEA Assembly Dataset (ikeaasm.github.io)
說明:

宜家 ASM 數(shù)據(jù)集是裝配任務(wù)的多模式和多視圖視頻數(shù)據(jù)集,可對(duì)人類活動(dòng)進(jìn)行豐富的分析和理解。它包含 371 個(gè)家具組件樣本及其真實(shí)注釋。每個(gè)樣本包括 3 個(gè) RGB 視圖、一個(gè)深度流、原子動(dòng)作、人體姿勢(shì)、對(duì)象片段、對(duì)象跟蹤和外部相機(jī)校準(zhǔn)。

5個(gè)裝配環(huán)境,4種家具類型,3種家具顏色(白色、黑色和橡木色),48個(gè)獨(dú)特的匯編程序,1: 3女性:男性比例,每個(gè)部件有3個(gè)RGB視圖,每個(gè)組件1個(gè)深度流,33個(gè)動(dòng)作類(動(dòng)詞-對(duì)象對(duì))


131. 立體人體姿勢(shì)估計(jì)數(shù)據(jù)集

類型:姿態(tài)估計(jì)
數(shù)量:630
數(shù)據(jù)集下載地址: Page not found – Aplicaciones de la Visión Artificial (uco.es)
說明:

這是一個(gè)立體圖像對(duì)數(shù)據(jù)集,適用于上身人的立體人體姿態(tài)估計(jì)。SHPED 由 630 個(gè)立體圖像對(duì)(即 1260 個(gè)圖像)組成,分為 42 個(gè)視頻片段,每個(gè)片段 15 幀。這些剪輯是從 26 個(gè)立體視頻中提取的,這些視頻是從 YouTube 獲得的。此外,SHPED 包含 1470 條火柴人上身注釋,對(duì)應(yīng)于 49 個(gè)人根據(jù)這些條件:直立位置、所有上身部分幾乎可見以及身體的非側(cè)面視點(diǎn)。


132 AIST++ 舞蹈動(dòng)作數(shù)據(jù)集

類型:姿態(tài)估計(jì)
數(shù)量:1010萬
數(shù)據(jù)集下載地址: https://google.github.io/aistplusplus_dataset/factsfigures.html
說明:

AIST++ 舞蹈動(dòng)作數(shù)據(jù)集是從 AIST 舞蹈視頻數(shù)據(jù)庫(kù)構(gòu)建的。對(duì)于多視圖視頻,設(shè)計(jì)了一個(gè)精心設(shè)計(jì)的管道來估計(jì)相機(jī)參數(shù)、3D 人體關(guān)鍵點(diǎn)和 3D 人體舞蹈動(dòng)作序列:

它為 1010 萬張圖像提供 3D 人體關(guān)鍵點(diǎn)注釋和相機(jī)參數(shù),涵蓋 9 個(gè)視圖中的 30 個(gè)不同主題。這些屬性使其成為具有 3D 人體關(guān)鍵點(diǎn)注釋的最大和最豐富的現(xiàn)有數(shù)據(jù)集。它還包含 1,408 個(gè) 3D 人類舞蹈動(dòng)作序列,表示為關(guān)節(jié)旋轉(zhuǎn)以及根軌跡。舞蹈動(dòng)作平均分布在 10 種舞蹈流派中,有數(shù)百種編舞。運(yùn)動(dòng)持續(xù)時(shí)間從 7.4 秒不等。至 48.0 秒。所有的舞蹈動(dòng)作都有相應(yīng)的音樂。


133. HiEve數(shù)據(jù)集

類型:姿態(tài)估計(jì)
數(shù)量:
數(shù)據(jù)集下載地址: Human in Events
說明:

該數(shù)據(jù)集專注于在各種人群和復(fù)雜事件中進(jìn)行非常具有挑戰(zhàn)性和現(xiàn)實(shí)性的以人為中心的分析任務(wù),包括地鐵上下車、碰撞、戰(zhàn)斗和地震逃生。并且具有大規(guī)模和密集注釋的標(biāo)簽,涵蓋了以人為中心的分析中的廣泛任務(wù)。

該數(shù)據(jù)集具有大規(guī)模且注釋密集的標(biāo)簽,涵蓋了以人為中心的分析中的廣泛任務(wù)。

我們的HiEve數(shù)據(jù)集包括當(dāng)前最大數(shù)量的姿勢(shì)(>1M)、最大數(shù)量的復(fù)雜事件動(dòng)作標(biāo)簽(>56k)以及最大數(shù)量的長(zhǎng)期軌跡(平均軌跡長(zhǎng)度>480)。




12. 自動(dòng)駕駛(automatic drive)

tinyperson數(shù)據(jù)集下載,隨筆,深度學(xué)習(xí),深度學(xué)習(xí),圖像處理,開源,人工智能

134. CrackForest數(shù)據(jù)集

類型:自動(dòng)駕駛
數(shù)量:
數(shù)據(jù)集下載地址:https://github.com/cuilimeng/CrackForest
說明:
CrackForest數(shù)據(jù)集是一個(gè)帶注釋的道路裂縫圖像數(shù)據(jù)庫(kù),可以大致反映城市路面狀況。


135. KITTI 道路數(shù)據(jù)集

類型:自動(dòng)駕駛
數(shù)量:600
數(shù)據(jù)集下載地址: https://www.cvlibs.net/datasets/kitti/eval_road.php
說明:
道路和車道估計(jì)基準(zhǔn)包括289次培訓(xùn)和290幅測(cè)試圖像。我們?cè)邙B瞰空間中評(píng)估道路和車道的估計(jì)性能。它包含不同類別的道路場(chǎng)景:城市無標(biāo)記、城市標(biāo)記、 城市多條標(biāo)記車道以及以上三者的結(jié)合。地面實(shí)況是通過手動(dòng)注釋圖像生成的,可用于兩種不同的道路地形類型:道路-道路區(qū)域,即所有車道的組成,以及車道-自我車道,即車輛當(dāng)前行駛的車道。地面實(shí)況僅用于訓(xùn)練圖像。


136. KITTI-2015立體聲數(shù)據(jù)集

類型:自動(dòng)駕駛
數(shù)量:400
數(shù)據(jù)集下載地址: https://www.cvlibs.net/datasets/kitti/eval_scene_flow.php?benchmark=stereo
說明:
stero 2015 基準(zhǔn)測(cè)試包含 200 個(gè)訓(xùn)練場(chǎng)景和 200 個(gè)測(cè)試場(chǎng)景(每個(gè)場(chǎng)景 4 幅彩色圖像,以無損 png 格式保存)。與stereo 2012 和flow 2012 基準(zhǔn)測(cè)試相比,它包含動(dòng)態(tài)場(chǎng)景,在半自動(dòng)過程中為其建立了真值。該數(shù)據(jù)集是通過在卡爾斯魯厄中等規(guī)模城市、農(nóng)村地區(qū)和高速公路上行駛而捕獲的。每張圖像最多可以看到 15 輛汽車和 30 名行人。


137. KITTI-2015光流數(shù)據(jù)集

類型:自動(dòng)駕駛
數(shù)量:400
數(shù)據(jù)集下載地址:http://www.cvlibs.net/datasets/kitti/eval_scene_flow.php?benchmark=flow
說明:
Flow 2015 基準(zhǔn)測(cè)試包含 200 個(gè)訓(xùn)練場(chǎng)景和 200 個(gè)測(cè)試場(chǎng)景(每個(gè)場(chǎng)景 4 幅彩色圖像,以無損 png 格式保存)。與stereo 2012 和flow 2012 基準(zhǔn)測(cè)試相比,它包含動(dòng)態(tài)場(chǎng)景,在半自動(dòng)過程中為其建立了真值。該數(shù)據(jù)集是通過在卡爾斯魯厄中等規(guī)模城市、農(nóng)村地區(qū)和高速公路上行駛而捕獲的。每張圖像最多可以看到 15 輛汽車和 30 名行人。


138. KITTI-2015場(chǎng)景流數(shù)據(jù)集

類型:自動(dòng)駕駛
數(shù)量:400
數(shù)據(jù)集下載地址:http://www.cvlibs.net/datasets/kitti/eval_scene_flow.php
說明:
Sceneflow 2015 基準(zhǔn)測(cè)試包含 200 個(gè)訓(xùn)練場(chǎng)景和 200 個(gè)測(cè)試場(chǎng)景(每個(gè)場(chǎng)景 4 幅彩色圖像,以無損 png 格式保存)。與stereo 2012 和flow 2012 基準(zhǔn)測(cè)試相比,它包含動(dòng)態(tài)場(chǎng)景,在半自動(dòng)過程中為其建立了真值。該數(shù)據(jù)集是通過在卡爾斯魯厄中等規(guī)模城市、農(nóng)村地區(qū)和高速公路上行駛而捕獲的。每張圖像最多可以看到 15 輛汽車和 30 名行人。


139. KITTI深度數(shù)據(jù)集

類型:自動(dòng)駕駛
數(shù)量:93000
數(shù)據(jù)集下載地址:http://www.cvlibs.net/datasets/kitti/eval_depth_all.php
說明:
KITTI-depth 包含超過 93,000 個(gè)深度圖以及相應(yīng)的原始 LiDaR 掃描和 RGB 圖像。鑒于大量的訓(xùn)練數(shù)據(jù),該數(shù)據(jù)集應(yīng)允許訓(xùn)練復(fù)雜的深度學(xué)習(xí)模型,以完成深度補(bǔ)全和單幅圖像深度預(yù)測(cè)的任務(wù)。此外,該數(shù)據(jù)集提供了帶有未發(fā)布深度圖的手動(dòng)選擇圖像,作為這兩個(gè)具有挑戰(zhàn)性的任務(wù)的基準(zhǔn)。


140. 城市景觀圖像對(duì)數(shù)據(jù)集

類型:自動(dòng)駕駛
數(shù)量:2975
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/dansbecker/cityscapes-image-pairs
說明:
城市景觀數(shù)據(jù)(數(shù)據(jù)集主頁(yè))包含從德國(guó)駕駛的車輛中拍攝的標(biāo)記視頻。此版本是作為 Pix2Pix 論文的一部分創(chuàng)建的已處理子樣本。數(shù)據(jù)集包含來自原始視頻的靜止圖像,語義分割標(biāo)簽與原始圖像一起顯示在圖像中。這是語義分割任務(wù)的最佳數(shù)據(jù)集之一。
該數(shù)據(jù)集有 2975 個(gè)訓(xùn)練圖像文件和 500 個(gè)驗(yàn)證圖像文件。 每個(gè)圖像文件為 256x512 像素,每個(gè)文件是與圖像左半部分的原始照片以及右半部分的標(biāo)記圖像(語義分割的輸出)的合成。


141. 自動(dòng)駕駛汽車語義分割數(shù)據(jù)集

類型:自動(dòng)駕駛
數(shù)量:5000
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/kumaresanmanickavelu/lyft-udacity-challenge
說明:
該數(shù)據(jù)集提供通過 CARLA 自動(dòng)駕駛汽車模擬器捕獲的數(shù)據(jù)圖像和標(biāo)記語義分割。 這些數(shù)據(jù)是作為 Lyft Udacity Challenge 的一部分生成的。 該數(shù)據(jù)集可用于訓(xùn)練 ML 算法以識(shí)別圖像中汽車、道路等的語義分割。
數(shù)據(jù)有5組1000張圖片和對(duì)應(yīng)的標(biāo)簽。


142. 道路自動(dòng)駕駛汽車數(shù)據(jù)集

類型:自動(dòng)駕駛
數(shù)量:
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/ananduthaman/self-driving-car-on-indian-roads
說明:
該數(shù)據(jù)集為自動(dòng)駕駛車輛提供了易于使用的訓(xùn)練數(shù)據(jù)。 提供駕駛視頻中每一幀對(duì)應(yīng)的轉(zhuǎn)向角、加速度、剎車和檔位。 這段視頻是使用安裝在汽車擋風(fēng)玻璃上的攝像頭錄制的,該汽車沿著印度喀拉拉邦的道路行駛。


143. 駕駛模擬器車道檢測(cè)數(shù)據(jù)集

類型:自動(dòng)駕駛
數(shù)量:
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/thomasfermi/lane-detection-for-carla-driving-simulator
說明:
該數(shù)據(jù)集由 Carla 駕駛模擬器生成的圖像組成。 訓(xùn)練圖像是由安裝在模擬車輛中的行車記錄儀捕獲的圖像。 標(biāo)簽圖像是分割掩碼。 標(biāo)簽圖像將每個(gè)像素分類為:左側(cè)車道邊界的和右側(cè)車道邊界。與該數(shù)據(jù)集相關(guān)的挑戰(zhàn)是訓(xùn)練一個(gè)能夠準(zhǔn)確預(yù)測(cè)驗(yàn)證數(shù)據(jù)集的分割掩碼的模型。


144. 雷達(dá)場(chǎng)景數(shù)據(jù)集

類型:自動(dòng)駕駛
數(shù)量:
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/aleksandrdubrovin/the-radarscenes-data-set
說明:
RadarScenes 數(shù)據(jù)集包含來自四個(gè)汽車?yán)走_(dá)傳感器的記錄,這些傳感器安裝在一輛測(cè)量車輛上。 添加了來自一臺(tái)前置紀(jì)實(shí)相機(jī)的圖像。 它于 2016 年至 2018 年在德國(guó)烏爾姆錄制。該數(shù)據(jù)集的長(zhǎng)度超過 4 小時(shí),除了來自雷達(dá)傳感器的點(diǎn)云數(shù)據(jù)外,還提供了 12 個(gè)不同類別的逐點(diǎn)語義注釋。除了逐點(diǎn)類標(biāo)簽外,跟蹤 ID 還附加到動(dòng)態(tài)對(duì)象的每個(gè)單獨(dú)檢測(cè),以便可以隨時(shí)間跟蹤各個(gè)對(duì)象。


145. LiDAR 2D深度圖像數(shù)據(jù)集

類型:自動(dòng)駕駛
數(shù)量:
數(shù)據(jù)集下載地址:https://www.kaggle.com/datasets/ahmedfawzyelaraby/kitti-lidar-based-2d-depth-images
說明:
該數(shù)據(jù)集包含 2D 深度圖像,如下圖所示。像 KITTI 數(shù)據(jù)集中的 360 度 LiDAR 框架在傳感器本身周圍呈圓柱形。該數(shù)據(jù)集中的 2D 深度圖像可以表示為您在 LiDAR 框架的圓柱體上進(jìn)行了切割并將其拉直以位于 2D 平面中。這些 2D 深度圖像的像素代表反射物體與 LiDAR 傳感器的距離。 2D 深度圖像的垂直分辨率(在我們的例子中為 64)表示用于掃描周圍環(huán)境的 LiDAR 傳感器的激光束數(shù)量。這些 2D 深度圖像代表相應(yīng) LiDAR 幀的相同場(chǎng)景,但格式更易于處理,可用于分割、檢測(cè)、識(shí)別等任務(wù),并且可以利用計(jì)算機(jī)視覺關(guān)于 2D 圖像的大量文獻(xiàn)。


146. 晝夜行人序列數(shù)據(jù)集

類型:自動(dòng)駕駛
數(shù)量:7000
數(shù)據(jù)集下載地址:http://adas.cvc.uab.es/elektra/enigma-portfolio/cvc-14-visible-fir-day-night-pedestrian-sequence-dataset/
說明:
數(shù)據(jù)集由兩組序列組成。 這些序列被命名為白天和夜晚集,指的是它們被獲取的一天中的時(shí)刻,Visible和 FIR 取決于用戶記錄序列的相機(jī)。 白天訓(xùn)練 3695 個(gè) imegas,晚上訓(xùn)練 3390 個(gè)圖像,每個(gè)序列大約有 1500 個(gè)強(qiáng)制性行人注釋。 用于測(cè)試兩個(gè)序列的約 700 張圖像,白天約有 2000 名行人,夜間約有 1500 名行人


147. RSCD自動(dòng)駕駛路面圖像分類數(shù)據(jù)集

類型:自動(dòng)駕駛
數(shù)量:1000000
數(shù)據(jù)集下載地址:https://github.com/ztsrxh/RSCD-Road_Surface_Classification_Dataset
說明:
實(shí)車采集、手工標(biāo)注并發(fā)布了該路面圖像分類數(shù)據(jù)集(RSCD),提供路面附著水平、不平度及材質(zhì)的全狀態(tài)詳細(xì)標(biāo)注信息,共包含約100萬張圖片。覆蓋了不同季節(jié)、天氣、路況及材質(zhì)狀態(tài)下的約 700 公里的道路。

為實(shí)現(xiàn)精細(xì)化的路面狀態(tài)感知,將原始圖片的路面區(qū)域裁剪成360*240大小的圖像塊,并進(jìn)行手動(dòng)標(biāo)注。




13. RGB-T

148. HFUT-Lytro數(shù)據(jù)集

類型:RGBT
數(shù)量:
數(shù)據(jù)集下載地址:https://dl.acm.org/doi/10.1145/3107956
說明:15000
由255個(gè)光場(chǎng)組成,每個(gè)光場(chǎng)圖像生成的圖像范圍從53到64個(gè),其中跨越了多個(gè)顯著性檢測(cè)挑戰(zhàn),如遮擋、雜亂背景和外觀變化。


149. DUTLF-V2

類型:RGBT
數(shù)量:4200
數(shù)據(jù)集下載地址:https://github.com/OIPLab-DUT/DUTLF-V2
說明:
由于具有強(qiáng)大的三維信息捕捉能力,光場(chǎng)數(shù)據(jù)為顯著性檢測(cè)算法提供了更為有力的支持。
多功能數(shù)據(jù)集,其中包含了102類目標(biāo)、共4202個(gè)樣本,可以有效支持基于RGB、RGB-D和光場(chǎng)數(shù)據(jù)的顯著性檢測(cè)算法。


150. ReDWeb-S

類型:RGBT
數(shù)量:3200
數(shù)據(jù)集下載地址:https://github.com/nnizhang/SMAC
說明:
它共有 3179 張圖像,具有各種真實(shí)世界場(chǎng)景和高質(zhì)量的深度圖。我們將數(shù)據(jù)集分成包含 2179 個(gè) RGB-D 圖像對(duì)的訓(xùn)練集和包含剩余 1000 個(gè)圖像對(duì)的測(cè)試集。


更多內(nèi)容,詳見:海量數(shù)據(jù)集,https://www.cvmart.net/dataSets

版權(quán)聲明:
youcans@xupt 原創(chuàng)作品,轉(zhuǎn)載必須標(biāo)注原文鏈接:(https://blog.csdn.net/youcans/article/details/127244865)
Copyright 2022 youcans, XUPT
Crated:2022-10-10文章來源地址http://www.zghlxwxcb.cn/news/detail-855183.html

到了這里,關(guān)于12大類150個(gè)圖像處理和深度學(xué)習(xí)開源數(shù)據(jù)集的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 一文整理深度學(xué)習(xí)【醫(yī)學(xué)圖像處理領(lǐng)域期刊和會(huì)議】

    參考地址:醫(yī)學(xué)圖像處理領(lǐng)域期刊和會(huì)議 參考地址:中國(guó)計(jì)算機(jī)學(xué)會(huì)推薦國(guó)際學(xué)術(shù)會(huì)議和期刊目錄 期刊名 鏈接 TMI IEEE Transactions on Medical Imaging MedIA

    2023年04月23日
    瀏覽(21)
  • 【深度學(xué)習(xí)】--圖像處理中的注意力機(jī)制

    【深度學(xué)習(xí)】--圖像處理中的注意力機(jī)制

    注意力機(jī)制是一個(gè)非常有效的trick,注意力機(jī)制的實(shí)現(xiàn)方式有許多??梢栽谥W(wǎng)上搜索一下yolov下的目標(biāo)監(jiān)測(cè)的碩士論文,沒有一篇不提到注意力機(jī)制的迭代修改的,所以很有必要學(xué)一下. 最后給出了一個(gè)例子。 注意力機(jī)制的本質(zhì):就是尋址過程! 幾種典型的注意力機(jī)制: hard

    2024年02月03日
    瀏覽(24)
  • 九章算法: 深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、機(jī)器學(xué)習(xí)、推薦系統(tǒng)、圖像處理、文本處理、序列處理、搜索引擎、數(shù)據(jù)分析等

    作者:禪與計(jì)算機(jī)程序設(shè)計(jì)藝術(shù) 隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,人工智能和機(jī)器學(xué)習(xí)領(lǐng)域迎來蓬勃發(fā)展的時(shí)代,從“知識(shí)圖譜”到“零售系統(tǒng)自動(dòng)化”,人工智能技術(shù)正在改變著社會(huì)生活的方方面面。傳統(tǒng)的人工智能技術(shù)都依賴于硬件上的復(fù)雜計(jì)算能力,如神經(jīng)網(wǎng)絡(luò)、決策樹等

    2024年02月08日
    瀏覽(20)
  • OpenCV實(shí)戰(zhàn):從圖像處理到深度學(xué)習(xí)的全面指南

    OpenCV實(shí)戰(zhàn):從圖像處理到深度學(xué)習(xí)的全面指南

    本文深入淺出地探討了OpenCV庫(kù)在圖像處理和深度學(xué)習(xí)中的應(yīng)用。從基本概念和操作,到復(fù)雜的圖像變換和深度學(xué)習(xí)模型的使用,文章以詳盡的代碼和解釋,帶領(lǐng)大家步入OpenCV的實(shí)戰(zhàn)世界。 OpenCV(Open Source Computer Vision Library)是一個(gè)開源的計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)軟件庫(kù)。它由一

    2024年02月14日
    瀏覽(17)
  • 深度學(xué)習(xí)圖像處理基礎(chǔ)工具——opencv 實(shí)戰(zhàn)信用卡數(shù)字識(shí)別

    深度學(xué)習(xí)圖像處理基礎(chǔ)工具——opencv 實(shí)戰(zhàn)信用卡數(shù)字識(shí)別

    任務(wù) 信用卡數(shù)字識(shí)別 穿插之前學(xué)的知識(shí)點(diǎn)? 形態(tài)學(xué)操作 模板匹配 等 總體流程與方法 1.有一個(gè)模板 2 用輪廓檢測(cè)把模板中數(shù)字拿出來 外接矩形(模板和輸入圖像的大小要一致 )3 一系列預(yù)處理操作 問題的解決思路 1.分析準(zhǔn)備:準(zhǔn)備模板,讀取文件——轉(zhuǎn)化為灰度圖——轉(zhuǎn)化

    2024年04月15日
    瀏覽(95)
  • 深度學(xué)習(xí)中基于python的預(yù)處理和圖像擴(kuò)增方法

    容易出現(xiàn)的報(bào)錯(cuò): 錯(cuò)誤原因通常為保存的路徑不正確: 應(yīng)改為: 即第一個(gè)參數(shù)應(yīng)該寫到文件的名稱,而不能只寫到文件夾就停止。 灰度圖片和黑白圖片有些相似,但并不完全相同。 灰度圖片是指每個(gè)像素點(diǎn)的顏色由灰度值來表示,通常使用8位無符號(hào)整數(shù)(0-255)表示?;?/p>

    2024年02月08日
    瀏覽(32)
  • BIT 變化檢測(cè)模型復(fù)現(xiàn) 深度學(xué)習(xí)學(xué)習(xí)筆記 基于transformer結(jié)構(gòu)的圖像處理模型

    BIT 變化檢測(cè)模型復(fù)現(xiàn) 深度學(xué)習(xí)學(xué)習(xí)筆記 基于transformer結(jié)構(gòu)的圖像處理模型

    BIT 是用 transformer 結(jié)構(gòu)進(jìn)行變化檢測(cè)的一個(gè)孿生網(wǎng)絡(luò),它的 backbone 用的是 Resnet 結(jié)構(gòu),具體結(jié)構(gòu)分析可以參考這個(gè)鏈接的作者寫的,非常清楚, http://t.csdn.cn/rA9sH。 下面就是來講我自己的實(shí)現(xiàn)過程,比較簡(jiǎn)單。 首先,在官網(wǎng)找到相應(yīng)的代碼,下載解壓到自己的本地。github上面的

    2024年02月10日
    瀏覽(62)
  • 圖像處理之《尋找和隱藏:通過深度強(qiáng)化學(xué)習(xí)的對(duì)抗隱寫術(shù)》論文閱讀

    圖像處理之《尋找和隱藏:通過深度強(qiáng)化學(xué)習(xí)的對(duì)抗隱寫術(shù)》論文閱讀

    一、文章摘要 圖像隱寫術(shù)的目的是將一個(gè)完整大小的圖像(稱為秘密)隱藏到另一個(gè)圖像(稱為封面)中。以往的圖像隱寫算法只能在一個(gè)封面中隱藏一個(gè)秘密。在這篇論文中, 我們提出了一個(gè)自適應(yīng)局部圖像隱寫(AdaSteg)系統(tǒng),允許縮放和位置自適應(yīng)圖像隱寫 。該系統(tǒng)通過在局部

    2024年03月14日
    瀏覽(29)
  • FFmpeg中硬解碼后深度學(xué)習(xí)模型的圖像處理dnn_processing(一)

    FFmpeg中硬解碼后深度學(xué)習(xí)模型的圖像處理dnn_processing(一)

    ffmpeg硬件解碼可以使用最新的vulkan來做,基本上來說,不挑操作系統(tǒng)是比較重要的,如果直接使用cuda也是非常好的選擇。 下面的class 是我封裝了一些功能,只是示例,讀者可以自行修改,讀的是rtsp 流,后面準(zhǔn)備推流到gb28181上。 首先聲明,使用sdl來渲染畫面并不是有多好,

    2024年02月14日
    瀏覽(17)
  • AI一鍵去衣技術(shù):窺見深度學(xué)習(xí)在圖像處理領(lǐng)域的革命(最后有彩蛋)

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)在圖像處理領(lǐng)域展現(xiàn)出了強(qiáng)大的潛力。其中,一鍵去衣(AI-based Clothing Removal)技術(shù)作為其炙手可熱的一個(gè)分支,吸引了廣泛的關(guān)注。這項(xiàng)技術(shù)利用深度學(xué)習(xí)算法,能夠?qū)⑷宋锎┲姆b從圖像中去除,呈現(xiàn)出人體的裸露狀態(tài),因其技術(shù)

    2024年04月16日
    瀏覽(16)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包