国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【計(jì)算機(jī)視覺(jué) | 目標(biāo)檢測(cè)】Grounding DINO 深度學(xué)習(xí)環(huán)境的配置（含案例）

2年前作者：旅途中的寬~分類：Toy博客閱讀(97)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了【計(jì)算機(jī)視覺(jué) | 目標(biāo)檢測(cè)】Grounding DINO 深度學(xué)習(xí)環(huán)境的配置（含案例）。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

“Grounding DINO：Marrying DINO with Grounded Pre-Training for Open-Set Object Detection”的官方 PyTorch 實(shí)現(xiàn)：SoTA 開放集對(duì)象檢測(cè)器。

一、Helpful Tutorial

論文地址：

https://arxiv.org/abs/2303.05499

在 YouTube 上觀看介紹視頻：

https://www.youtube.com/watch?v=wxWDt5UiwY8&feature=youtu.be

【計(jì)算機(jī)視覺(jué) | 目標(biāo)檢測(cè)】Grounding DINO 深度學(xué)習(xí)環(huán)境的配置（含案例）
Try the Colab Demo：

https://colab.research.google.com/github/roboflow-ai/notebooks/blob/main/notebooks/zero-shot-object-detection-with-grounding-dino.ipynb

Try Official Huggingface Demo：

https://huggingface.co/spaces/ShilongLiu/Grounding_DINO_demo

二、相關(guān)的論文工作

2.1 相關(guān)的論文整理

【計(jì)算機(jī)視覺(jué) | 目標(biāo)檢測(cè)】Grounding DINO 深度學(xué)習(xí)環(huán)境的配置（含案例）

Grounded-SAM: Marrying Grounding DINO with Segment Anything
Grounding DINO with Stable Diffusion
Grounding DINO with GLIGEN for Controllable Image Editing
OpenSeeD: A Simple and Strong Openset Segmentation Model
SEEM: Segment Everything Everywhere All at Once
X-GPT: Conversational Visual Agent supported by X-Decoder
GLIGEN: Open-Set Grounded Text-to-Image Generation
LLaVA: Large Language and Vision Assistant

2.2 論文的亮點(diǎn)

本工作的亮點(diǎn)：

Open-Set Detection. Detect everything with language!
High Performancce. COCO zero-shot 52.5 AP (training without COCO data!). COCO fine-tune 63.0 AP.
Flexible. Collaboration with Stable Diffusion for Image Editting.

2.3 論文介紹

【計(jì)算機(jī)視覺(jué) | 目標(biāo)檢測(cè)】Grounding DINO 深度學(xué)習(xí)環(huán)境的配置（含案例）

2.4 Marrying Grounding DINO and GLIGEN

【計(jì)算機(jī)視覺(jué) | 目標(biāo)檢測(cè)】Grounding DINO 深度學(xué)習(xí)環(huán)境的配置（含案例）

2.5 輸入和輸出的說(shuō)明 / 提示

Grounding DINO accepts an (image, text) pair as inputs.
It outputs 900 (by default) object boxes. Each box has similarity scores across all input words. (as shown in Figures below.)
We defaultly choose the boxes whose highest similarities are higher than a box_threshold.
We extract the words whose similarities are higher than the text_threshold as predicted labels.
If you want to obtain objects of specific phrases, like the dogs in the sentence two dogs with a stick., you can select the boxes with highest text similarities with dogs as final outputs.
Note that each word can be split to more than one tokens with differetn tokenlizers. The number of words in a sentence may not equal to the number of text tokens.
We suggest separating different category names with . for Grounding DINO.

三、環(huán)境配置過(guò)程

3.1 我的環(huán)境

系統(tǒng)：最新的ubuntu系統(tǒng)

顯卡：3090

CUDA：11.3

如果您有 CUDA 環(huán)境，請(qǐng)確保設(shè)置了環(huán)境變量 CUDA_HOME。如果沒(méi)有可用的 CUDA，它將在 CPU-only 模式下編譯。

3.2 配置過(guò)程

3.2.1 Clone the GroundingDINO repository from GitHub

git clone https://github.com/IDEA-Research/GroundingDINO.git

下載后即可找到對(duì)應(yīng)的文件夾：

【計(jì)算機(jī)視覺(jué) | 目標(biāo)檢測(cè)】Grounding DINO 深度學(xué)習(xí)環(huán)境的配置（含案例）

3.2.2 Change the current directory to the GroundingDINO folder

cd GroundingDINO/

3.2.3 Install the required dependencies in the current directory

pip3 install -q -e .

不知道為什么，我這個(gè)下載一直報(bào)錯(cuò)！換一個(gè)新的下載方式：

python setup.py install

【計(jì)算機(jī)視覺(jué) | 目標(biāo)檢測(cè)】Grounding DINO 深度學(xué)習(xí)環(huán)境的配置（含案例）

但是也會(huì)飄紅！

這個(gè)時(shí)候不要害怕，遇到錯(cuò)誤的包，直接使用 pip 下載即可，耐得住性子，最后再運(yùn)行上面的安裝命令，即可順利成功！

【計(jì)算機(jī)視覺(jué) | 目標(biāo)檢測(cè)】Grounding DINO 深度學(xué)習(xí)環(huán)境的配置（含案例）

3.2.4 Create a new directory called “weights” to store the model weights

mkdir weights

Change the current directory to the “weights” folder：

cd weights

Download the model weights file：

wget -q https://github.com/IDEA-Research/GroundingDINO/releases/download/v0.1.0-alpha/groundingdino_swint_ogc.pth

四、測(cè)試

Check your GPU ID (only if you’re using a GPU)：

nvidia-smi

【計(jì)算機(jī)視覺(jué) | 目標(biāo)檢測(cè)】Grounding DINO 深度學(xué)習(xí)環(huán)境的配置（含案例）

Replace {GPU ID}, image_you_want_to_detect.jpg, and “dir you want to save the output” with appropriate values in the following command：

CUDA_VISIBLE_DEVICES={GPU ID} python demo/inference_on_a_image.py \
-c /GroundingDINO/groundingdino/config/GroundingDINO_SwinT_OGC.py \
-p /GroundingDINO/weights/groundingdino_swint_ogc.pth \
-i image_you_want_to_detect.jpg \
-o "dir you want to save the output" \
-t "chair"
 [--cpu-only] # open it for cpu mode

當(dāng)然了，我們也可以使用 Python 進(jìn)行測(cè)試：

from groundingdino.util.inference import load_model, load_image, predict, annotate
import cv2

model = load_model("./GroundingDINO/groundingdino/config/GroundingDINO_SwinT_OGC.py", "./GroundingDINO/weights/groundingdino_swint_ogc.pth")
IMAGE_PATH = "./GroundingDINO/weights/1.png"
TEXT_PROMPT = "person . bike . bottle ."
BOX_TRESHOLD = 0.35
TEXT_TRESHOLD = 0.25

image_source, image = load_image(IMAGE_PATH)

boxes, logits, phrases = predict(
    model=model,
    image=image,
    caption=TEXT_PROMPT,
    box_threshold=BOX_TRESHOLD,
    text_threshold=TEXT_TRESHOLD
)

annotated_frame = annotate(image_source=image_source, boxes=boxes, logits=logits, phrases=phrases)
cv2.imwrite("./GroundingDINO/weights/annotated_image.jpg", annotated_frame)

我們的測(cè)試原圖片為：

【計(jì)算機(jī)視覺(jué) | 目標(biāo)檢測(cè)】Grounding DINO 深度學(xué)習(xí)環(huán)境的配置（含案例）
測(cè)試后的圖片為：

【計(jì)算機(jī)視覺(jué) | 目標(biāo)檢測(cè)】Grounding DINO 深度學(xué)習(xí)環(huán)境的配置（含案例）

文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-467624.html

到了這里，關(guān)于【計(jì)算機(jī)視覺(jué) | 目標(biāo)檢測(cè)】Grounding DINO 深度學(xué)習(xí)環(huán)境的配置（含案例）的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

【計(jì)算機(jī)視覺(jué)】最強(qiáng) Zero-Shot 視覺(jué)應(yīng)用：Grounding DINO + Segment Anything + Stable Diffusion
用 Midjourney 花一個(gè)小時(shí)做的項(xiàng)目 logo 圖：解釋一下 logo 的含義：一只坐在地上的馬賽克風(fēng)格的熊。坐在地面上是因?yàn)?ground 有地面的含義，然后分割后的圖片可以認(rèn)為是一種馬賽克風(fēng)格，而且馬賽克諧音 mask ，之所以用熊作為 logo 主體，是因?yàn)轫?xiàng)目主要示例的圖片是熊。 G
2024年02月04日
瀏覽(27)
【計(jì)算機(jī)視覺(jué) | 目標(biāo)檢測(cè)】arxiv 計(jì)算機(jī)視覺(jué)關(guān)于目標(biāo)檢測(cè)的學(xué)術(shù)速遞（8 月 14 日論文合集）
基于保持歷史分布的連續(xù)人臉偽造檢測(cè) 人臉偽造技術(shù)發(fā)展迅速，并帶來(lái)了嚴(yán)重的安全威脅?，F(xiàn)有的人臉偽造檢測(cè)方法試圖學(xué)習(xí)可推廣的特征，但它們?nèi)匀蝗狈?shí)際應(yīng)用。此外，在歷史訓(xùn)練數(shù)據(jù)上微調(diào)這些方法在時(shí)間和存儲(chǔ)方面是資源密集型的。在本文中，我們關(guān)注一個(gè)新穎且
2024年02月11日
瀏覽(31)
【計(jì)算機(jī)視覺(jué) | 目標(biāo)檢測(cè)】arxiv 計(jì)算機(jī)視覺(jué)關(guān)于目標(biāo)檢測(cè)的學(xué)術(shù)速遞（6月 30 日論文合集）
檢測(cè)任何深度偽裝：分割任何符合人臉的偽裝檢測(cè)和定位論文地址：計(jì)算機(jī)視覺(jué)的快速發(fā)展刺激了面部偽造技術(shù)的顯著進(jìn)步，引起了致力于檢測(cè)偽造和精確定位操縱區(qū)域的研究人員的關(guān)注。盡管如此，在有限的細(xì)粒度像素監(jiān)督標(biāo)簽的情況下，deepfake檢測(cè)模型在精確的偽造檢測(cè)
2024年02月16日
瀏覽(27)
【計(jì)算機(jī)視覺(jué) | 目標(biāo)檢測(cè)】arxiv 計(jì)算機(jī)視覺(jué)關(guān)于目標(biāo)檢測(cè)的學(xué)術(shù)速遞（7 月 4 日論文合集）
偽像映射：用于目標(biāo)檢測(cè)和三維定位的多模式語(yǔ)義映射論文地址：幾何導(dǎo)航是當(dāng)今機(jī)器人領(lǐng)域的一個(gè)成熟的領(lǐng)域，研究重點(diǎn)正在轉(zhuǎn)向更高層次的場(chǎng)景理解，如語(yǔ)義映射。當(dāng)機(jī)器人需要與環(huán)境交互時(shí)，它必須能夠理解周圍環(huán)境的上下文信息。這項(xiàng)工作的重點(diǎn)是分類和定位地圖
2024年02月13日
瀏覽(20)
【計(jì)算機(jī)視覺(jué) | 目標(biāo)檢測(cè)】arxiv 計(jì)算機(jī)視覺(jué)關(guān)于目標(biāo)檢測(cè)的學(xué)術(shù)速遞（12 月 6 日論文合集）
擴(kuò)散-SS3D：半監(jiān)督三維目標(biāo)檢測(cè)的擴(kuò)散模型半監(jiān)督目標(biāo)檢測(cè)對(duì)于三維場(chǎng)景理解至關(guān)重要，有效地解決了獲取大規(guī)模三維邊界框注釋的限制?，F(xiàn)有方法通常采用具有偽標(biāo)記的師生框架來(lái)利用未標(biāo)記的點(diǎn)云。然而，在多樣化的3D空間中產(chǎn)生可靠的偽標(biāo)簽仍然具有挑戰(zhàn)性。在這項(xiàng)工
2024年02月03日
瀏覽(26)
【計(jì)算機(jī)視覺(jué) | 目標(biāo)檢測(cè)】arxiv 計(jì)算機(jī)視覺(jué)關(guān)于目標(biāo)檢測(cè)的學(xué)術(shù)速遞（7 月 3 日論文合集）
聯(lián)邦集成YOLOv5–一種更好的廣義目標(biāo)檢測(cè)算法論文地址：聯(lián)邦學(xué)習(xí)（FL）作為一種隱私保護(hù)算法已經(jīng)獲得了顯著的吸引力，但聯(lián)邦學(xué)習(xí)算法（如聯(lián)邦平均（FED Avg）或聯(lián)邦SGD（FED SGD））與集成學(xué)習(xí)算法的潛在相似之處尚未得到充分探索。本文的目的是研究FL的應(yīng)用程序的對(duì)象
2024年02月13日
瀏覽(21)
【計(jì)算機(jī)視覺(jué) | 目標(biāo)檢測(cè)】arxiv 計(jì)算機(jī)視覺(jué)關(guān)于目標(biāo)檢測(cè)的學(xué)術(shù)速遞（7 月 6 日論文合集）
利用Sentinel-2對(duì)沿海地區(qū)海洋垃圾的大規(guī)模探測(cè) 檢測(cè)和量化海洋污染和宏觀塑料是一個(gè)日益緊迫的生態(tài)問(wèn)題，直接影響生態(tài)和人類健康。量化海洋污染的努力往往是通過(guò)稀疏和昂貴的海灘調(diào)查進(jìn)行的，這很難大規(guī)模進(jìn)行。在這里，遙感可以通過(guò)定期監(jiān)測(cè)和檢測(cè)沿海地區(qū)的海洋
2024年02月16日
瀏覽(37)
【計(jì)算機(jī)視覺(jué) | 目標(biāo)檢測(cè)】arxiv 計(jì)算機(jī)視覺(jué)關(guān)于目標(biāo)檢測(cè)的學(xué)術(shù)速遞（5月26日論文合集）
基于能量的激光雷達(dá)數(shù)據(jù)中不利天氣影響的檢測(cè) 論文地址：自動(dòng)駕駛車輛依賴于LiDAR傳感器對(duì)環(huán)境進(jìn)行感知。然而，雨、雪、霧等惡劣天氣條件會(huì)對(duì)這些傳感器造成負(fù)面影響，導(dǎo)致測(cè)量數(shù)據(jù)中引入不必要的噪聲，降低了其可靠性。在本研究中，我們通過(guò)提出一種新的方法來(lái)檢
2024年02月07日
瀏覽(46)
【計(jì)算機(jī)視覺(jué) | 目標(biāo)檢測(cè)】arxiv 計(jì)算機(jī)視覺(jué)關(guān)于目標(biāo)檢測(cè)的學(xué)術(shù)速遞（11 月 28 日論文合集）
基于無(wú)人機(jī)遙感圖像的窗口自動(dòng)檢測(cè)與計(jì)數(shù) 盡管建筑和測(cè)量部門的技術(shù)進(jìn)步，但對(duì)在建或現(xiàn)有建筑物中的窗戶等顯著特征的檢查主要是一個(gè)手動(dòng)過(guò)程。此外，建筑物中存在的窗戶數(shù)量與其在地震下遭受的變形程度直接相關(guān)。在本研究中，提出了一種通過(guò)部署無(wú)人機(jī)（UAV）遙感
2024年02月05日
瀏覽(28)
【計(jì)算機(jī)視覺(jué) | 目標(biāo)檢測(cè)】arxiv 計(jì)算機(jī)視覺(jué)關(guān)于目標(biāo)檢測(cè)的學(xué)術(shù)速遞（7 月 21 日論文合集）
異常檢測(cè)中的表征學(xué)習(xí)：成功、局限和巨大挑戰(zhàn) 在這篇透視論文中，我們認(rèn)為異常檢測(cè)中的主導(dǎo)范式不能無(wú)限擴(kuò)展，最終將達(dá)到根本的極限。這是由于異常檢測(cè)的“沒(méi)有免費(fèi)的午餐”原則。當(dāng)存在強(qiáng)任務(wù)優(yōu)先級(jí)時(shí)，可以克服這些限制，如許多工業(yè)任務(wù)的情況。當(dāng)這樣的先驗(yàn)不
2024年02月16日
瀏覽(26)

<span id="rc8tn"><meter id="rc8tn"><span id="rc8tn"></span></meter></span><rp id="rc8tn"></rp>

<center id="rc8tn"><meter id="rc8tn"></meter></center>