論文地址
代碼下載
官網(wǎng)
關(guān)于Segment Anything的理解
1.人工標注過程
使用公開數(shù)據(jù)集訓(xùn)練,并且讓人工標注團隊進行標注預(yù)測的mask,該過程總共進行6次,并產(chǎn)生430萬個mask
2.半自動標注過程
模型產(chǎn)生的置信度相對較高的mask,不需要人工標注,而置信度相對不高的mask,由人工完成標注。舉個例子,模型分割一張圖片,總共產(chǎn)生了10個mask,其中有5個分割得很好,這部分就作為自動標注的mask,另外5個效果不好,就進行人工標注。該過程總共進行5次,產(chǎn)生590萬個mask
3.全自動過程
讓模型完成全自動的標注。通過IoU過濾置信度不高的mask,并且進行去重操作,產(chǎn)生11億的mask
關(guān)于數(shù)據(jù)集SA-1B
數(shù)據(jù)集相當大,嘗試下載一個tar,大概10個G,壓縮包總共可能有10T
SA-1B數(shù)據(jù)下載
關(guān)于網(wǎng)絡(luò)模型
網(wǎng)絡(luò)總共有三個部分:image_encoder、prompt_encoder和mask_decoder。個人感覺網(wǎng)絡(luò)模型還是很大的,下面是細化的網(wǎng)絡(luò)模型也是代碼結(jié)構(gòu)
image_encoder部分:
prompt_encoder部分:
文章來源:http://www.zghlxwxcb.cn/news/detail-463097.html
mask_decoder部分:
文章來源地址http://www.zghlxwxcb.cn/news/detail-463097.html
到了這里,關(guān)于Segment Anything模型結(jié)構(gòu)解讀的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!