国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<address id="673pi"></address>

<track id="673pi"></track>

<address id="673pi"></address>

計(jì)算機(jī)視覺 – Computer Vision | CV

2年前作者：ZhangJiQun&MXP分類：Toy博客閱讀(36)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了計(jì)算機(jī)視覺 – Computer Vision | CV。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

計(jì)算機(jī)視覺為什么重要？

人的大腦皮層，有差不多 70% 都是在處理視覺信息。是人類獲取信息最主要的渠道，沒有之一。

在網(wǎng)絡(luò)世界，照片和視頻（圖像的集合）也正在發(fā)生爆炸式的增長！

下圖是網(wǎng)絡(luò)上新增數(shù)據(jù)的占比趨勢圖?；疑墙Y(jié)構(gòu)化數(shù)據(jù)，藍(lán)色是非結(jié)構(gòu)化數(shù)據(jù)（大部分都是圖像和視頻）?？梢院苊黠@的發(fā)現(xiàn)，圖片和視頻正在以指數(shù)級的速度在增長。

計(jì)算機(jī)視覺 – Computer Vision | CV,2023 AI,計(jì)算機(jī)視覺,人工智能

而在計(jì)算機(jī)視覺出現(xiàn)之前，圖像對于計(jì)算機(jī)來說是黑盒的狀態(tài)。

一張圖片對于機(jī)器只是一個(gè)文件。機(jī)器并不知道圖片里的內(nèi)容到底是什么，只知道這張圖片是什么尺寸，多少M(fèi)B，什么格式的。

計(jì)算機(jī)視覺 – Computer Vision | CV,2023 AI,計(jì)算機(jī)視覺,人工智能

?

如果計(jì)算機(jī)、人工智能想要在現(xiàn)實(shí)世界發(fā)揮重要作用，就必須看懂圖片！這就是計(jì)算機(jī)視覺要解決的問題。

什么是計(jì)算機(jī)視覺 – CV？

計(jì)算機(jī)視覺是人工智能的一個(gè)重要分支，它要解決的問題就是：看懂圖像里的內(nèi)容。

比如：

圖片里的寵物是貓還是狗？
圖片里的人是老張還是老王？
這張照片里，桌子上放了哪些物品？

計(jì)算機(jī)視覺 – Computer Vision | CV,2023 AI,計(jì)算機(jī)視覺,人工智能

?

計(jì)算機(jī)視覺的原理是什么？

目前主流的基于深度學(xué)習(xí)的機(jī)器視覺方法，其原理跟人類大腦工作的原理比較相似。

人類的視覺原理如下：從原始信號攝入開始（瞳孔攝入像素 Pixels），接著做初步處理（大腦皮層某些細(xì)胞發(fā)現(xiàn)邊緣和方向），然后抽象（大腦判定，眼前的物體的形狀，是圓形的），然后進(jìn)一步抽象（大腦進(jìn)一步判定該物體是只氣球）。

計(jì)算機(jī)視覺 – Computer Vision | CV,2023 AI,計(jì)算機(jī)視覺,人工智能

機(jī)器的方法也是類似：構(gòu)造多層的神經(jīng)網(wǎng)絡(luò)，較低層的識別初級的圖像特征，若干底層特征組成更上一層特征，最終通過多個(gè)層級的組合，最終在頂層做出分類。

計(jì)算機(jī)視覺 – Computer Vision | CV,2023 AI,計(jì)算機(jī)視覺,人工智能

?

計(jì)算機(jī)視覺的2大挑戰(zhàn)

對于人類來說看懂圖片是一件很簡單的事情，但是對于機(jī)器來說這是一個(gè)非常難的事情，說 2 個(gè)典型的難點(diǎn)：

特征難以提取

同一只貓?jiān)诓煌慕嵌龋煌墓饩€，不同的動(dòng)作下。像素差異是非常大的。就算是同一張照片，旋轉(zhuǎn)90度后，其像素差異也非常大！

所以圖片里的內(nèi)容相似甚至相同，但是在像素層面，其變化會(huì)非常大。這對于特征提取是一大挑戰(zhàn)。

需要計(jì)算的數(shù)據(jù)量巨大

手機(jī)上隨便拍一張照片就是1000*2000像素的。每個(gè)像素 RGB 3個(gè)參數(shù)，一共有1000 X 2000 X 3=6,000,000。隨便一張照片就要處理 600萬個(gè)參數(shù)，再算算現(xiàn)在越來越流行的 4K 視頻。就知道這個(gè)計(jì)算量級有多恐怖了。

CNN ?解決了上面的兩大難題

CNN 屬于深度學(xué)習(xí)的范疇，它很好的解決了上面所說的2大難點(diǎn)：

CNN 可以有效的提取圖像里的特征
CNN 可以將海量的數(shù)據(jù)（不影響特征提取的前提下）進(jìn)行有效的降維，大大減少了對算力的要求

計(jì)算機(jī)視覺的 8 大任務(wù)

計(jì)算機(jī)視覺 – Computer Vision | CV,2023 AI,計(jì)算機(jī)視覺,人工智能

?

圖像分類

圖像分類是計(jì)算機(jī)視覺中重要的基礎(chǔ)問題。后面提到的其他任務(wù)也是以它為基礎(chǔ)的。

舉幾個(gè)典型的例子：人臉識別、圖片鑒黃、相冊根據(jù)人物自動(dòng)分類等。

計(jì)算機(jī)視覺 – Computer Vision | CV,2023 AI,計(jì)算機(jī)視覺,人工智能

目標(biāo)檢測

目標(biāo)檢測任務(wù)的目標(biāo)是給定一張圖像或是一個(gè)視頻幀，讓計(jì)算機(jī)找出其中所有目標(biāo)的位置，并給出每個(gè)目標(biāo)的具體類別。

計(jì)算機(jī)視覺 – Computer Vision | CV,2023 AI,計(jì)算機(jī)視覺,人工智能

語義分割

它將整個(gè)圖像分成像素組，然后對像素組進(jìn)行標(biāo)記和分類。語義分割試圖在語義上理解圖像中每個(gè)像素是什么（人、車、狗、樹…）。

如下圖，除了識別人、道路、汽車、樹木等之外，我們還必須確定每個(gè)物體的邊界。

計(jì)算機(jī)視覺 – Computer Vision | CV,2023 AI,計(jì)算機(jī)視覺,人工智能

實(shí)例分割

除了語義分割之外，實(shí)例分割將不同類型的實(shí)例進(jìn)行分類，比如用 5 種不同顏色來標(biāo)記 5 輛汽車。我們會(huì)看到多個(gè)重疊物體和不同背景的復(fù)雜景象，我們不僅需要將這些不同的對象進(jìn)行分類，而且還要確定對象的邊界、差異和彼此之間的關(guān)系！

計(jì)算機(jī)視覺 – Computer Vision | CV,2023 AI,計(jì)算機(jī)視覺,人工智能

視頻分類

與圖像分類不同的是，分類的對象不再是靜止的圖像，而是一個(gè)由多幀圖像構(gòu)成的、包含語音數(shù)據(jù)、包含運(yùn)動(dòng)信息等的視頻對象，因此理解視頻需要獲得更多的上下文信息，不僅要理解每幀圖像是什么、包含什么，還需要結(jié)合不同幀，知道上下文的關(guān)聯(lián)信息。

計(jì)算機(jī)視覺 – Computer Vision | CV,2023 AI,計(jì)算機(jī)視覺,人工智能

人體關(guān)鍵點(diǎn)檢測

體關(guān)鍵點(diǎn)檢測，通過人體關(guān)鍵節(jié)點(diǎn)的組合和追蹤來識別人的運(yùn)動(dòng)和行為，對于描述人體姿態(tài)，預(yù)測人體行為至關(guān)重要。

在 Xbox 中就有利用到這個(gè)技術(shù)。

計(jì)算機(jī)視覺 – Computer Vision | CV,2023 AI,計(jì)算機(jī)視覺,人工智能

場景文字識別

很多照片中都有一些文字信息，這對理解圖像有重要的作用。

場景文字識別是在圖像背景復(fù)雜、分辨率低下、字體多樣、分布隨意等情況下，將圖像信息轉(zhuǎn)化為文字序列的過程。

停車場、收費(fèi)站的車牌識別就是典型的應(yīng)用場景。

計(jì)算機(jī)視覺 – Computer Vision | CV,2023 AI,計(jì)算機(jī)視覺,人工智能

目標(biāo)跟蹤

目標(biāo)跟蹤，是指在特定場景跟蹤某一個(gè)或多個(gè)特定感興趣對象的過程。傳統(tǒng)的應(yīng)用就是視頻和真實(shí)世界的交互，在檢測到初始對象之后進(jìn)行觀察。

無人駕駛里就會(huì)用到這個(gè)技術(shù)。

計(jì)算機(jī)視覺 – Computer Vision | CV,2023 AI,計(jì)算機(jī)視覺,人工智能

CV 在日常生活中的應(yīng)用場景

計(jì)算機(jī)視覺的應(yīng)用場景非常廣泛，下面列舉幾個(gè)生活中常見的應(yīng)用場景。

門禁、支付寶上的人臉識別
停車場、收費(fèi)站的車牌識別
上傳圖片或視頻到網(wǎng)站時(shí)的風(fēng)險(xiǎn)識別
抖音上的各種道具（需要先識別出人臉的位置）

這里需要說明一下，條形碼和二維碼的掃描不算是計(jì)算機(jī)視覺。

這種對圖像的識別，還是基于固定規(guī)則的，并不需要處理復(fù)雜的圖像，完全用不到 AI 技術(shù)。

計(jì)算機(jī)視覺

是一門研究如何使機(jī)器“看”的科學(xué)，更進(jìn)一步的說，就是是指用攝影機(jī)和電腦代替人眼對目標(biāo)進(jìn)行識別、跟蹤和測量等機(jī)器視覺，并進(jìn)一步做圖形處理，使電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。作為一個(gè)科學(xué)學(xué)科，計(jì)算機(jī)視覺研究相關(guān)的理論和技術(shù)，試圖建立能夠從圖像或者多維數(shù)據(jù)中獲取‘信息’的人工智能系統(tǒng)。這里所指的信息指Shannon定義的，可以用來幫助做一個(gè)“決定”的信息。因?yàn)楦兄梢钥醋魇菑母泄傩盘栔刑?取信息，所以計(jì)算機(jī)視覺也可以看作是研究如何使人工系統(tǒng)從圖像或多維數(shù)據(jù)中“感知”的科學(xué)。

計(jì)算機(jī)視覺是一個(gè)跨學(xué)科的科學(xué)領(lǐng)域，涉及如何制作計(jì)算機(jī)以從數(shù)字圖像或視頻中獲得高層次的理解。從工程的角度來看，它尋求自動(dòng)化人類視覺系統(tǒng)可以完成的任務(wù)。

計(jì)算機(jī)視覺任務(wù)包括用于獲取，處理，分析和理解數(shù)字圖像的方法，以及從現(xiàn)實(shí)世界中提取高維數(shù)據(jù)以便例如以決策的形式產(chǎn)生數(shù)字或符號信息。

在這種情況下理解意味著將視覺圖像（視網(wǎng)膜的輸入）轉(zhuǎn)換為可以與其他思維過程交互并引出適當(dāng)行動(dòng)的世界描述。這種圖像理解可以看作是利用幾何學(xué)，物理學(xué)，統(tǒng)計(jì)學(xué)和學(xué)習(xí)理論構(gòu)建的模型從圖像數(shù)據(jù)中解開符號信息。

作為一門科學(xué)學(xué)科，計(jì)算機(jī)視覺關(guān)注從圖像中提取信息的人工系統(tǒng)背后的理論。圖像數(shù)據(jù)可以采用多種形式，例如視頻序列，來自多個(gè)相機(jī)的視圖或來自醫(yī)學(xué)掃描儀的多維數(shù)據(jù)。作為一門技術(shù)學(xué)科，計(jì)算機(jī)視覺試圖將其理論和模型應(yīng)用于計(jì)算機(jī)視覺系統(tǒng)的構(gòu)建。計(jì)算機(jī)視覺的子域包括場景重建，事件檢測，視頻跟蹤，對象識別，3D姿態(tài)估計(jì)，學(xué)習(xí)，索引，運(yùn)動(dòng)估計(jì)和圖像恢復(fù)。文章來源地址http://www.zghlxwxcb.cn/news/detail-677224.html

到了這里，關(guān)于計(jì)算機(jī)視覺 – Computer Vision | CV的文章就介紹完了。如果您還想了解更多內(nèi)容，請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

【AI視野·今日CV 計(jì)算機(jī)視覺論文速覽第258期】Mon, 2 Oct 2023
AI視野 ·今日CS.CV 計(jì)算機(jī)視覺論文速覽 Mon, 2 Oct 2023 (showing first 100 of 112 entries) Totally 100 papers ?? 上期速覽 ?更多精彩請移步主頁 Interesting: ?? *****The Dawn of LMMs, GPT4-V視覺大語言模型綜述。(from Microsoft Corporation) ?? 生物外科組織數(shù)據(jù)集, Surgical Tattoos in Infrared (from ) website：htt
2024年02月06日
瀏覽(27)
【計(jì)算機(jī)視覺】ICCV2023放榜！一起看看CV最新熱門研究方向！
最近吃過晚飯看到新聞的時(shí)候，屬實(shí)有點(diǎn)驚訝： ICCV 2023 近日也開獎(jiǎng)了！看了一下，總共收錄了2160篇論文，創(chuàng)了歷史新高。作為計(jì)算機(jī)視覺三大頂級會(huì)議之一，ICCV 收錄的論文自然也都具有非常高的研究價(jià)值，建議有需求的同學(xué)多關(guān)注多關(guān)注，說不定下一篇中稿的論文ideal就在
2024年02月07日
瀏覽(32)
AI淺談：計(jì)算機(jī)視覺（CV）技術(shù)的優(yōu)勢和挑戰(zhàn)
目錄一、計(jì)算機(jī)視覺技術(shù)的優(yōu)勢 1.效率和精度提高 2.提高安全性 3.促進(jìn)自動(dòng)化 4.促進(jìn)科學(xué)研究 5.促進(jìn)商業(yè)發(fā)展二、計(jì)算機(jī)視覺技術(shù)的挑戰(zhàn) 1.環(huán)境變化 2.精度問題 3.隱私和安全問題 4.數(shù)據(jù)質(zhì)量 5.系統(tǒng)復(fù)雜度 1.自動(dòng)駕駛汽車 2.人臉識別 3.農(nóng)業(yè)領(lǐng)域 4.醫(yī)學(xué)圖像分析 5.安防和監(jiān)控
2024年01月25日
瀏覽(27)
從計(jì)算機(jī)視覺（Computer Vision）的角度出發(fā)，從傳統(tǒng)機(jī)器學(xué)習(xí)的特征工程、分類器設(shè)計(jì)和優(yōu)化，到深度學(xué)習(xí)的CNN架構(gòu)設(shè)計(jì)、訓(xùn)練優(yōu)化、模型壓縮與推理部署，詳細(xì)闡述了圖像識別領(lǐng)域最新的技術(shù)發(fā)展方向
作者：禪與計(jì)算機(jī)程序設(shè)計(jì)藝術(shù) 在現(xiàn)代信息技術(shù)的快速發(fā)展過程中，圖像識別技術(shù)越來越重要。早期的人工智能算法主要側(cè)重于特征提取、分類或回歸任務(wù)。近幾年，隨著神經(jīng)網(wǎng)絡(luò)（Neural Networks）在圖像識別領(lǐng)域的不斷突破，很多研究人員將目光投向了深度學(xué)習(xí)（Deep Learni
2024年02月10日
瀏覽(39)
【計(jì)算機(jī)視覺】Vision Transformer （ViT）詳細(xì)解析
論文地址：An Image Is Worth 16x16 Words: Transformers For Image Recognition At Scale code地址：github.com/google-research/vision_transformer Transformer 最早提出是針對NLP領(lǐng)域的，并且在NLP領(lǐng)域引起了強(qiáng)烈的轟動(dòng)。提出ViT模型的這篇文章題名為《An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale》
2024年02月04日
瀏覽(25)
使用Google Vision API進(jìn)行計(jì)算機(jī)視覺圖像創(chuàng)意分析
介紹計(jì)算機(jī)視覺可以用來從圖像、視頻和音頻中提取有用的信息。它允許計(jì)算機(jī)看到并理解從視覺輸入中可以收集到什么信息。在接收到視覺輸入后，它可以在圖像中收集有價(jià)值的信息，并確定必須采取的下一步。 Google Vision API是一種Google云服務(wù)，它允許使用計(jì)算機(jī)視覺從圖
2024年02月06日
瀏覽(24)
將Apple Vision Pro和visionOS與計(jì)算機(jī)視覺結(jié)合使用
在2023年6月5日的WWDC大會(huì)上，蘋果宣布推出多年來最大規(guī)模的硬件和軟件組合產(chǎn)品。今年的“One more thing”（“還有一件事”）發(fā)布是蘋果視覺專業(yè)版（Apple Vision Pro），這是一款集成了蘋果生態(tài)系統(tǒng)的新型空間計(jì)算頭戴式設(shè)備。蘋果視覺專業(yè)版是一個(gè)垂直整合的硬件和軟件平
2024年02月08日
瀏覽(18)
計(jì)算機(jī)視覺（CV）技術(shù)的優(yōu)勢
計(jì)算機(jī)視覺（CV）技術(shù)的優(yōu)勢： 1. 自動(dòng)化任務(wù)：計(jì)算機(jī)視覺技術(shù)可以自動(dòng)執(zhí)行一系列視覺任務(wù)，如圖像分類、目標(biāo)檢測和識別等，從而實(shí)現(xiàn)任務(wù)的自動(dòng)化。 2. 高速處理：計(jì)算機(jī)視覺技術(shù)可以在短時(shí)間內(nèi)處理大量的圖像和視頻數(shù)據(jù)，實(shí)現(xiàn)快速的分析和決策。 3. 準(zhǔn)確性：相對于
2024年01月22日
瀏覽(23)
動(dòng)手學(xué)CV-Pytorch計(jì)算機(jī)視覺天池計(jì)算機(jī)視覺入門賽SVHN數(shù)據(jù)集實(shí)戰(zhàn)
這里我們以datawhale和天池合作的天池計(jì)算機(jī)視覺入門賽為例，通過案例實(shí)戰(zhàn)來進(jìn)一步鞏固本章所介紹的圖像分類知識。該比賽以SVHN街道字符為賽題數(shù)據(jù)，數(shù)據(jù)集報(bào)名后可見并可下載，該數(shù)據(jù)來
2024年02月04日
瀏覽(15)
計(jì)算機(jī)視覺（CV）技術(shù)的優(yōu)勢和挑戰(zhàn)
目錄計(jì)算機(jī)視覺（CV）技術(shù)的優(yōu)勢和挑戰(zhàn) 優(yōu)勢：挑戰(zhàn)：計(jì)算機(jī)視覺（CV）技術(shù)是一種利用計(jì)算機(jī)和算法來實(shí)現(xiàn)對圖像和視頻的分析、處理和理解的技術(shù)。為了應(yīng)對圖像多樣性，計(jì)算機(jī)視覺技術(shù)可以采用數(shù)據(jù)增強(qiáng)、遷移學(xué)習(xí)、復(fù)雜模型、多尺度處理、領(lǐng)域自適應(yīng)和合成數(shù)據(jù)等
2024年02月09日
瀏覽(21)

<track id="4r82e"></track>