地理空間人工智能 (GeoAI) 是一門新興的科學(xué)學(xué)科,它結(jié)合了空間數(shù)據(jù)科學(xué)、機器和深度學(xué)習(xí)中的方法,從空間大數(shù)據(jù)中提取知識(Janowicz 等人,2019 年)。它是一個活躍的研究領(lǐng)域,在許多領(lǐng)域都有應(yīng)用,例如:災(zāi)害管理、城市規(guī)劃、物流、零售、太陽能等(Ballesteros 等人,2021 年)。與此同時,衛(wèi)星的可用性和質(zhì)量迅速提高,最近無人機圖像、其易用性以及消費者和專業(yè)無人機的實惠價格正在使這些技術(shù)融合。
人們可能會認(rèn)為 GeoAI 將大量算法應(yīng)用于高空圖像分析,但事實是這些算法僅總結(jié)為四種,它們是稱為人工神經(jīng)網(wǎng)絡(luò) (NN) 的通用函數(shù)的變體。神經(jīng)網(wǎng)絡(luò)是由人工神經(jīng)元組合而成的分層結(jié)構(gòu)。NN 的研究稱為深度學(xué)習(xí),它們作為輸入 X 和輸出值之間的映射函數(shù) Y = F(X)。
本文簡要介紹了這些算法及其應(yīng)用。
1.圖像分類
圖像的對象或多對象分類,警告輸入圖像中特定對象組的存在與否,而無需計算對象在圖像中的位置。卷積神經(jīng)網(wǎng)絡(luò) (CNN) 是用于解決圖像分類問題的默認(rèn)網(wǎng)絡(luò)架構(gòu),這些神經(jīng)網(wǎng)絡(luò)在移動內(nèi)核和圖像像素值之間執(zhí)行標(biāo)量積。標(biāo)量積也稱為卷積,允許根據(jù)位置、角度或大小對圖像中的對象進行分類。使用了許多內(nèi)核或過濾器,并且網(wǎng)絡(luò)的權(quán)重或參數(shù)由網(wǎng)絡(luò)自動計算并重新計算,使用通過層的反向傳播中的預(yù)期值和獲得值之間的比較。第一層計算物體的一般幾何特征,如對角線和垂直線等,下一層定義更復(fù)雜和聚合的形式,最后,根據(jù)對象類的數(shù)量,網(wǎng)絡(luò)的輸出對應(yīng)于可伸縮的神經(jīng)元數(shù)量。圖 1 顯示了此架構(gòu)的示例 [1]。
? ? ? ? ?
圖 1. 查看圖像中上部的 6x6、3x3 和 4x4 內(nèi)核。[1]
有一個圖像分類的擴展版本,這是當(dāng)網(wǎng)絡(luò)而不是概率輸出用于命名圖像中現(xiàn)有對象的文本時。這稱為圖像說明。
2. 物體檢測或識別
以與圖像分類類似的方式,檢測模型在圖像中找到對象,但它們的位置由矩形區(qū)域框起來。此外,還提到了每個特定對象存在的概率。
圖 2. 人體檢測數(shù)據(jù)集。圖片由作者提供
圖 3. 交通標(biāo)志檢測數(shù)據(jù)集。圖片由作者提供
3.圖像語義分割
語義分割是對圖像的每個像素進行分類。像素以顏色編碼的類別分開。執(zhí)行此任務(wù)的深度學(xué)習(xí)模型使用顏色掩碼作為感興趣對象的標(biāo)簽,或者在只有一個類分割的情況下使用二進制掩碼(黑色和白色)。由于這是像素級別的分類,因此它是一種比以前的算法對計算能力要求更高的算法??茖W(xué)家們比較了不同的人工神經(jīng)網(wǎng)絡(luò)架構(gòu),目的是找到最佳性能。U-Net [2] 最初是為醫(yī)學(xué)圖像開發(fā)的,在過去幾年中一直在語義分割的指標(biāo)得分中名列前茅。
圖 4.U-Net。修改自 [2]
圖 5. 多類語義分割數(shù)據(jù)集,Drone Deploy Benchmark
?
圖 6. 二元掩碼,Massachussets Road 數(shù)據(jù)集
4.圖像生成
圖像生成是從隨機空間中獲取圖像的過程,即獲取與一組圖像的現(xiàn)有分布特征似是而非的合成圖像。圖像生成的主要應(yīng)用是為模型訓(xùn)練、計算機圖形學(xué)和設(shè)計等創(chuàng)建合成數(shù)據(jù)(Isola 等人,2017 年)。圖像生成通常由生成模型執(zhí)行,這些模型有兩種,無論是明確編程還是使用監(jiān)督學(xué)習(xí)創(chuàng)建。最新的使用了兩個 CNN,一個在像素級別對輸入圖像進行分類(一種語義分割),另一個對第一個進行的像素分類過程進行限定。這兩個網(wǎng)絡(luò)以對抗方式工作,這就是它們被稱為“生成對抗網(wǎng)絡(luò) (GAN)”的原因。
?圖 7. 圖像到地圖的轉(zhuǎn)換
圖像的應(yīng)用、領(lǐng)域和類型
圖 8 總結(jié)了四種算法的統(tǒng)計比例、它們的應(yīng)用領(lǐng)域以及所使用的傳感器或圖像類型 [3]。
圖 8. 修改自 [3] 的圖像
結(jié)論
GeoAI 主要使用四種算法來分析高空圖像,它們是:圖像分類、目標(biāo)檢測、語義分割和圖像生成。
所有四種重新審視的算法及其架構(gòu)都基于 CNN,CNN 是一種人工神經(jīng)網(wǎng)絡(luò),使用卷積來應(yīng)用于像素,卷積是移動窗口標(biāo)量積。
GeoAI 的大部分論文都是針對對象檢測(~54%),然后是分割(~41%),圖像分類(~5%),最后是圖像生成(不到 1%)。
主要應(yīng)用領(lǐng)域是環(huán)境(46%)、城市(27%)和農(nóng)業(yè)(26%)、其他(1%)。文章來源:http://www.zghlxwxcb.cn/news/detail-517118.html
大多數(shù)用于分析的圖像是 RGB (52%)、多光譜 (24%)、高光譜 (18%) 和激光雷達 (6%)。文章來源地址http://www.zghlxwxcb.cn/news/detail-517118.html
到了這里,關(guān)于GeoAI 的4個主要應(yīng)用領(lǐng)域的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!