国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

PBA.常用人工智能預(yù)測(cè)分析算法

這篇具有很好參考價(jià)值的文章主要介紹了PBA.常用人工智能預(yù)測(cè)分析算法。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

相同的數(shù)據(jù)型態(tài),利用不同的方法分析,就可以解決不同的課題。例如目前已相當(dāng)純熟的人臉識(shí)別技術(shù),在國(guó)防應(yīng)用可以進(jìn)行安保工作;企業(yè)可做員工門禁系統(tǒng);可結(jié)合性別、年齡辨識(shí)讓賣場(chǎng)進(jìn)行市調(diào)分析,或結(jié)合追蹤技術(shù)進(jìn)行人流分析等。

本篇接下來要針對(duì)深度學(xué)習(xí)方法的數(shù)據(jù)類型或算法,介紹AI常見的應(yīng)用。

1. 神經(jīng)網(wǎng)絡(luò)算法

以算法區(qū)分深度學(xué)習(xí)應(yīng)用,算法類別可分成三大類:

  • 常用于影像數(shù)據(jù)進(jìn)行分析處理的卷積神經(jīng)網(wǎng)絡(luò)(簡(jiǎn)稱CNN)
  • 文本分析或自然語(yǔ)言處理的遞歸神經(jīng)網(wǎng)絡(luò)(簡(jiǎn)稱RNN)
  • 常用于數(shù)據(jù)生成或非監(jiān)督式學(xué)習(xí)應(yīng)用的生成對(duì)抗網(wǎng)絡(luò)(簡(jiǎn)稱GAN)
CNN卷積神經(jīng)網(wǎng)絡(luò)(簡(jiǎn)稱CNN)

CNN主要應(yīng)用可分為圖像分類(image classification)、目標(biāo)檢測(cè)(object detection)及語(yǔ)義分割(semantic segmentation)。下圖可一目了然三種不同方法的應(yīng)用方式。

1、圖像分類 (Classification)

顧名思義就是將圖像進(jìn)行類別篩選,通過深度學(xué)習(xí)方法識(shí)別圖片屬于哪種分類類別,其主要重點(diǎn)在于一張圖像只包含一種分類類別,即使該影像內(nèi)容可能有多個(gè)目標(biāo),所以單純圖像分類的應(yīng)用并不普遍。不過由于單一目標(biāo)識(shí)別對(duì)深度學(xué)習(xí)算法來說是正確率最高的,所以實(shí)際上很多應(yīng)用會(huì)先通過目標(biāo)檢測(cè)方法找到該目標(biāo),再縮小擷取影像范圍進(jìn)行圖像分類。所以只要是目標(biāo)檢測(cè)可應(yīng)用的范圍,通常也會(huì)使用圖像分類方法。圖像分類也是眾多用來測(cè)試算法基準(zhǔn)的方法之一,常使用由ImageNet舉辦的大規(guī)模視覺識(shí)別挑戰(zhàn)賽(ILSVRC)中提供的公開圖像數(shù)據(jù)進(jìn)行算法測(cè)試。圖像分類屬于CNN的基礎(chǔ),其相關(guān)算法也是最易于理解,故初學(xué)者應(yīng)該都先以圖像分類做為跨入深度學(xué)習(xí)分析的起步。使用圖像分類進(jìn)行識(shí)別,通常輸入為一張圖像,而輸出為一個(gè)文字類別。


2、目標(biāo)檢測(cè) (Object Detection)

一張圖像內(nèi)可有一或多個(gè)目標(biāo)物,目標(biāo)物也可以是屬于不同類別。算法主要能達(dá)到兩種目的:找到目標(biāo)坐標(biāo)及識(shí)別目標(biāo)類別。簡(jiǎn)單來說,就是除了需要知道目標(biāo)是什么,還需要知道它在哪個(gè)位置。

目標(biāo)檢測(cè)應(yīng)用非常普遍,包含文章開頭提到的人臉識(shí)別相關(guān)技術(shù)結(jié)合應(yīng)用,或是制造業(yè)方面的瑕疵檢測(cè),甚至醫(yī)院用于X光、超音波進(jìn)行特定身體部位的病況檢測(cè)等。目標(biāo)識(shí)別的基礎(chǔ)可想象為在圖像分類上增加標(biāo)示位置的功能,故學(xué)習(xí)上也不離圖像分類的基礎(chǔ)。不過目標(biāo)檢測(cè)所標(biāo)示的坐標(biāo)通常為矩形或方形,僅知道目標(biāo)所在位置,并無法針對(duì)目標(biāo)的邊緣進(jìn)行描繪,所以常用見的應(yīng)用通常會(huì)以「知道目標(biāo)位置即可」作為目標(biāo)。

最常見的算法為YOLO及R-CNN。其中YOLO因算法特性具有較快的識(shí)別速度,目前已來到v3版本。R-CNN針對(duì)目標(biāo)位置搜尋及辨識(shí)算法和YOLO稍有不同,雖然速度稍較YOLO慢,但正確率稍高于YOLO。使用目標(biāo)檢測(cè)進(jìn)行識(shí)別,通常輸入為一張圖像,而輸出為一個(gè)或數(shù)個(gè)文字類別和一組或多組坐標(biāo)。

3、語(yǔ)義分割 (Semantic Segmentation)

算法會(huì)針對(duì)一張圖像中的每個(gè)像素進(jìn)行識(shí)別,也就是說不同于目標(biāo)檢測(cè),語(yǔ)義分割可以正確區(qū)別各目標(biāo)的邊界像素,簡(jiǎn)單來說,語(yǔ)義分割就是像素級(jí)別的圖像分類,針對(duì)每個(gè)像素進(jìn)行分類。當(dāng)然這類應(yīng)用的模型就會(huì)需要較強(qiáng)大的GPU和花較多時(shí)間進(jìn)行訓(xùn)練。

常見應(yīng)用類似目標(biāo)檢測(cè),但會(huì)使用在對(duì)于圖像識(shí)別有較高精細(xì)度,如需要描繪出目標(biāo)邊界的應(yīng)用。例如制造業(yè)上的瑕疵檢測(cè),針對(duì)不規(guī)則形狀的大小瑕疵,都可以正確描繪。醫(yī)學(xué)上常用于分辨病理切片上的病變細(xì)胞,或是透過MRI、X光或超音波描繪出病變的區(qū)塊及類別。算法如U-Net或是Mask R-CNN都是常見的實(shí)作方法。使用語(yǔ)義分割進(jìn)行識(shí)別,通常輸入為一張圖像,而輸出也為一張等大小的圖像,但圖像中會(huì)以不同色調(diào)描繪不同類別的像素。

RNN

RNN的特色在于可處理圖像或數(shù)值數(shù)據(jù),并且由于網(wǎng)絡(luò)本身具有記憶能力,可學(xué)習(xí)具有前后相關(guān)的數(shù)據(jù)類型。例如進(jìn)行語(yǔ)言翻譯或文本翻譯,一個(gè)句子中的前后詞匯通常會(huì)有一定的關(guān)系,但CNN網(wǎng)絡(luò)無法學(xué)習(xí)到這層關(guān)系,而RNN因具有內(nèi)存,所以性能會(huì)比較好。因?yàn)榭梢酝ㄟ^RNN進(jìn)行文字理解,其他應(yīng)用如輸入一張圖像,但是輸出為一段關(guān)于圖像敘述的句子。(如下圖)

RNN雖然解決了CNN無法處理的問題,但其本身仍然有些缺點(diǎn),所以現(xiàn)在很多RNN的變形網(wǎng)絡(luò),其中最常被使用的網(wǎng)絡(luò)之一為長(zhǎng)短記憶網(wǎng)絡(luò)(Long Short-Term Network,簡(jiǎn)稱LSTM)。這類網(wǎng)絡(luò)的輸入數(shù)據(jù)不限于是圖像或文字,解決的問題也不限于翻譯或文字理解。數(shù)值相關(guān)數(shù)據(jù)也同樣可以使用LSTM進(jìn)行分析,例如工廠機(jī)器預(yù)測(cè)性維修應(yīng)用,可透過LSTM分析機(jī)臺(tái)震動(dòng)訊號(hào),預(yù)測(cè)機(jī)器是否故障。在醫(yī)學(xué)方面,LSTM可協(xié)助解讀數(shù)以千計(jì)的文獻(xiàn),并找出特定癌癥的相關(guān)信息,例如腫瘤部位、腫瘤大小、期數(shù),甚至治療方針或存活率等等,透過文字理解進(jìn)行解析。也可結(jié)合圖像識(shí)別提供病灶關(guān)鍵詞,以協(xié)助醫(yī)生撰寫病理報(bào)告。

GAN

除了深度學(xué)習(xí)外,有一種新興的網(wǎng)絡(luò)稱為強(qiáng)化學(xué)習(xí)(Reinforcement Learning),其中一種很具有特色的網(wǎng)絡(luò)為生成式對(duì)抗網(wǎng)絡(luò)(GAN)。

這里不詳述GAN的理論或?qū)嵶鞣绞剑翘接慓AN實(shí)際應(yīng)用的場(chǎng)域。深度學(xué)習(xí)領(lǐng)域最需要的是數(shù)據(jù),但往往不是所有應(yīng)用都可以收集到大量數(shù)據(jù),并且數(shù)據(jù)也需要人工進(jìn)行標(biāo)注,這是非常消耗時(shí)間及人力成本。圖像數(shù)據(jù)可以通過旋轉(zhuǎn)、裁切或改變明暗等方式增加數(shù)據(jù)量,但如果數(shù)據(jù)還是不夠呢?目前有相當(dāng)多領(lǐng)域透過GAN方法生成非常近似原始數(shù)據(jù)的數(shù)據(jù),例如3D-GAN就是可以生成高質(zhì)量3D對(duì)象。當(dāng)然,比較有趣的應(yīng)用例如人臉置換或表情置換。(如下圖)

預(yù)測(cè)類人工智能算法,BA商業(yè)分析,人工智能,算法

圖片來源于網(wǎng)絡(luò)


另外,SRGAN (Super Resolution GAN)可用于提高原始圖像的分辨率,將作為低分辨率影像輸入進(jìn)GAN模型,并生成較高畫質(zhì)的影像(如下圖)。這樣的技術(shù)可整合至專業(yè)繪圖軟件中,協(xié)助設(shè)計(jì)師更有效率完成設(shè)計(jì)工作。

預(yù)測(cè)類人工智能算法,BA商業(yè)分析,人工智能,算法

圖片來源于網(wǎng)絡(luò)



NVIDIA也有提供一些基于GAN的平臺(tái)的應(yīng)用,包含透過GauGAN網(wǎng)絡(luò),僅需繪制簡(jiǎn)單的線條,即可完成漂亮的畫作,并且還能隨意修改場(chǎng)景的風(fēng)格(如下圖)。

2. 基于時(shí)間序列的預(yù)測(cè)算法

時(shí)間序列預(yù)測(cè)就是利用過去一段時(shí)間的數(shù)據(jù)來預(yù)測(cè)未來一段時(shí)間內(nèi)的信息,包括連續(xù)型預(yù)測(cè)(數(shù)值預(yù)測(cè),范圍估計(jì))與離散型預(yù)測(cè)(事件預(yù)測(cè))等,具有非常高的商業(yè)價(jià)值。

需要明確一點(diǎn)的是,與回歸分析預(yù)測(cè)模型不同,時(shí)間序列模型依賴于數(shù)值在時(shí)間上的先后順序,同樣大小的值改變順序后輸入模型產(chǎn)生的結(jié)果是不同的。

如之前的文章所介紹,時(shí)間序列可以分為平穩(wěn)序列,即存在某種周期,季節(jié)性及趨勢(shì)的方差和均值不隨時(shí)間而變化的序列,和非平穩(wěn)序列。

本文為大家總結(jié)時(shí)間序列預(yù)測(cè)的有關(guān)方法,淺析這些技術(shù)并探索如何可以提高這些方法的預(yù)測(cè)效果。

時(shí)間序列預(yù)測(cè)方法最全總結(jié)!

1) 自回歸積分移動(dòng)平均或ARIMA(Autoregressive Integrated Moving Average Model)模型

自回歸積分移動(dòng)平均模型或ARIMA(p,d,q),相當(dāng)于在自回歸移動(dòng)平均過程(ARMA)的基礎(chǔ)上增加了積分要素,相比AR、MA、ARMA模型來說,不再對(duì)數(shù)據(jù)平穩(wěn)性存在要求,在模型中可以直接通過積分參數(shù)d控制數(shù)據(jù)差異化的次數(shù)。

?將預(yù)測(cè)對(duì)象按照時(shí)間順序排列起來,構(gòu)成一個(gè)所謂的時(shí)間序列,從所構(gòu)成的一組時(shí)間序列的變化規(guī)律,推斷今后變化的可能性及變化趨勢(shì)、變化規(guī)律,就是時(shí)間序列預(yù)測(cè)法。
??時(shí)間序列模型其實(shí)也是一種回歸模型,其基于的原理是,一方面承認(rèn)事物發(fā)展的延續(xù)性,運(yùn)用過去時(shí)間序列的數(shù)據(jù)統(tǒng)計(jì)分析就能推測(cè)事物的發(fā)展趨勢(shì);另一方面又充分考慮到偶然因素影響而產(chǎn)生的隨機(jī)性,為了消除隨機(jī)波動(dòng)的影響,利用歷史數(shù)據(jù),進(jìn)行統(tǒng)計(jì)分析,并對(duì)數(shù)據(jù)進(jìn)行適合的處理,進(jìn)行趨勢(shì)預(yù)測(cè)。
??自回歸模型是用自身做回歸變量的過程,即利用前期若干時(shí)刻的隨機(jī)變量的線性組合來描述以后某時(shí)刻隨機(jī)變量的線性回歸模型,它是時(shí)間序列中的一個(gè)常見形式。

? ? ? ?AR模型利用前期數(shù)值與后期數(shù)值的相關(guān)關(guān)系(自相關(guān)),建立包含前期數(shù)值和后期數(shù)值的回歸方程,達(dá)到預(yù)測(cè)的目的,因此成為自回歸過程。比較自回歸過程和MA移動(dòng)平均過程可知,移動(dòng)平均過程其實(shí)可以作為自回歸過程的補(bǔ)充,解決自回歸方差中白噪聲的求解問題,兩者的組合就成為自回歸移動(dòng)平均過程,稱為ARMA模型。

從回歸方程可知,自回歸移動(dòng)平均模型綜合了AR和MA兩個(gè)模型的優(yōu)勢(shì),在ARMA模型中,自回歸過程負(fù)責(zé)量化當(dāng)前數(shù)據(jù)與前期數(shù)據(jù)之間的關(guān)系,移動(dòng)平均過程負(fù)責(zé)解決隨機(jī)變動(dòng)項(xiàng)的求解問題,因此,該模型更為有效和常用。

? ? ? ?介紹時(shí)間序列平穩(wěn)性時(shí)提到過,AR/MA/ARMA模型適用于平穩(wěn)時(shí)間序列的分析,當(dāng)時(shí)間序列存在上升或下降趨勢(shì)時(shí),這些模型的分析效果就大打折扣了,這時(shí)差分自回歸移動(dòng)平均模型也就應(yīng)運(yùn)而生。ARIMA模型能夠用于齊次非平穩(wěn)時(shí)間序列的分析,這里的齊次指的是原本不平穩(wěn)的時(shí)間序列經(jīng)過d次差分后成為平穩(wěn)時(shí)間序列。

在現(xiàn)實(shí)生活中,存在很多非平穩(wěn)的時(shí)間序列,它們的均值和方差是隨著時(shí)間的變化而變化的,幸運(yùn)的是,統(tǒng)計(jì)學(xué)家們發(fā)現(xiàn),很多時(shí)間序列本身雖然不平穩(wěn),但是經(jīng)過差分(相鄰時(shí)間點(diǎn)的指標(biāo)數(shù)值相減)之后,形成的新時(shí)間序列就變成平穩(wěn)時(shí)間序列了。因此,差分自回歸移動(dòng)平均模型寫成ARIMA(p,d,q)。p代表自回歸階數(shù);d代表差分次數(shù);q代表移動(dòng)平均階數(shù)。在spss軟件中,有時(shí)輸出的ARIMA模型包括6個(gè)參數(shù):ARIMA(p,d,q)(P,D,Q),這是因?yàn)槿绻麜r(shí)間序列中包含季節(jié)變動(dòng)成分的話,需要首先將季節(jié)變動(dòng)分解出來,然后再分別分析移除季節(jié)變動(dòng)后的時(shí)間序列和季節(jié)變動(dòng)本身。這里小寫的p,d,q描述的是移除季節(jié)變動(dòng)成分后的時(shí)間序列;大寫的P,D,Q描述的是季節(jié)變動(dòng)成分。兩個(gè)部分是相乘的關(guān)系。因此,ARIMA(p,d,q)(P,D,Q)也被稱為復(fù)合季節(jié)模型。

3. 累積距平法(Cumulative.0ffset. .Verification, COV) /累積偏差法

累積距平是一種用于檢驗(yàn)計(jì)量器的精度、穩(wěn)定性和可靠性的方法。該方法通過分別記錄被測(cè)計(jì)量器測(cè)量的結(jié)果和標(biāo)準(zhǔn)測(cè)量結(jié)果之間的差值,并將其累積起來,從而計(jì)算出平均差值和標(biāo)準(zhǔn)偏差。這種方法的優(yōu)點(diǎn)在于可以消除系統(tǒng)漂移和運(yùn)動(dòng)誤差的影響,從而提供更準(zhǔn)確的結(jié)果。

在進(jìn)行累積距平法檢測(cè)之前,需要先確定所選的參考標(biāo)準(zhǔn)測(cè)量器是否符合要求。標(biāo)準(zhǔn)測(cè)量器應(yīng)具有高精度、穩(wěn)定性和可靠性,并經(jīng)過校準(zhǔn)。在檢測(cè)過程中,被測(cè)計(jì)量器應(yīng)準(zhǔn)確地連接到標(biāo)準(zhǔn)測(cè)量器,并按指定的測(cè)量標(biāo)準(zhǔn)進(jìn)行測(cè)量。同時(shí)還需保持測(cè)量環(huán)境穩(wěn)定,并排除外力干擾。每次測(cè)量的差值將被累加起來,以得到平均差值和標(biāo)準(zhǔn)偏差。平均差值指的是所有測(cè)量結(jié)果與標(biāo)準(zhǔn)測(cè)量結(jié)果之間的差值的平均值,而標(biāo)準(zhǔn)偏差則表示這些...
利用距平法對(duì)洮河流域降水特性的分析

累積距平法是一種常用的數(shù)據(jù)分析方法,它通過計(jì)算數(shù)據(jù)點(diǎn)與平均值之間的差距,并累積這些差距值,來幫助我們判斷數(shù)據(jù)的分布情況。通過繪制累積距平圖,我們可以直觀地了解數(shù)據(jù)的偏離程度。這可以幫助我們?cè)趯?shí)際應(yīng)用中更好地理解和解釋數(shù)據(jù),從而做出更準(zhǔn)確、可靠的決策。

累計(jì)偏差是指在一段時(shí)間內(nèi).數(shù)值或觀測(cè)結(jié)果與預(yù)期值之間的累積差異或偏離程度。它可以用于分析和評(píng)估實(shí)際結(jié)果與理論模型、預(yù)測(cè)值或標(biāo)準(zhǔn)之間的差異。在統(tǒng)計(jì)學(xué)和數(shù)據(jù)分析領(lǐng)域,累計(jì)偏差通常用于衡量實(shí)際觀測(cè)值與預(yù)期值之間的總體差異。它可以通過將每個(gè)觀測(cè)值與預(yù)期值之間的差異相加來計(jì)算得出。

累計(jì)偏差可以在不同應(yīng)用場(chǎng)景中起到重要作用。例如,在財(cái)務(wù)分析中,它可以用于評(píng)估公司的實(shí)際銷售額與預(yù)期銷售額之間的差距。在生產(chǎn)過程控制中,累計(jì)偏差可以用來監(jiān)測(cè)產(chǎn)品質(zhì)量是否符合規(guī)范要求。
通過計(jì)算累計(jì)偏差,我們可以獲得對(duì)實(shí)際結(jié)果與預(yù)期值之間偏離程度的整體了解。這有助于識(shí)別系統(tǒng)中的潛在問題、改進(jìn)預(yù)測(cè)模型或調(diào)整決策以提高結(jié)果的準(zhǔn)確性和一致性。

4.?線性回歸

線性回歸(Linear Regression)可能是最流行的機(jī)器學(xué)習(xí)算法。線性回歸就是要找一條直線,并且讓這條直線盡可能地?cái)M合散點(diǎn)圖中的數(shù)據(jù)點(diǎn)。它試圖通過將直線方程與該數(shù)據(jù)擬合來表示自變量(x 值)和數(shù)值結(jié)果(y 值)。然后就可以用這條線來預(yù)測(cè)未來的值!這種算法最常用的技術(shù)是最小二乘法(Least of squares)。這個(gè)方法計(jì)算出最佳擬合線,以使得與直線上每個(gè)數(shù)據(jù)點(diǎn)的垂直距離最小??偩嚯x是所有數(shù)據(jù)點(diǎn)的垂直距離(綠線)的平方和。其思想是通過最小化這個(gè)平方誤差或距離來擬合模型。

比如預(yù)測(cè)明年的房?jī)r(jià)漲幅、下一季度新產(chǎn)品的銷量等等。聽起來并不難,不過線性回歸算法的難點(diǎn)并不在于得出預(yù)測(cè)值,而在于如何更精確。

預(yù)測(cè)類人工智能算法,BA商業(yè)分析,人工智能,算法

5. 分類算法

5.?邏輯回歸---邏輯回歸是線性分類器(線性模型)—— 主要用于二分類問題

邏輯回歸(Logistic regression)與線性回歸類似,但邏輯回歸的結(jié)果只能有兩個(gè)的值。如果說線性回歸是在預(yù)測(cè)一個(gè)開放的數(shù)值,那邏輯回歸更像是做一道是或不是的判斷題。邏輯函數(shù)中Y值的范圍從0到1,是一個(gè)概率值。邏輯函數(shù)通常呈S 型,曲線把圖表分成兩塊區(qū)域,因此適合用于分類任務(wù)。邏輯回歸經(jīng)常被電商或者外賣平臺(tái)用來預(yù)測(cè)用戶對(duì)品類的購(gòu)買偏好。

【機(jī)器學(xué)習(xí)】邏輯回歸(非常詳細(xì)) - 知乎

比如上面的邏輯回歸曲線圖,顯示了通過考試的概率與學(xué)習(xí)時(shí)間的關(guān)系,可以用來預(yù)測(cè)是否可以通過考試。

邏輯回歸的核心思想是使用sigmoid函數(shù)將線性回歸的輸出轉(zhuǎn)化為概率值,然后根據(jù)閾值將概率值轉(zhuǎn)化為類別標(biāo)簽。

預(yù)測(cè)類人工智能算法,BA商業(yè)分析,人工智能,算法

邏輯回歸的應(yīng)用場(chǎng)景:

廣告點(diǎn)擊率

是否為垃圾郵件

是否患病金融詐騙虛假賬號(hào)

看到上面的例子,我們可以發(fā)現(xiàn)其中的特點(diǎn),那就是都屬于兩個(gè)類別之間的判斷。邏輯回歸就是解決二分類問題的利器。

邏輯回歸模型的應(yīng)用場(chǎng)景

BML Codelab基于JupyterLab 全新架構(gòu)升級(jí),支持亮暗主題切換和豐富的AI工具,詳見使用說明文檔。

邏輯回歸模型廣泛用于各個(gè)領(lǐng)域,包括機(jī)器學(xué)習(xí),大多數(shù)醫(yī)學(xué)領(lǐng)域和社會(huì)科學(xué)。包括不限于以下幾點(diǎn):

1.用于疾病分類與預(yù)測(cè)。廣泛用于預(yù)測(cè)受傷患者的死亡率,使用邏輯回歸基于觀察到的患者特征(年齡,性別,體重指數(shù),各種血液檢查的結(jié)果等)分析預(yù)測(cè)發(fā)生特定疾病(例如糖尿病,冠心病)的風(fēng)險(xiǎn)。

2.邏輯回歸模型也用于預(yù)測(cè)在給定的過程中,系統(tǒng)或產(chǎn)品的故障的可能性。還用于市場(chǎng)營(yíng)銷應(yīng)用程序,例如預(yù)測(cè)客戶購(gòu)買產(chǎn)品或中止訂購(gòu)的傾向等。

3.在經(jīng)濟(jì)學(xué)中它可以用來預(yù)測(cè)一個(gè)人選擇進(jìn)入勞動(dòng)力市場(chǎng)的可能性,而商業(yè)應(yīng)用則可以用來預(yù)測(cè)房主拖欠抵押貸款的可能性。條件隨機(jī)字段是邏輯回歸到順序數(shù)據(jù)的擴(kuò)展,用于自然語(yǔ)言處理。

此外,邏輯回歸模型現(xiàn)在同樣是很多分類算法的基礎(chǔ)組件,比如 分類任務(wù)中基于GBDT算法+LR邏輯回歸實(shí)現(xiàn)的信用卡交易反欺詐,CTR(點(diǎn)擊通過率)預(yù)估等,其好處在于輸出值自然地落在0到1之間,并且有概率意義。模型清晰,有對(duì)應(yīng)的概率學(xué)理論基礎(chǔ)。它擬合出來的參數(shù)就代表了每一個(gè)特征(feature)對(duì)結(jié)果的影響。也是一個(gè)理解數(shù)據(jù)的好工具。但同時(shí)由于其本質(zhì)上是一個(gè)線性的分類器,所以不能應(yīng)對(duì)較為復(fù)雜的數(shù)據(jù)情況。很多時(shí)候我們也會(huì)拿邏輯回歸模型去做一些任務(wù)嘗試的基線(基礎(chǔ)水平)。

邏輯回歸模型的優(yōu)缺點(diǎn):

而對(duì)于邏輯回歸而且,最為突出的兩點(diǎn)就是其模型簡(jiǎn)單和模型的可解釋性強(qiáng)。

優(yōu)點(diǎn):實(shí)現(xiàn)簡(jiǎn)單,易于理解和實(shí)現(xiàn);計(jì)算代價(jià)不高,速度很快,存儲(chǔ)資源低; 缺點(diǎn):容易欠擬合,分類精度可能不高

6. 決策樹

如果說線性和邏輯回歸都是把任務(wù)在一個(gè)回合內(nèi)結(jié)束,那么決策樹(Decision Trees)就是一個(gè)多步走的動(dòng)作,它同樣用于回歸和分類任務(wù)中,不過場(chǎng)景通常更復(fù)雜且具體。舉個(gè)簡(jiǎn)單例子,老師面對(duì)一個(gè)班級(jí)的學(xué)生,哪些是好學(xué)生?如果簡(jiǎn)單判斷考試90分就算好學(xué)生好像太粗暴了,不能唯分?jǐn)?shù)論。那面對(duì)成績(jī)不到90分的學(xué)生,我們可以從作業(yè)、出勤、提問等幾個(gè)方面分開討論。

每個(gè)特征的重要性是通過自頂向下方法確定的。節(jié)點(diǎn)越高,其屬性就越重要。比如在上面例子中的老師就認(rèn)為出勤率比做作業(yè)重要,所以出勤率的節(jié)點(diǎn)就更高,當(dāng)然分?jǐn)?shù)的節(jié)點(diǎn)更高。 預(yù)測(cè)類人工智能算法,BA商業(yè)分析,人工智能,算法
7. 樸素貝葉斯--樸素貝葉斯分類器(Naive Bayes Classifier) 用非術(shù)語(yǔ)解釋貝葉斯定理,就是通過A條件下發(fā)生B的概率,去得出B條件下發(fā)生A的概率。比如說,小貓喜歡你,有a%可能性在你面前翻肚皮,請(qǐng)問小貓?jiān)谀忝媲胺瞧?,有多少概率喜歡你?比如小貓喜歡你,有b%可能和你貼貼,有c%概率發(fā)出呼嚕聲。所以我們?nèi)绾沃佬∝堄卸啻蟾怕氏矚g自己呢,通過貝葉斯定理就可以從翻肚皮,貼貼和呼嚕的概率中計(jì)算出來。
8支持向量機(jī)(Support Vector Machine,SVM) 所以支持向量機(jī)想要解決的問題也就是如何把一堆數(shù)據(jù)做出區(qū)隔,它的主要應(yīng)用場(chǎng)景有字符識(shí)別、面部識(shí)別、文本分類等各種識(shí)別。

6.K- 最近鄰算法(KNN)

7.K-均值

K-均值(K-means)是通過對(duì)數(shù)據(jù)集進(jìn)行分類來聚類的。例如,這個(gè)算法可用于根據(jù)購(gòu)買歷史將用戶分組。它在數(shù)據(jù)集中找到K個(gè)聚類。K-均值用于無監(jiān)督學(xué)習(xí),因此,我們只需使用訓(xùn)練數(shù)據(jù)X,以及我們想要識(shí)別的聚類數(shù)量K。

該算法根據(jù)每個(gè)數(shù)據(jù)點(diǎn)的特征,將每個(gè)數(shù)據(jù)點(diǎn)迭代地分配給K個(gè)組中的一個(gè)組。它為每個(gè)K-聚類(稱為質(zhì)心)選擇 K 個(gè)點(diǎn)?;谙嗨贫?,將新的數(shù)據(jù)點(diǎn)添加到具有最近質(zhì)心的聚類中。這個(gè)過程一直持續(xù)到質(zhì)心停止變化為止。

預(yù)測(cè)類人工智能算法,BA商業(yè)分析,人工智能,算法

?生活中,K-均值在欺詐檢測(cè)中扮演了重要角色,在汽車、醫(yī)療保險(xiǎn)和保險(xiǎn)欺詐檢測(cè)領(lǐng)域中廣泛應(yīng)用。

6. 決策森林回歸 決策森林回歸是一種適用于精準(zhǔn)度高、 訓(xùn)練時(shí)間短的場(chǎng)景的算法,它通過樹形結(jié)構(gòu)將數(shù)據(jù)劃分為多個(gè)子集,每個(gè)子集對(duì)應(yīng)著一個(gè)類別。

6. AI算法在微環(huán)境監(jiān)測(cè)的應(yīng)用---機(jī)器學(xué)習(xí)算法時(shí)間序列預(yù)測(cè)分析

大數(shù)據(jù)包含了大量的環(huán)境監(jiān)測(cè)數(shù)據(jù),包括傳感器數(shù)據(jù)、衛(wèi)星遙感數(shù)據(jù)、氣象數(shù)據(jù)等。AI可以通過對(duì)大數(shù)據(jù)的挖掘和分析,發(fā)現(xiàn)隱藏在數(shù)據(jù)中的規(guī)律和趨勢(shì)。例如,AI可以通過分析歷史環(huán)境數(shù)據(jù)和相關(guān)因素的關(guān)聯(lián)性,建立預(yù)測(cè)模型,預(yù)測(cè)環(huán)境污染事件的發(fā)生概率和嚴(yán)重程度。這有助于相關(guān)部門提前做好應(yīng)對(duì)準(zhǔn)備,采取相應(yīng)的措施降低環(huán)境污染的影響。

機(jī)器學(xué)習(xí)算法在環(huán)境污染實(shí)時(shí)監(jiān)測(cè)預(yù)警中扮演著重要角色。通過對(duì)歷史監(jiān)測(cè)數(shù)據(jù)的學(xué)習(xí)和訓(xùn)練,機(jī)器學(xué)習(xí)算法可以建立環(huán)境污染模型,并根據(jù)實(shí)時(shí)數(shù)據(jù)進(jìn)行預(yù)測(cè)和預(yù)警。例如,利用監(jiān)測(cè)數(shù)據(jù)和機(jī)器學(xué)習(xí)算法,可以建立空氣質(zhì)量預(yù)測(cè)模型,預(yù)測(cè)未來幾小時(shí)或幾天內(nèi)空氣質(zhì)量的變化趨勢(shì)。這樣的預(yù)警系統(tǒng)可以提供準(zhǔn)確的預(yù)測(cè)結(jié)果,幫助公眾提前做好健康防護(hù)和應(yīng)對(duì)措施。

AI技術(shù)的優(yōu)勢(shì)之一是其能夠從大量數(shù)據(jù)中提取規(guī)律和趨勢(shì)。 通過對(duì)歷史監(jiān)測(cè)數(shù)據(jù)的學(xué)習(xí)和訓(xùn)練, AI系統(tǒng)可以深入分析環(huán)境因素與污染物之間的關(guān)系,并預(yù)測(cè)環(huán)境變化的趨勢(shì)。這樣,我們就能更好地了解環(huán)境狀況,并及時(shí)采取必要措施來應(yīng)對(duì)潛在的問題。
?

一、時(shí)間序列分析的基本概念和方法
1.1時(shí)間序列的定義和特點(diǎn)
時(shí)間序列是按照時(shí)間順序排列的一系列數(shù)據(jù)點(diǎn)的集合,其中的數(shù)據(jù)點(diǎn)可以是連續(xù)的或離散的。時(shí)間序列的特點(diǎn)包括趨勢(shì)、周期性、季節(jié)性和隨機(jī)性。
1.2常用的時(shí)間序列分析方法
?平穩(wěn)性檢驗(yàn):通過檢驗(yàn)時(shí)間序列是否具有平穩(wěn)性來確定后續(xù)分析方法的選擇。

可視化數(shù)據(jù)即繪制時(shí)間序列的折線圖,看曲線是否圍繞某一數(shù)值上下波動(dòng)(判斷均值是否穩(wěn)定),看曲線上下波動(dòng)幅度變化大不大(判斷方差是否穩(wěn)定),看曲線不同時(shí)間段波動(dòng)的頻率[~緊湊程度]變化大不大(判斷協(xié)方差是否穩(wěn)定),以此來判斷時(shí)間序列是否是平穩(wěn)的。
預(yù)測(cè)類人工智能算法,BA商業(yè)分析,人工智能,算法


-自相關(guān)函數(shù)(ACF) 和偏自相關(guān)函數(shù)(PACF) :用于確定時(shí)間序列的自相關(guān)和偏相關(guān)性質(zhì),進(jìn)而選擇適合的模型。

自相關(guān)是指時(shí)間序列數(shù)據(jù)與其自身在不同時(shí)間點(diǎn)的相關(guān)性。它衡量了- -個(gè)時(shí)間序列與其滯后版本之間的線性關(guān)系。自相關(guān)函數(shù)(Autocorrelation Function, ACF)是用于測(cè)量自相關(guān)的工具。ACF的值范圍在-1到1之間,其中-1表示完全負(fù)相關(guān),1表示完全正相關(guān),0表示無相關(guān)。

偏自相關(guān)是在控制其他滯后項(xiàng)的影響下,衡量-一個(gè)時(shí)間序列與其滯后版本之間的相關(guān)性。偏自相關(guān)函數(shù)(Partial AutocorrelationFunction,PACF)用于測(cè)量偏自相關(guān)。PACF的計(jì)算通?;谶f歸方法,如Yule-Walker方程。

相關(guān)分析用于分析兩個(gè)事物之間的關(guān)系情況,在現(xiàn)實(shí)分析中,相關(guān)分析往往有第三變量的影響或作用,而使得相關(guān)系數(shù)不能真實(shí)地體現(xiàn)其線性相關(guān)程度。比如,研究身高與肺活量之間的關(guān)系,身高與肺活量都同體重有關(guān)系,如果不考慮體重的影響,就會(huì)得到身高越高,肺活量越大,這顯然是不準(zhǔn)確的。

因此,當(dāng)存在可能會(huì)影響兩變量之間的相關(guān)性的因素時(shí),就需要使用偏相關(guān)分析,以得到更加科學(xué)的結(jié)論。

預(yù)測(cè)類人工智能算法,BA商業(yè)分析,人工智能,算法

百度安全驗(yàn)證

預(yù)測(cè)類人工智能算法,BA商業(yè)分析,人工智能,算法


- 季節(jié)分解:將時(shí)間序列分解為長(zhǎng)期趨勢(shì)、季節(jié)性和殘差三個(gè)部分,更好地理解和預(yù)測(cè)序列數(shù)據(jù)。

在實(shí)際工作中,人們經(jīng)常按月(或年、季度、小時(shí)等)記錄資料,如每個(gè)月的出生人口數(shù)、死亡率、某種疾病的發(fā)病率、某產(chǎn)品的銷售額等,這些資料可能符合某種季節(jié)性分布,但這些數(shù)字的大小往往受多種因素的影響,從原始數(shù)據(jù)中很難看出季節(jié)趨勢(shì)。

季節(jié)分解法將時(shí)間序列分解成三個(gè)組成部分,或稱三個(gè)變量,即“趨勢(shì)分量”,“季節(jié)分量”和“隨機(jī)波動(dòng)”,趨勢(shì)分量采用多項(xiàng)式擬合,季節(jié)分量用傅里葉變換估計(jì),其數(shù)學(xué)表達(dá)式為:Yt=f(Tt,St,It)。式中,Tt代表長(zhǎng)期趨勢(shì)(可以是線性趨勢(shì),也可以是周期性波動(dòng)或長(zhǎng)周波動(dòng)),St是季節(jié)因子(幅度和周期固定的波動(dòng),日歷效應(yīng)為常見的季節(jié)因子),It為隨機(jī)波動(dòng)(可視為誤差)。

百度安全驗(yàn)證
預(yù)測(cè)類人工智能算法,BA商業(yè)分析,人工智能,算法預(yù)測(cè)類人工智能算法,BA商業(yè)分析,人工智能,算法


二、時(shí)間序列預(yù)測(cè)的基本方法
2.1傳統(tǒng)的時(shí)間序列預(yù)測(cè)方法
-移動(dòng)平均(MA)模型:根據(jù)時(shí)間序列的平均值來進(jìn)行預(yù)測(cè),適用于沒有長(zhǎng)期趨勢(shì)和季節(jié)性的數(shù)據(jù)。
-自回歸(AR)模型:根據(jù)時(shí)間序列自身的相關(guān)性來進(jìn)行預(yù)測(cè),適用于有長(zhǎng)期趨勢(shì)但沒有季節(jié)性的數(shù)據(jù)。
- 自回歸滑動(dòng)平均(ARMA)模型:結(jié)合MA和AR模型,適用于同時(shí)存在長(zhǎng)期趨勢(shì)和季節(jié)性的數(shù)據(jù)。
- 季節(jié)性自回歸滑動(dòng)平均(SARMA) 模型:在ARMA模型的基礎(chǔ)上考慮季節(jié)性的數(shù)據(jù)預(yù)測(cè)。

2.2利用機(jī)器學(xué)習(xí)進(jìn)行時(shí)間序列預(yù)測(cè)的方法
-支持向量回歸(SVR) :基于支持向量機(jī)(SVM)的回歸算法, 通過尋找支持向量使得回歸誤差最小化來進(jìn)行預(yù)測(cè)。
-隨機(jī)森林回歸(RF) :利用隨機(jī)森林的決策樹集合進(jìn)行回歸分析,通過集成多個(gè)決策樹的結(jié)果來進(jìn)行預(yù)測(cè)。
-神經(jīng)網(wǎng)絡(luò)(NN) :通過建立多層神經(jīng)網(wǎng)絡(luò)模型,利用前饋和反向傳播的算法進(jìn)行時(shí)間序列的預(yù)測(cè)。
-長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM) : -種基于循環(huán)神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)模型,適合處理長(zhǎng)期依賴關(guān)系的時(shí)間序列預(yù)測(cè)。


三、機(jī)器學(xué)習(xí)在實(shí)際時(shí)間序列分析中的應(yīng)用案例
3.1經(jīng)濟(jì)領(lǐng)域中的時(shí)間序列分析和預(yù)測(cè)
-股票市場(chǎng)預(yù)測(cè):利用機(jī)器學(xué)習(xí)方法對(duì)股票市場(chǎng)中的時(shí)間序列數(shù)據(jù)進(jìn)行分析和預(yù)測(cè),幫助投資者做出決策。
-經(jīng)濟(jì)增長(zhǎng)預(yù)測(cè):通過對(duì)宏觀經(jīng)濟(jì)指標(biāo)的時(shí)間序列數(shù)據(jù)進(jìn)行預(yù)測(cè),為政府和企業(yè)提供可靠的經(jīng)濟(jì)發(fā)展趨勢(shì)預(yù)測(cè)。
3.2環(huán)境領(lǐng)域中的時(shí)間序列分析和預(yù)測(cè)
-氣候變化預(yù)測(cè):基于歷史氣象數(shù)據(jù),利用機(jī)器學(xué)習(xí)方法預(yù)測(cè)未來的氣候變化情況,為農(nóng)業(yè)、城市規(guī)劃等提供決策支持。
空氣質(zhì)量預(yù)測(cè):通過對(duì)空氣質(zhì)量指標(biāo)的時(shí)間序列數(shù)據(jù)進(jìn)行分析和預(yù)測(cè),提前采取相應(yīng)的防護(hù)措施以保護(hù)大眾健康。


根據(jù)系統(tǒng)觀測(cè)得到的時(shí)間序列數(shù)據(jù),通過曲線擬合和參數(shù)估計(jì)來建立數(shù)學(xué)模型,分析其隨時(shí)間的變化趨勢(shì),對(duì)預(yù)測(cè)目標(biāo)進(jìn)行外推的定量預(yù)測(cè)方法。
時(shí)間序列預(yù)測(cè)方法常用在國(guó)民經(jīng)濟(jì)宏觀控制,企業(yè)經(jīng)營(yíng)管理,市場(chǎng)潛量預(yù)測(cè),氣象預(yù)報(bào)等方面。
主要介紹:移動(dòng)平均、指數(shù)平滑。

2.1.1.1.移動(dòng)平均
根據(jù)時(shí)間序列資料逐項(xiàng)推移,依次計(jì)算包含一定項(xiàng)數(shù)的序時(shí)平均值,以反映長(zhǎng)期變化趨勢(shì)。適用于短期預(yù)測(cè)。
移動(dòng)平均法能有效地消除預(yù)測(cè)中的隨機(jī)波動(dòng)。
不足:
(1) 不能很好地反映出未來趨勢(shì);
(2)需要大量的過去數(shù)據(jù)的記錄。
2.1.1.2.指數(shù)平滑
用過去數(shù)據(jù)的加權(quán)平均數(shù)作為預(yù)測(cè)值,即第t+1期的預(yù)測(cè)值等于第t期的實(shí)際觀察值與第t期預(yù)測(cè)值的加權(quán)平均值。(指數(shù)平滑法是加權(quán)平均的--種特殊的形式,觀察值時(shí)間越遠(yuǎn),其權(quán)數(shù)也跟著呈現(xiàn)指數(shù)的下降,因而稱為指數(shù)平滑)
優(yōu)點(diǎn):
(1)只需一個(gè)最近時(shí)期觀測(cè)值的權(quán)數(shù),其他時(shí)期數(shù)據(jù)的權(quán)數(shù)可自動(dòng)推算;適用于短期預(yù)測(cè)。
(2)需要數(shù)據(jù)量較少,只需前一期的實(shí)際觀測(cè)值及前一期的預(yù)測(cè)值。

7. 大數(shù)據(jù)分析AI工具的常用算法美林?jǐn)?shù)據(jù)TempodataTempoAI

人工智能的概念始于1956年的達(dá)特茅斯會(huì)議,由于受到數(shù)據(jù)、計(jì)算力、智能算法等多方面因素的影響,人工智能技術(shù)和應(yīng)用發(fā)展經(jīng)歷了多次高潮和低谷。2006年以來,以深度學(xué)習(xí)為代表的機(jī)器學(xué)習(xí)算法在機(jī)器視覺和語(yǔ)音識(shí)別等領(lǐng)域取得了極大的成功,識(shí)別準(zhǔn)確性大幅提升,使人工智能再次受到學(xué)術(shù)界和產(chǎn)業(yè)界的廣泛關(guān)注。數(shù)據(jù)、計(jì)算力和算法被認(rèn)為是人工智能發(fā)展的三大核心要素,數(shù)據(jù)是基礎(chǔ),算法是核心,計(jì)算力是支撐。因此,要衡量一個(gè)大數(shù)據(jù)分析平臺(tái)的核心能力,最為關(guān)鍵的一定是其所具備的算法能力。

機(jī)器學(xué)習(xí)平臺(tái)的核心算法體系,平臺(tái)內(nèi)嵌130余種數(shù)據(jù)分析方法,涉及數(shù)據(jù)預(yù)處理、回歸、分類、聚類、關(guān)聯(lián)、時(shí)間序列、綜合評(píng)價(jià)、文本分析、推薦、統(tǒng)計(jì)圖表十大類別。

智能化的自學(xué)習(xí)算法,平臺(tái)內(nèi)置自動(dòng)擇參、自動(dòng)分類、自動(dòng)回歸、自動(dòng)聚類、自動(dòng)時(shí)間序列等多種自學(xué)習(xí)功能,幫助用戶自動(dòng)選擇最優(yōu)算法和參數(shù),一方面降低了用戶對(duì)算法和參數(shù)選擇的經(jīng)驗(yàn)成本,另一方面極大的節(jié)省用戶的建模時(shí)間成本。

預(yù)測(cè)類人工智能算法,BA商業(yè)分析,人工智能,算法文章來源地址http://www.zghlxwxcb.cn/news/detail-772033.html

到了這里,關(guān)于PBA.常用人工智能預(yù)測(cè)分析算法的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包