国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<tfoot id="g88wh"></tfoot>

^{<acronym id="g88wh"></acronym>}

Python實(shí)現(xiàn)Stacking回歸模型(隨機(jī)森林回歸、極端隨機(jī)樹回歸、AdaBoost回歸、GBDT回歸、決策樹回歸)項(xiàng)目實(shí)戰(zhàn)

2年前作者：胖哥真不錯(cuò)分類：Toy博客閱讀(18)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了Python實(shí)現(xiàn)Stacking回歸模型(隨機(jī)森林回歸、極端隨機(jī)樹回歸、AdaBoost回歸、GBDT回歸、決策樹回歸)項(xiàng)目實(shí)戰(zhàn)。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

說明：這是一個(gè)機(jī)器學(xué)習(xí)實(shí)戰(zhàn)項(xiàng)目（附帶數(shù)據(jù)+代碼+文檔+視頻講解），如需數(shù)據(jù)+代碼+文檔+視頻講解可以直接到文章最后獲取。

1.項(xiàng)目背景

Stacking通?？紤]的是異質(zhì)弱學(xué)習(xí)器（不同的學(xué)習(xí)算法被組合在一起），stacking學(xué)習(xí)用元模型組合基礎(chǔ)模型。stacking 的概念是學(xué)習(xí)幾個(gè)不同的弱學(xué)習(xí)器，并通過訓(xùn)練一個(gè)元模型來組合它們，然后基于這些弱模型返回的多個(gè)預(yù)測結(jié)果輸出最終的預(yù)測結(jié)果。

本項(xiàng)目應(yīng)用Stacking回歸算法通過集成隨機(jī)森林回歸、極端隨機(jī)森林回歸、Adaboost回歸、梯度提升樹回歸、決策樹回歸五個(gè)算法進(jìn)行建模、預(yù)測及模型評估。

2.數(shù)據(jù)獲取

本次建模數(shù)據(jù)來源于網(wǎng)絡(luò)(本項(xiàng)目撰寫人整理而成)，數(shù)據(jù)項(xiàng)統(tǒng)計(jì)如下：

數(shù)據(jù)詳情如下(部分展示)：

3.數(shù)據(jù)預(yù)處理

3.1 用Pandas工具查看數(shù)據(jù)

使用Pandas工具的head()方法查看前五行數(shù)據(jù)：

關(guān)鍵代碼：

3.2 數(shù)據(jù)缺失查看

使用Pandas工具的info()方法查看數(shù)據(jù)信息：

從上圖可以看到，總共有10個(gè)變量，數(shù)據(jù)中無缺失值，共1000條數(shù)據(jù)。

關(guān)鍵代碼：

3.3 數(shù)據(jù)描述性統(tǒng)計(jì)

通過Pandas工具的describe()方法來查看數(shù)據(jù)的平均值、標(biāo)準(zhǔn)差、最小值、分位數(shù)、最大值。

關(guān)鍵代碼如下：

4.探索性數(shù)據(jù)分析

4.1 y變量直方圖

用Matplotlib工具的hist()方法繪制直方圖：

從上圖可以看到，y變量主要集中在-200~200之間。

4.2 相關(guān)性分析

從上圖中可以看到，數(shù)值越大相關(guān)性越強(qiáng)，正值是正相關(guān)、負(fù)值是負(fù)相關(guān)。 ?

5.特征工程

5.1 建立特征數(shù)據(jù)和標(biāo)簽數(shù)據(jù)

關(guān)鍵代碼如下：

5.2 數(shù)據(jù)集拆分

通過train_test_split()方法按照80%訓(xùn)練集、20%測試集進(jìn)行劃分，關(guān)鍵代碼如下：

6.構(gòu)建Stacking回歸模型

主Stacking回歸算法通過集成隨機(jī)森林回歸、極端隨機(jī)森林回歸、Adaboost回歸、梯度提升樹回歸、決策樹回歸五個(gè)算法進(jìn)行建模，用于目標(biāo)回歸。

6.1第一層模型參數(shù)

關(guān)鍵代碼如下：

?6.2第一層模型特征重要性

?通過上圖可以看出，隨機(jī)森林模型特征重要性排名為x5、x6等。

通過上圖可以看出，極端隨機(jī)樹模型特征重要性排名為x5、x6等。

?通過上圖可以看出，AdaBoost模型特征重要性排名為x5、x6等。

通過上圖可以看出，Gradient Boost模型特征重要性排名為x5、x6等。?

通過上圖可以看出，所有模型特征重要性排名為x5、x6、x1等。

6.3 五種模型相關(guān)性分析

針對五種模型的預(yù)測結(jié)果進(jìn)行相關(guān)性分析，通過上圖可以看出大于0的為正相關(guān) 數(shù)值越大相關(guān)性越強(qiáng)；小于0的為負(fù)相關(guān)。

6.4 第二層模型參數(shù)

關(guān)鍵代碼如下：

7.模型評估

7.1 評估指標(biāo)及結(jié)果

評估指標(biāo)主要包括可解釋方差值、平均絕對誤差、均方誤差、R方值等等。

從上表可以看出，R方0.9707，為模型效果較好。

關(guān)鍵代碼如下：

7.2 真實(shí)值與預(yù)測值對比圖

從上圖可以看出真實(shí)值和預(yù)測值波動(dòng)基本一致，模型擬合效果良好。 ??

8.結(jié)論與展望

綜上所述，本項(xiàng)目采用了應(yīng)用Stacking回歸算法通過集成隨機(jī)森林回歸、極端隨機(jī)森林回歸、Adaboost回歸、梯度提升樹回歸、決策樹回歸五個(gè)算法進(jìn)行建模及模型評估，最終證明了我們提出的模型效果較好。?文章來源地址http://www.zghlxwxcb.cn/news/detail-429061.html

# 本次機(jī)器學(xué)習(xí)項(xiàng)目實(shí)戰(zhàn)所需的資料，項(xiàng)目資源如下：
 
# 項(xiàng)目說明：

# 鏈接：https://pan.baidu.com/s/1VPWFSTp8cDrvLKYUYXiqvQ 
# 提取碼：vqs0

# 用Pandas工具查看數(shù)據(jù)
print(df.head())
print('******************************')

# 數(shù)據(jù)缺失值統(tǒng)計(jì)
print(df.info())
print('******************************')

# 描述性統(tǒng)計(jì)分析
print(df.describe().round(4))
print('******************************')

# y變量分布直方圖
fig = plt.figure(figsize=(8, 5))  # 設(shè)置畫布大小
plt.rcParams['font.sans-serif'] = 'SimHei'  # 設(shè)置中文顯示
plt.rcParams['axes.unicode_minus'] = False  # 解決保存圖像是負(fù)號'-'顯示為方塊的問題
data_tmp = df['y']  # 過濾出y變量的樣本
# 繪制直方圖  bins：控制直方圖中的區(qū)間個(gè)數(shù) auto為自動(dòng)填充個(gè)數(shù)  color：指定柱子的填充色
plt.hist(data_tmp, bins='auto', color='g')
plt.xlabel('y')
plt.ylabel('數(shù)量')

到了這里，關(guān)于Python實(shí)現(xiàn)Stacking回歸模型(隨機(jī)森林回歸、極端隨機(jī)樹回歸、AdaBoost回歸、GBDT回歸、決策樹回歸)項(xiàng)目實(shí)戰(zhàn)的文章就介紹完了。如果您還想了解更多內(nèi)容，請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

利用Python對含有地理信息的遙感影像，使用隨機(jī)森林模型回歸，并保存預(yù)測影像
最近在做隨機(jī)森林回歸實(shí)驗(yàn)時(shí)，遇到了一個(gè)問題：在做回歸時(shí)，用的是excel點(diǎn)數(shù)據(jù)做的回歸，像這樣：但是如何把這個(gè)訓(xùn)練好的模型應(yīng)用到整幅含有地理信息的遙感影像上去，并保存這個(gè)預(yù)測圖像呢？對這個(gè)問題，展開了一些思考，廢話不多說，直接上代碼。導(dǎo)入數(shù)據(jù)，這
2024年04月16日
瀏覽(34)
區(qū)間預(yù)測 | MATLAB實(shí)現(xiàn)基于QRF隨機(jī)森林分位數(shù)回歸時(shí)間序列區(qū)間預(yù)測模型
效果一覽基本介紹 1.Matlab實(shí)現(xiàn)基于QRF隨機(jī)森林分位數(shù)回歸時(shí)間序列區(qū)間預(yù)測模型； 2.基于隨機(jī)森林回歸（QRF）分位數(shù)時(shí)間序列區(qū)間預(yù)測，Matlab代碼，單變量輸入模型，data為數(shù)據(jù)集（功率數(shù)據(jù)集），QRFTS為主程序，其余為函數(shù)文件，無需運(yùn)行； 3.評價(jià)指標(biāo)包括：R2、MAE、MAPE、
2024年02月15日
瀏覽(41)
區(qū)間預(yù)測 | MATLAB實(shí)現(xiàn)基于QRF隨機(jī)森林分位數(shù)回歸多變量時(shí)間序列區(qū)間預(yù)測模型
效果一覽基本介紹 1.Matlab實(shí)現(xiàn)基于QRF隨機(jī)森林分位數(shù)回歸多變量時(shí)間序列區(qū)間預(yù)測模型； 2.基于隨機(jī)森林回歸（QRF）分位數(shù)時(shí)間序列區(qū)間預(yù)測，Matlab代碼，單變量輸入模型，data為數(shù)據(jù)集，QRFNTS為主程序，其余為函數(shù)文件，無需運(yùn)行； 3.評價(jià)指標(biāo)包括：R2、MAE、MAPE、MSE和區(qū)間
2024年02月15日
瀏覽(41)
python機(jī)器學(xué)習(xí)——分類模型評估 & 分類算法（k近鄰，樸素貝葉斯，決策樹，隨機(jī)森林，邏輯回歸，svm）
交叉驗(yàn)證：為了讓被評估的模型更加準(zhǔn)確可信交叉驗(yàn)證：將拿到的數(shù)據(jù)，分為訓(xùn)練和驗(yàn)證集。以下圖為例：將數(shù)據(jù)分成5份，其中一份作為驗(yàn)證集。然后經(jīng)過5次(組)的測試，每次都更換不同的驗(yàn)證集。即得到5組模型的結(jié)果，取平均值作為最終結(jié)果。又稱5折交叉驗(yàn)證。通常情
2024年02月03日
瀏覽(31)
隨機(jī)森林回歸模型算法
目錄隨機(jī)森林回歸算法的介紹隨機(jī)森林回歸算法的Python示例與解釋總結(jié) 隨機(jī)森林是一種集成學(xué)習(xí)方法，用于解決分類和回歸問題。它結(jié)合了多個(gè)決策樹模型的預(yù)測結(jié)果，通過集體決策來提高整體性能和減少過擬合。隨機(jī)森林適用于各種數(shù)據(jù)類型，并且在許多應(yīng)用領(lǐng)域都表現(xiàn)
2024年04月22日
瀏覽(27)
機(jī)械學(xué)習(xí)模型訓(xùn)練常用代碼（隨機(jī)森林、聚類、邏輯回歸、svm、線性回歸、lasso回歸，嶺回歸）
更多pandas操作請參考添加鏈接描述pandas對于文件數(shù)據(jù)基本操作導(dǎo)入的包sklearn 字符串編碼處理，LabelEncoder TfidfVectorizer結(jié)合TruncatedSVD 排除某一列，例如如果需要用到回歸則換成RandomForestRegressor 數(shù)據(jù)在dc_matrix里面繪制距離 #加入到表里面師范，保存文本模型，使用其轉(zhuǎn)換，調(diào)
2023年04月14日
瀏覽(23)
python大數(shù)據(jù)之隨機(jī)森林（回歸與分類）
隨機(jī)森林在大數(shù)據(jù)運(yùn)用中非常的常見，它在預(yù)測和回歸上相比于SVM，多元線性回歸，邏輯回歸，多項(xiàng)式回歸這些，有著比較好的魯棒性。隨機(jī)森林是一個(gè)用隨機(jī)方式建立的，包含多個(gè)決策樹的分類器。其輸出的類別是由各個(gè)樹輸出的類別的眾數(shù)而定。優(yōu)點(diǎn)：處理高緯度的數(shù)
2024年02月02日
瀏覽(26)
模型應(yīng)用系實(shí)習(xí)生-模型訓(xùn)練筆記(更新至線性回歸、Ridge回歸、Lasso回歸、Elastic Net回歸、決策樹回歸、梯度提升樹回歸和隨機(jī)森林回歸)
本次訓(xùn)練的變量是一致對應(yīng)的，訓(xùn)練準(zhǔn)備通過后，后續(xù)建模都不會有報(bào)錯(cuò)的！ scikit-learn包以及鏡像必須全部為數(shù)字類型且無空值才能進(jìn)行訓(xùn)練，關(guān)于非數(shù)據(jù)類型需要進(jìn)行相對處理例如：可以采用獨(dú)熱編碼或者label編碼進(jìn)行處理。本文演示的是pandas 的dataframe數(shù)據(jù)類型的操作，
2024年02月06日
瀏覽(26)
Python數(shù)據(jù)分析案例22——財(cái)經(jīng)新聞可信度分析(線性回歸，主成分回歸，隨機(jī)森林回歸)
?本次案例還是適合人文社科領(lǐng)域，金融或者新聞專業(yè)。本科生做線性回歸和主成分回歸就夠了，研究生還可以加隨機(jī)森林回歸，其方法足夠人文社科領(lǐng)域的碩士畢業(yè)論文了。有八個(gè)自變量，[\\\'微博平臺可信度\\\',\\\'專業(yè)性\\\',\\\'可信賴性\\\',\\\'轉(zhuǎn)發(fā)量\\\',\\\'微博內(nèi)容質(zhì)量\\\',\\\'時(shí)效性\\\',\\\'驗(yàn)證程度
2023年04月08日
瀏覽(31)
Python數(shù)據(jù)分析案例05——影響經(jīng)濟(jì)增長的因素(隨機(jī)森林回歸)
在計(jì)量經(jīng)濟(jì)學(xué)里面的研究，圍繞著影響GDP的因素的研究有很多，基本都是做回歸，拿GDP作為被解釋變量y，其他因素作為解釋變量x。然后做線性回歸，時(shí)間序列就做自回歸，面板數(shù)據(jù)就做固定效應(yīng)等等。本次案例采用機(jī)器學(xué)習(xí)里面的隨機(jī)森林回歸來研究影響經(jīng)濟(jì)增長的因素，
2024年02月09日
瀏覽(29)

<b id="s80lx"></b>

<option id="s80lx"><pre id="s80lx"><table id="s80lx"></table></pre></option>