說明:這是一個機(jī)器學(xué)習(xí)實(shí)戰(zhàn)項(xiàng)目(附帶數(shù)據(jù)+代碼+文檔+視頻講解),如需數(shù)據(jù)+代碼+文檔+視頻講解可以直接到文章最后獲取。
1.項(xiàng)目背景
麻雀搜索算法(Sparrow Search Algorithm, SSA)是一種新型的群智能優(yōu)化算法,在2020年提出,主要是受麻雀的覓食行為和反捕食行為的啟發(fā)。
在麻雀覓食的過程中,分為發(fā)現(xiàn)者(探索者)和加入者(追隨者),發(fā)現(xiàn)者在種群中負(fù)責(zé)尋找食物并為整個麻雀種群提供覓食區(qū)域和方向,而加入者則是利用發(fā)現(xiàn)者來獲取食物。為了獲得食物,麻雀通??梢圆捎冒l(fā)現(xiàn)者和加入者這兩種行為策略進(jìn)行覓食。種群中的個體會監(jiān)視群體中其它個體的行為,并且該種群中的攻擊者會與高攝取量的同伴爭奪食物資源,以提高自己的捕食率。此外,當(dāng)麻雀種群意識到危險(xiǎn)時(shí)會做出反捕食行為。
本項(xiàng)目通過SSA麻雀搜索算法優(yōu)化LightGBM回歸模型。
2.數(shù)據(jù)獲取
本次建模數(shù)據(jù)來源于網(wǎng)絡(luò)(本項(xiàng)目撰寫人整理而成),數(shù)據(jù)項(xiàng)統(tǒng)計(jì)如下:
數(shù)據(jù)詳情如下(部分展示):
3.數(shù)據(jù)預(yù)處理
3.1 用Pandas工具查看數(shù)據(jù)
使用Pandas工具的head()方法查看前五行數(shù)據(jù):
關(guān)鍵代碼:
3.2 數(shù)據(jù)缺失查看
使用Pandas工具的info()方法查看數(shù)據(jù)信息:
從上圖可以看到,總共有11個變量,數(shù)據(jù)中無缺失值,共1000條數(shù)據(jù)。
關(guān)鍵代碼: ?
3.3 數(shù)據(jù)描述性統(tǒng)計(jì)
通過Pandas工具的describe()方法來查看數(shù)據(jù)的平均值、標(biāo)準(zhǔn)差、最小值、分位數(shù)、最大值。
關(guān)鍵代碼如下: ?
4.探索性數(shù)據(jù)分析
4.1 y變量分布直方圖
用Matplotlib工具的hist()方法繪制直方圖:
4.2 相關(guān)性分析
從上圖中可以看到,數(shù)值越大相關(guān)性越強(qiáng),正值是正相關(guān)、負(fù)值是負(fù)相關(guān)。
5.特征工程 ?
5.1 建立特征數(shù)據(jù)和標(biāo)簽數(shù)據(jù)
關(guān)鍵代碼如下:
5.2 數(shù)據(jù)集拆分
通過train_test_split()方法按照80%訓(xùn)練集、20%驗(yàn)證集進(jìn)行劃分,關(guān)鍵代碼如下:
6.構(gòu)建SSA麻雀搜索算法優(yōu)化LightGBM回歸模型
主要使用SSA麻雀搜索算法優(yōu)化LightGBM算法,用于目標(biāo)回歸。
6.1 SSA麻雀搜索算法尋找最優(yōu)參數(shù)值
最優(yōu)參數(shù)值:
6.2 最優(yōu)參數(shù)構(gòu)建模型
這里通過最優(yōu)參數(shù)構(gòu)建LightGBM回歸模型:
7.模型評估
7.1 評估指標(biāo)及結(jié)果
評估指標(biāo)主要包括R方、均方誤差、解釋性方差、絕對誤差等等。
從上表可以看出,R方分值為0.9436,模型效果良好。
關(guān)鍵代碼如下:
7.2 真實(shí)值與預(yù)測值對比圖
從上圖可以看出真實(shí)值和預(yù)測值波動基本一致,模型效果良好。
8.結(jié)論與展望
綜上所述,本文采用了SSA麻雀搜索算法尋找LightGBM算法的最優(yōu)參數(shù)值來構(gòu)建回歸模型,最終證明了我們提出的模型效果良好。此模型可用于日常產(chǎn)品的建模工作。 ?
# 本次機(jī)器學(xué)習(xí)項(xiàng)目實(shí)戰(zhàn)所需的資料,項(xiàng)目資源如下:
# 項(xiàng)目說明:
# 鏈接:https://pan.baidu.com/s/1z9LTmDiD1rG6zx2LXRsrqg
# 提取碼:npzi
更多項(xiàng)目實(shí)戰(zhàn),詳見機(jī)器學(xué)習(xí)項(xiàng)目實(shí)戰(zhàn)合集列表:文章來源:http://www.zghlxwxcb.cn/news/detail-698718.html
機(jī)器學(xué)習(xí)項(xiàng)目實(shí)戰(zhàn)合集列表_機(jī)器學(xué)習(xí)實(shí)戰(zhàn)項(xiàng)目_胖哥真不錯的博客-CSDN博客文章來源地址http://www.zghlxwxcb.cn/news/detail-698718.html
到了這里,關(guān)于Python實(shí)現(xiàn)SSA智能麻雀搜索算法優(yōu)化LightGBM回歸模型(LGBMRegressor算法)項(xiàng)目實(shí)戰(zhàn)的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!