說明:這是一個機器學(xué)習(xí)實戰(zhàn)項目(附帶數(shù)據(jù)+代碼+文檔+視頻講解),如需數(shù)據(jù)+代碼+文檔+視頻講解可以直接到文章最后獲取。
1.項目背景
Logit模型(Logit model,也譯作“評定模型”,“分類評定模型”,又作Logistic regression,“邏輯回歸”)是離散選擇法模型之一,屬于多重變量分析范疇,是社會學(xué)、生物統(tǒng)計學(xué)、臨床、數(shù)量心理學(xué)、計量經(jīng)濟學(xué)、市場營銷等統(tǒng)計實證分析的常用方法。
本項目通過Logit算法來構(gòu)建邏輯回歸模型。 ?
2.數(shù)據(jù)獲取
本次建模數(shù)據(jù)來源于網(wǎng)絡(luò)(本項目撰寫人整理而成),數(shù)據(jù)項統(tǒng)計如下:
編號 |
變量名稱 |
描述 |
1 |
x1 |
|
2 |
x2 |
|
3 |
x3 |
|
4 |
x4 |
|
5 |
x5 |
|
6 |
x6 |
|
7 |
x7 |
|
8 |
x8 |
|
9 |
x9 |
|
10 |
x10 |
|
11 |
y |
數(shù)據(jù)詳情如下(部分展示):
3.數(shù)據(jù)預(yù)處理
3.1?用Pandas工具查看數(shù)據(jù)
使用Pandas工具的head()方法查看前五行數(shù)據(jù):
關(guān)鍵代碼:
3.2 數(shù)據(jù)缺失查看
使用Pandas工具的info()方法查看數(shù)據(jù)信息:
??????
從上圖可以看到,總共有11個變量,數(shù)據(jù)中無缺失值,共2000條數(shù)據(jù)。
關(guān)鍵代碼:
3.3?數(shù)據(jù)描述性統(tǒng)計
通過Pandas工具的describe()方法來查看數(shù)據(jù)的平均值、標(biāo)準(zhǔn)差、最小值、分位數(shù)、最大值。
關(guān)鍵代碼如下: ???
4.探索性數(shù)據(jù)分析
4.1?y變量柱狀圖
用Matplotlib工具的plot()方法繪制柱狀圖:
4.2 y=1樣本x1變量分布直方圖
用Matplotlib工具的hist()方法繪制直方圖:
4.3 相關(guān)性分析
從上圖中可以看到,數(shù)值越大相關(guān)性越強,正值是正相關(guān)、負(fù)值是負(fù)相關(guān)。
5.特征工程
5.1 建立特征數(shù)據(jù)和標(biāo)簽數(shù)據(jù)
關(guān)鍵代碼如下:
5.2 數(shù)據(jù)集拆分
通過train_test_split()方法按照80%訓(xùn)練集、20%測試集進(jìn)行劃分,關(guān)鍵代碼如下:
6.構(gòu)建邏輯回歸模型
主要使用Logit算法,用于目標(biāo)分類。
6.1?構(gòu)建模型
編號 |
模型名稱 |
參數(shù) |
1 |
Logit模型 |
默認(rèn)參數(shù) |
6.2?模型的摘要信息
7.模型評估
7.1 評估指標(biāo)及結(jié)果
評估指標(biāo)主要包括準(zhǔn)確率、查準(zhǔn)率、查全率、F1分值等等。
模型名稱 |
指標(biāo)名稱 |
指標(biāo)值 |
測試集 | ||
Logit模型 |
準(zhǔn)確率 |
0.9125 |
查準(zhǔn)率 |
0.9448 |
|
查全率 |
0.8724 |
|
F1分值 |
0.9072 |
從上表可以看出,F(xiàn)1分值為0.9072,說明模型效果較好。
關(guān)鍵代碼如下: ?
7.2 分類報告
??????
從上圖可以看出,分類為0的F1分值為0.92;分類為1的F1分值為0.91。
7.3 混淆矩陣
從上圖可以看出,實際為0預(yù)測不為0的 有10個樣本;實際為1預(yù)測不為1的 有25個樣本,整體預(yù)測準(zhǔn)確率良好。 ??文章來源:http://www.zghlxwxcb.cn/news/detail-812023.html
8.結(jié)論與展望
綜上所述,本文采用了Logit回歸算法來構(gòu)建邏輯回歸模型,最終證明了我們提出的模型效果良好。此模型可用于日常產(chǎn)品的預(yù)測。 ?文章來源地址http://www.zghlxwxcb.cn/news/detail-812023.html
# 本次機器學(xué)習(xí)項目實戰(zhàn)所需的資料,項目資源如下:
# 項目說明:
# 獲取方式一:
# 項目實戰(zhàn)合集導(dǎo)航:
https://docs.qq.com/sheet/DTVd0Y2NNQUlWcmd6?tab=BB08J2
# 獲取方式二:
鏈接:https://pan.baidu.com/s/1tGMG7LTv-hk5wYQ0NPyKUA
提取碼:2gnb
到了這里,關(guān)于Python實現(xiàn)離散選擇Logit模型(Logit算法)項目實戰(zhàn)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!