国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<div id="4e19f"></div>

<i id="4e19f"><ins id="4e19f"><strike id="4e19f"></strike></ins></i>

使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析

2年前作者：csdn1561168266分類(lèi)：Toy博客閱讀(40)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

大家好，線性回歸是確定兩種或兩種以上變量之間互相依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法。根據(jù)自變量的個(gè)數(shù)，可以將線性回歸分為一元線性回歸和多元線性回歸分析。

一元線性回歸：就是只包含一個(gè)自變量，且該自變量與因變量之間的關(guān)系是線性關(guān)系。例如通過(guò)廣告費(fèi)這一個(gè)自變量來(lái)預(yù)測(cè)銷(xiāo)量，就屬于一元線性回歸分析。

多元線性回歸：如果回歸分析包含兩個(gè)或以上的自變量，且每個(gè)因變量與自變量之間都是線性關(guān)系，則稱為多元線性回歸分析；例如通過(guò)肥料、灌溉等人工成本來(lái)預(yù)測(cè)產(chǎn)量，就屬于多元線性回歸。

一、線性回歸分析的思路

確定因變量與自變量。比如通過(guò)人工成本費(fèi)進(jìn)行產(chǎn)量預(yù)測(cè)時(shí)，人工成本費(fèi)是自變量，產(chǎn)量是因變量。

確定線性回歸分析的類(lèi)型。例如在一元線性回歸分析中，只需要確定自變量與因變量的相關(guān)度為強(qiáng)相關(guān)性，即可建立一元線性回歸方程，從而確定線性回歸分析的類(lèi)型為一元線性回歸。

建立線性回歸分析模型。

檢驗(yàn)線性回歸分析模型的擬合程度。為了判斷線性回歸分析模型是否可用于實(shí)際檢測(cè)，需要檢驗(yàn)線性回歸分析模型的擬合程度，也就是對(duì)模型進(jìn)行評(píng)估，主要以這三個(gè)值作為評(píng)估標(biāo)準(zhǔn)：(R-squared統(tǒng)計(jì)學(xué)中的)、Adj.R-squared(即Adiustd )、P值；其中前兩個(gè)用來(lái)衡量線性擬合的擬合程度，P值用來(lái)衡量特征變量的顯著性。

利用線性回歸分析模型進(jìn)行預(yù)測(cè)。如果擬合出來(lái)的回歸分析模型的擬合度符合要求，就可以使用該模型以及計(jì)算出的系數(shù)a和b得到回歸方程，從而根據(jù)已有的自變量數(shù)據(jù)來(lái)預(yù)測(cè)需要的因變量結(jié)果。

二、一元線性回歸分析

使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析

那我們初中學(xué)過(guò)的一元一次方程y=ax+b來(lái)說(shuō)：就是最簡(jiǎn)單的一元線性回歸，接下來(lái)，我們以上圖數(shù)據(jù)為例，假設(shè)當(dāng)人工成本為6600元時(shí)，產(chǎn)量為多少？我們下面就這一實(shí)際生產(chǎn)問(wèn)題問(wèn)題進(jìn)行一元線性回歸分析代碼演示。

確定因變量與自變量：


import pandas as pd
data= pd.read_excel('D:/shujufenxi/作物表型記錄本.xlsx',sheet_name=0,index_col='序號(hào)')
print(data.head())

使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析

我們要進(jìn)行的是根據(jù)已知的6600人工成本預(yù)測(cè)產(chǎn)量，由此可知，人工成本費(fèi)為自變量，產(chǎn)量為因變量。

確定線性回歸分析的類(lèi)型：


import pandas as pd
data= pd.read_excel('D:/shujufenxi/作物表型記錄本.xlsx',sheet_name=0,index_col='序號(hào)')
print(data.head())
# 選中自變量與因變量的數(shù)據(jù)，x為自變量，y為因變量
x=data[['人工成本費(fèi)(元)']]
y=data[['產(chǎn)量(公斤)']]
# 確定線性回歸分析的類(lèi)型
corr=data.corr()
print(corr)

使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析

可以看到人工成本與產(chǎn)量之間的相關(guān)系數(shù)為0.965321，為強(qiáng)相關(guān)，隨后利用Matplotlib模塊進(jìn)行繪制散點(diǎn)圖，代碼如下：


# 繪制散點(diǎn)圖
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False
plt.scatter(x,y)
plt.xlabel('人工成本費(fèi)(元)')
plt.ylabel('產(chǎn)量(公斤)')
plt.show()

使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析

建立回歸分析模型以及檢驗(yàn)線性回歸分析模型的擬合程度：


#建立回歸分析模型
from sklearn.linear_model import LinearRegression  # 需下載Scikit-Learn模塊，使用LinearRegression（）函數(shù)建立線性回歸分析模型
Model=LinearRegression()
Model.fit(x,y)
#檢驗(yàn)線性回歸分析模型的擬合程度
score=Model.score(x,y)
print(score)
plt.scatter(x,y)
plt.plot(x,Model.predict(x))
plt.xlabel('人工成本費(fèi)(元)')
plt.ylabel('產(chǎn)量(公斤)')
plt.show()

使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析

可以看出模型的評(píng)分約為0.93，很接近1，擬合程度還是較高的。

使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析

可以看出大多數(shù)散點(diǎn)還是比較靠近這條直線的，說(shuō)明模型很好的捕捉到了數(shù)據(jù)特征，可以算是恰當(dāng)擬合。

利用線性回歸分析進(jìn)行預(yù)測(cè)：


# 預(yù)測(cè),也可以進(jìn)行同時(shí)預(yù)測(cè)多個(gè)，如下
y=Model.predict([[6600],[15000],[8888]])
print(y)

使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析

三、多元線性回歸分析

使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析

下面我們利用此虛擬數(shù)據(jù)假設(shè)當(dāng)農(nóng)藥成本費(fèi)、肥料成本費(fèi)、田間管理成本費(fèi)分別為3400、2900、3100時(shí)的產(chǎn)量為多少，下面我們將進(jìn)行完整代碼演示：


## 確定自變量與因變量
import pandas as pd
data= pd.read_excel('D:/shujufenxi/作物表型記錄本.xlsx',sheet_name=1,index_col='序號(hào)')
print(data.head())
# 選中自變量與因變量的數(shù)據(jù)，x為自變量，y為因變量
x=data[['農(nóng)藥成本費(fèi)(元)','肥料成本費(fèi)(元)','田間管理成本費(fèi)(元)']]
y=data[['產(chǎn)量(公斤)']]
# 確定線性回歸分析的類(lèi)型——圖3
corr=data.corr()
print(corr)
# 繪制散點(diǎn)圖——圖1
import matplotlib.pyplot as plt
import seaborn as sns
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False
sns.pairplot(data,x_vars=['農(nóng)藥成本費(fèi)(元)','肥料成本費(fèi)(元)','田間管理成本費(fèi)(元)'],y_vars='產(chǎn)量(公斤)')
plt.show()

#建立回歸分析模型
from sklearn.linear_model import LinearRegression  # 需下載Scikit-Learn模塊，使用LinearRegression（）函數(shù)建立線性回歸分析模型
Model=LinearRegression()
Model.fit(x,y)
#檢驗(yàn)線性回歸分析模型的擬合程度——圖3
score=Model.score(x,y)
print(score)
# 繪制擬合成果圖——圖2
sns.pairplot(data,x_vars=['農(nóng)藥成本費(fèi)(元)','肥料成本費(fèi)(元)','田間管理成本費(fèi)(元)'],y_vars='產(chǎn)量(公斤)',kind='reg')# kind參數(shù)可添加一條最佳擬合直線和95%的置信帶，從而更直觀的展示模型的擬合程度
plt.show()

# 預(yù)測(cè),也可以進(jìn)行同時(shí)預(yù)測(cè)多個(gè)，如下——圖3
y=Model.predict([[3400,2900,3100]])
print(y)

使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析

使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析

使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析

以上就是根據(jù)此數(shù)據(jù)所進(jìn)行的多元線性回歸分析以及模型預(yù)測(cè)；在上面第二個(gè)圖中，我們從置信帶的寬度來(lái)看，農(nóng)藥成本費(fèi)與產(chǎn)量的線性關(guān)系較強(qiáng)，肥料成本費(fèi)、田間管理成本費(fèi)兩者與產(chǎn)量的線性關(guān)系則較弱。

本文所講對(duì)模型進(jìn)行擬合在實(shí)際生產(chǎn)中具有重大意義，不僅可以利用已知變量預(yù)測(cè)未知變量，還能根據(jù)擬合結(jié)果判斷所得數(shù)據(jù)是否具有生產(chǎn)意義。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-409903.html

到了這里，關(guān)于使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

基于多元線性回歸的Boston房?jī)r(jià)數(shù)據(jù)分析
Boston房?jī)r(jià)數(shù)據(jù)是R語(yǔ)言中一類(lèi)重要的數(shù)據(jù)，常被用來(lái)做各種方法分析，即它是波士頓不同地區(qū)的506個(gè)家庭住房信息，其中包括影響房?jī)r(jià)的14個(gè)因素如城鎮(zhèn)的人均犯罪率、氮氧化合物濃度、城鎮(zhèn)黑人的比例、低教育程度的人口比例等，而且每個(gè)因素對(duì)房?jī)r(jià)的影響都是不同顯著程度
2024年01月19日
瀏覽(28)
大數(shù)據(jù)分析案例-基于多元線性回歸算法構(gòu)建廣告投放收益模型
? ???♂? 個(gè)人主頁(yè)：@艾派森的個(gè)人主頁(yè) ???作者簡(jiǎn)介：Python學(xué)習(xí)者 ?? 希望大家多多支持，我們一起進(jìn)步！?? 如果文章對(duì)你有幫助的話，歡迎評(píng)論 ??點(diǎn)贊???? 收藏 ??加關(guān)注+ 目錄 1.項(xiàng)目背景 2.項(xiàng)目簡(jiǎn)介 2.1
2024年02月03日
瀏覽(26)
鮑魚(yú)數(shù)據(jù)集案例分析-預(yù)測(cè)鮑魚(yú)年齡（線性回歸/梯度下降法實(shí)操）
數(shù)據(jù)集來(lái)源UCI Machine Learning Repository: Abalone Data Set 目錄一、數(shù)據(jù)集探索性分析二、鮑魚(yú)數(shù)據(jù)預(yù)處理 1.對(duì)sex特征進(jìn)行OneHot編碼，便于后續(xù)模型納入啞變量 2.添加取值為1的特征 3.?計(jì)算鮑魚(yú)的真實(shí)年齡 4.篩選特征 5.?將鮑魚(yú)數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集三、實(shí)現(xiàn)線性回歸和嶺回歸
2024年02月08日
瀏覽(149)
使用Python進(jìn)行數(shù)據(jù)分析——方差分析
大家好，方差分析可以用來(lái)判斷幾組觀察到的數(shù)據(jù)或者處理的結(jié)果是否存在顯著差異。本文介紹的方差分析（Analysis of Variance，簡(jiǎn)稱ANOVA）就是用于檢驗(yàn)兩組或者兩組以上樣本的均值是否具備顯著性差異的一種數(shù)理統(tǒng)計(jì)方法。根據(jù)影響試驗(yàn)條件的因素個(gè)數(shù)可以將方差分析分為
2024年02月15日
瀏覽(25)
使用Python批量進(jìn)行數(shù)據(jù)分析
知識(shí)延伸 1、sort_value()是pandas模塊中DataFrame對(duì)象的函數(shù)，用于將數(shù)據(jù)區(qū)域按照某個(gè)字段的數(shù)據(jù)進(jìn)行排序，這個(gè)字段可以是行字段，也可以是列字段。語(yǔ)法格式： sort_value(by=\\\'##\\\',axis=0,ascending=True,inplace=False,na_position=\\\'last\\\') 參數(shù) 說(shuō)明 by 要排序的列名或索引值 axis 如果省略或者為
2024年02月10日
瀏覽(25)
如何使用Python進(jìn)行數(shù)據(jù)分析？
要使用Python進(jìn)行數(shù)據(jù)分析，可以按照以下步驟進(jìn)行：安裝Python：首先，你需要安裝Python解釋器?？梢詮腜ython官方網(wǎng)站下載并安裝適合你操作系統(tǒng)的Python版本。安裝數(shù)據(jù)分析庫(kù)：Python有許多強(qiáng)大的數(shù)據(jù)分析庫(kù)，如NumPy、Pandas和Matplotlib。使用pip命令或包管理工具安裝這些庫(kù)。導(dǎo)
2024年02月10日
瀏覽(21)
Python小知識(shí) - 使用Python進(jìn)行數(shù)據(jù)分析
使用Python進(jìn)行數(shù)據(jù)分析數(shù)據(jù)分析簡(jiǎn)介數(shù)據(jù)分析，又稱為信息分析，是指對(duì)數(shù)據(jù)進(jìn)行綜合處理、歸納提煉、概括總結(jié)的過(guò)程，是數(shù)據(jù)處理的第一步。數(shù)據(jù)分析的目的是了解數(shù)據(jù)的內(nèi)在規(guī)律，為數(shù)據(jù)挖掘，并應(yīng)用于商業(yè)決策、科學(xué)研究等提供決策依據(jù)。數(shù)據(jù)分析的基本方法數(shù)
2024年02月10日
瀏覽(22)
使用Python進(jìn)行健身手表數(shù)據(jù)分析
健身手表(Fitness Watch)數(shù)據(jù)分析涉及分析健身可穿戴設(shè)備或智能手表收集的數(shù)據(jù)，以深入了解用戶的健康和活動(dòng)模式。這些設(shè)備可以跟蹤所走的步數(shù)、消耗的能量、步行速度等指標(biāo)。本文將帶您完成使用Python進(jìn)行Fitness Watch數(shù)據(jù)分析的任務(wù)。 Fitness Watch數(shù)據(jù)分析是健康和保健領(lǐng)域
2024年02月10日
瀏覽(19)
數(shù)據(jù)分享|R語(yǔ)言用lme4多層次（混合效應(yīng)）廣義線性模型（GLM），邏輯回歸分析教育留級(jí)調(diào)查數(shù)據(jù)...
本教程為讀者提供了使用頻率學(xué)派的廣義線性模型（GLM）的基本介紹。具體來(lái)說(shuō)，本教程重點(diǎn)介紹邏輯回歸在二元結(jié)果和計(jì)數(shù)/比例結(jié)果情況下的使用，以及模型評(píng)估的方法（點(diǎn)擊文末“閱讀原文”獲取完整代碼數(shù)據(jù) ）。本教程使用教育數(shù)據(jù)例子進(jìn)行模型的應(yīng)用。此外，本
2024年02月16日
瀏覽(26)
使用Python進(jìn)行數(shù)據(jù)分析——描述性統(tǒng)計(jì)分析
大家好，描述性統(tǒng)計(jì)分析主要是指求一組數(shù)據(jù)的平均值、中位數(shù)、眾數(shù)、極差、方差和標(biāo)準(zhǔn)差等指標(biāo)，通過(guò)這些指標(biāo)來(lái)發(fā)現(xiàn)這組數(shù)據(jù)的分布狀態(tài)、數(shù)字特征等內(nèi)在規(guī)律。在Python中進(jìn)行描述性統(tǒng)計(jì)分析，可以借助Numpy、Pandas、SciPy等科學(xué)計(jì)算模塊計(jì)算出指標(biāo)，然后用繪圖模塊Ma
2024年02月07日
瀏覽(24)

<dfn id="cofd9"></dfn>