国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析

這篇具有很好參考價(jià)值的文章主要介紹了使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

大家好,線性回歸是確定兩種或兩種以上變量之間互相依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法。根據(jù)自變量的個(gè)數(shù),可以將線性回歸分為一元線性回歸和多元線性回歸分析。

一元線性回歸:就是只包含一個(gè)自變量,且該自變量與因變量之間的關(guān)系是線性關(guān)系。例如通過(guò)廣告費(fèi)這一個(gè)自變量來(lái)預(yù)測(cè)銷(xiāo)量,就屬于一元線性回歸分析。

多元線性回歸:如果回歸分析包含兩個(gè)或以上的自變量,且每個(gè)因變量與自變量之間都是線性關(guān)系,則稱為多元線性回歸分析;例如通過(guò)肥料、灌溉等人工成本來(lái)預(yù)測(cè)產(chǎn)量,就屬于多元線性回歸。

一、線性回歸分析的思路

  • 確定因變量與自變量。比如通過(guò)人工成本費(fèi)進(jìn)行產(chǎn)量預(yù)測(cè)時(shí),人工成本費(fèi)是自變量,產(chǎn)量是因變量。

  • 確定線性回歸分析的類(lèi)型。例如在一元線性回歸分析中,只需要確定自變量與因變量的相關(guān)度為強(qiáng)相關(guān)性,即可建立一元線性回歸方程,從而確定線性回歸分析的類(lèi)型為一元線性回歸。

  • 建立線性回歸分析模型

  • 檢驗(yàn)線性回歸分析模型的擬合程度。為了判斷線性回歸分析模型是否可用于實(shí)際檢測(cè),需要檢驗(yàn)線性回歸分析模型的擬合程度,也就是對(duì)模型進(jìn)行評(píng)估,主要以這三個(gè)值作為評(píng)估標(biāo)準(zhǔn):(R-squared統(tǒng)計(jì)學(xué)中的)、Adj.R-squared(即Adiustd )、P值;其中前兩個(gè)用來(lái)衡量線性擬合的擬合程度,P值用來(lái)衡量特征變量的顯著性。

  • 利用線性回歸分析模型進(jìn)行預(yù)測(cè)。如果擬合出來(lái)的回歸分析模型的擬合度符合要求,就可以使用該模型以及計(jì)算出的系數(shù)a和b得到回歸方程,從而根據(jù)已有的自變量數(shù)據(jù)來(lái)預(yù)測(cè)需要的因變量結(jié)果。

二、一元線性回歸分析

使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析

那我們初中學(xué)過(guò)的一元一次方程y=ax+b來(lái)說(shuō):就是最簡(jiǎn)單的一元線性回歸,接下來(lái),我們以上圖數(shù)據(jù)為例,假設(shè)當(dāng)人工成本為6600元時(shí),產(chǎn)量為多少?我們下面就這一實(shí)際生產(chǎn)問(wèn)題問(wèn)題進(jìn)行一元線性回歸分析代碼演示。

確定因變量與自變量:


import pandas as pd
data= pd.read_excel('D:/shujufenxi/作物表型記錄本.xlsx',sheet_name=0,index_col='序號(hào)')
print(data.head())
使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析

我們要進(jìn)行的是根據(jù)已知的6600人工成本預(yù)測(cè)產(chǎn)量,由此可知,人工成本費(fèi)為自變量,產(chǎn)量為因變量。

確定線性回歸分析的類(lèi)型:


import pandas as pd
data= pd.read_excel('D:/shujufenxi/作物表型記錄本.xlsx',sheet_name=0,index_col='序號(hào)')
print(data.head())
# 選中自變量與因變量的數(shù)據(jù),x為自變量,y為因變量
x=data[['人工成本費(fèi)(元)']]
y=data[['產(chǎn)量(公斤)']]
# 確定線性回歸分析的類(lèi)型
corr=data.corr()
print(corr)
使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析

可以看到人工成本與產(chǎn)量之間的相關(guān)系數(shù)為0.965321,為強(qiáng)相關(guān),隨后利用Matplotlib模塊進(jìn)行繪制散點(diǎn)圖,代碼如下:


# 繪制散點(diǎn)圖
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False
plt.scatter(x,y)
plt.xlabel('人工成本費(fèi)(元)')
plt.ylabel('產(chǎn)量(公斤)')
plt.show()
使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析

建立回歸分析模型以及檢驗(yàn)線性回歸分析模型的擬合程度:


#建立回歸分析模型
from sklearn.linear_model import LinearRegression  # 需下載Scikit-Learn模塊,使用LinearRegression()函數(shù)建立線性回歸分析模型
Model=LinearRegression()
Model.fit(x,y)
#檢驗(yàn)線性回歸分析模型的擬合程度
score=Model.score(x,y)
print(score)
plt.scatter(x,y)
plt.plot(x,Model.predict(x))
plt.xlabel('人工成本費(fèi)(元)')
plt.ylabel('產(chǎn)量(公斤)')
plt.show()
使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析

可以看出模型的評(píng)分約為0.93,很接近1,擬合程度還是較高的。

使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析

可以看出大多數(shù)散點(diǎn)還是比較靠近這條直線的,說(shuō)明模型很好的捕捉到了數(shù)據(jù)特征,可以算是恰當(dāng)擬合。

利用線性回歸分析進(jìn)行預(yù)測(cè):


# 預(yù)測(cè),也可以進(jìn)行同時(shí)預(yù)測(cè)多個(gè),如下
y=Model.predict([[6600],[15000],[8888]])
print(y)
使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析

三、多元線性回歸分析

使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析

下面我們利用此虛擬數(shù)據(jù)假設(shè)當(dāng)農(nóng)藥成本費(fèi)、肥料成本費(fèi)、田間管理成本費(fèi)分別為3400、2900、3100時(shí)的產(chǎn)量為多少,下面我們將進(jìn)行完整代碼演示:


## 確定自變量與因變量
import pandas as pd
data= pd.read_excel('D:/shujufenxi/作物表型記錄本.xlsx',sheet_name=1,index_col='序號(hào)')
print(data.head())
# 選中自變量與因變量的數(shù)據(jù),x為自變量,y為因變量
x=data[['農(nóng)藥成本費(fèi)(元)','肥料成本費(fèi)(元)','田間管理成本費(fèi)(元)']]
y=data[['產(chǎn)量(公斤)']]
# 確定線性回歸分析的類(lèi)型——圖3
corr=data.corr()
print(corr)
# 繪制散點(diǎn)圖——圖1
import matplotlib.pyplot as plt
import seaborn as sns
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False
sns.pairplot(data,x_vars=['農(nóng)藥成本費(fèi)(元)','肥料成本費(fèi)(元)','田間管理成本費(fèi)(元)'],y_vars='產(chǎn)量(公斤)')
plt.show()

#建立回歸分析模型
from sklearn.linear_model import LinearRegression  # 需下載Scikit-Learn模塊,使用LinearRegression()函數(shù)建立線性回歸分析模型
Model=LinearRegression()
Model.fit(x,y)
#檢驗(yàn)線性回歸分析模型的擬合程度——圖3
score=Model.score(x,y)
print(score)
# 繪制擬合成果圖——圖2
sns.pairplot(data,x_vars=['農(nóng)藥成本費(fèi)(元)','肥料成本費(fèi)(元)','田間管理成本費(fèi)(元)'],y_vars='產(chǎn)量(公斤)',kind='reg')# kind參數(shù)可添加一條最佳擬合直線和95%的置信帶,從而更直觀的展示模型的擬合程度
plt.show()

# 預(yù)測(cè),也可以進(jìn)行同時(shí)預(yù)測(cè)多個(gè),如下——圖3
y=Model.predict([[3400,2900,3100]])
print(y)
使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析
使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析
使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析

以上就是根據(jù)此數(shù)據(jù)所進(jìn)行的多元線性回歸分析以及模型預(yù)測(cè);在上面第二個(gè)圖中,我們從置信帶的寬度來(lái)看,農(nóng)藥成本費(fèi)與產(chǎn)量的線性關(guān)系較強(qiáng),肥料成本費(fèi)、田間管理成本費(fèi)兩者與產(chǎn)量的線性關(guān)系則較弱。

本文所講對(duì)模型進(jìn)行擬合在實(shí)際生產(chǎn)中具有重大意義,不僅可以利用已知變量預(yù)測(cè)未知變量,還能根據(jù)擬合結(jié)果判斷所得數(shù)據(jù)是否具有生產(chǎn)意義。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-409903.html

到了這里,關(guān)于使用Python進(jìn)行數(shù)據(jù)分析——線性回歸分析的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 基于多元線性回歸的Boston房?jī)r(jià)數(shù)據(jù)分析

    基于多元線性回歸的Boston房?jī)r(jià)數(shù)據(jù)分析

    Boston房?jī)r(jià)數(shù)據(jù)是R語(yǔ)言中一類(lèi)重要的數(shù)據(jù),常被用來(lái)做各種方法分析,即它是波士頓不同地區(qū)的506個(gè)家庭住房信息,其中包括影響房?jī)r(jià)的14個(gè)因素如城鎮(zhèn)的人均犯罪率、氮氧化合物濃度、城鎮(zhèn)黑人的比例、低教育程度的人口比例等,而且每個(gè)因素對(duì)房?jī)r(jià)的影響都是不同顯著程度

    2024年01月19日
    瀏覽(28)
  • 大數(shù)據(jù)分析案例-基于多元線性回歸算法構(gòu)建廣告投放收益模型

    大數(shù)據(jù)分析案例-基于多元線性回歸算法構(gòu)建廣告投放收益模型

    ? ???♂? 個(gè)人主頁(yè):@艾派森的個(gè)人主頁(yè) ???作者簡(jiǎn)介:Python學(xué)習(xí)者 ?? 希望大家多多支持,我們一起進(jìn)步!?? 如果文章對(duì)你有幫助的話, 歡迎評(píng)論 ??點(diǎn)贊???? 收藏 ??加關(guān)注+ 目錄 1.項(xiàng)目背景 2.項(xiàng)目簡(jiǎn)介 2.1

    2024年02月03日
    瀏覽(26)
  • 鮑魚(yú)數(shù)據(jù)集案例分析-預(yù)測(cè)鮑魚(yú)年齡(線性回歸/梯度下降法實(shí)操)

    鮑魚(yú)數(shù)據(jù)集案例分析-預(yù)測(cè)鮑魚(yú)年齡(線性回歸/梯度下降法實(shí)操)

    數(shù)據(jù)集來(lái)源UCI Machine Learning Repository: Abalone Data Set 目錄 一、數(shù)據(jù)集探索性分析 二、鮑魚(yú)數(shù)據(jù)預(yù)處理 1.對(duì)sex特征進(jìn)行OneHot編碼,便于后續(xù)模型納入啞變量 2.添加取值為1的特征 3.?計(jì)算鮑魚(yú)的真實(shí)年齡 4.篩選特征 5.?將鮑魚(yú)數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集 三、實(shí)現(xiàn)線性回歸和嶺回歸

    2024年02月08日
    瀏覽(149)
  • 使用Python進(jìn)行數(shù)據(jù)分析——方差分析

    使用Python進(jìn)行數(shù)據(jù)分析——方差分析

    大家好,方差分析可以用來(lái)判斷幾組觀察到的數(shù)據(jù)或者處理的結(jié)果是否存在顯著差異。本文介紹的方差分析(Analysis of Variance,簡(jiǎn)稱ANOVA)就是用于檢驗(yàn)兩組或者兩組以上樣本的均值是否具備顯著性差異的一種數(shù)理統(tǒng)計(jì)方法。 根據(jù)影響試驗(yàn)條件的因素個(gè)數(shù)可以將方差分析分為

    2024年02月15日
    瀏覽(25)
  • 使用Python批量進(jìn)行數(shù)據(jù)分析

    使用Python批量進(jìn)行數(shù)據(jù)分析

    知識(shí)延伸 1、sort_value()是pandas模塊中DataFrame對(duì)象的函數(shù),用于將數(shù)據(jù)區(qū)域按照某個(gè)字段的數(shù)據(jù)進(jìn)行排序,這個(gè)字段可以是行字段,也可以是列字段。 語(yǔ)法格式: sort_value(by=\\\'##\\\',axis=0,ascending=True,inplace=False,na_position=\\\'last\\\') 參數(shù) 說(shuō)明 by 要排序的列名或索引值 axis 如果省略或者為

    2024年02月10日
    瀏覽(25)
  • 如何使用Python進(jìn)行數(shù)據(jù)分析?

    要使用Python進(jìn)行數(shù)據(jù)分析,可以按照以下步驟進(jìn)行: 安裝Python:首先,你需要安裝Python解釋器??梢詮腜ython官方網(wǎng)站下載并安裝適合你操作系統(tǒng)的Python版本。 安裝數(shù)據(jù)分析庫(kù):Python有許多強(qiáng)大的數(shù)據(jù)分析庫(kù),如NumPy、Pandas和Matplotlib。使用pip命令或包管理工具安裝這些庫(kù)。 導(dǎo)

    2024年02月10日
    瀏覽(21)
  • Python小知識(shí) -  使用Python進(jìn)行數(shù)據(jù)分析

    Python小知識(shí) - 使用Python進(jìn)行數(shù)據(jù)分析

    使用Python進(jìn)行數(shù)據(jù)分析 數(shù)據(jù)分析簡(jiǎn)介 數(shù)據(jù)分析,又稱為信息分析,是指對(duì)數(shù)據(jù)進(jìn)行綜合處理、歸納提煉、概括總結(jié)的過(guò)程,是數(shù)據(jù)處理的第一步。 數(shù)據(jù)分析的目的是了解數(shù)據(jù)的內(nèi)在規(guī)律,為數(shù)據(jù)挖掘,并應(yīng)用于商業(yè)決策、科學(xué)研究等提供決策依據(jù)。 數(shù)據(jù)分析的基本方法 數(shù)

    2024年02月10日
    瀏覽(22)
  • 使用Python進(jìn)行健身手表數(shù)據(jù)分析

    使用Python進(jìn)行健身手表數(shù)據(jù)分析

    健身手表(Fitness Watch)數(shù)據(jù)分析涉及分析健身可穿戴設(shè)備或智能手表收集的數(shù)據(jù),以深入了解用戶的健康和活動(dòng)模式。這些設(shè)備可以跟蹤所走的步數(shù)、消耗的能量、步行速度等指標(biāo)。本文將帶您完成使用Python進(jìn)行Fitness Watch數(shù)據(jù)分析的任務(wù)。 Fitness Watch數(shù)據(jù)分析是健康和保健領(lǐng)域

    2024年02月10日
    瀏覽(19)
  • 數(shù)據(jù)分享|R語(yǔ)言用lme4多層次(混合效應(yīng))廣義線性模型(GLM),邏輯回歸分析教育留級(jí)調(diào)查數(shù)據(jù)...

    數(shù)據(jù)分享|R語(yǔ)言用lme4多層次(混合效應(yīng))廣義線性模型(GLM),邏輯回歸分析教育留級(jí)調(diào)查數(shù)據(jù)...

    本教程為讀者提供了使用頻率學(xué)派的廣義線性模型(GLM)的基本介紹。具體來(lái)說(shuō),本教程重點(diǎn)介紹邏輯回歸在二元結(jié)果和計(jì)數(shù)/比例結(jié)果情況下的使用,以及模型評(píng)估的方法 ( 點(diǎn)擊文末“閱讀原文”獲取完整 代碼數(shù)據(jù) )。 本教程使用教育數(shù)據(jù)例子進(jìn)行模型的應(yīng)用。此外,本

    2024年02月16日
    瀏覽(26)
  • 使用Python進(jìn)行數(shù)據(jù)分析——描述性統(tǒng)計(jì)分析

    使用Python進(jìn)行數(shù)據(jù)分析——描述性統(tǒng)計(jì)分析

    大家好,描述性統(tǒng)計(jì)分析主要是指求一組數(shù)據(jù)的平均值、中位數(shù)、眾數(shù)、極差、方差和標(biāo)準(zhǔn)差等指標(biāo),通過(guò)這些指標(biāo)來(lái)發(fā)現(xiàn)這組數(shù)據(jù)的分布狀態(tài)、數(shù)字特征等內(nèi)在規(guī)律。在Python中進(jìn)行描述性統(tǒng)計(jì)分析,可以借助Numpy、Pandas、SciPy等科學(xué)計(jì)算模塊計(jì)算出指標(biāo),然后用繪圖模塊Ma

    2024年02月07日
    瀏覽(24)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包