国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<strike id="yjiep"><strike id="yjiep"></strike></strike>

<ul id="yjiep"><font id="yjiep"><tr id="yjiep"></tr></font></ul><ul id="yjiep"><font id="yjiep"></font></ul>

大數(shù)據(jù)機(jī)器學(xué)習(xí)與深度學(xué)習(xí)——回歸模型評(píng)估

2年前作者：星川皆無(wú)恙分類：Toy博客閱讀(21)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了大數(shù)據(jù)機(jī)器學(xué)習(xí)與深度學(xué)習(xí)——回歸模型評(píng)估。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

大數(shù)據(jù)機(jī)器學(xué)習(xí)與深度學(xué)習(xí)——回歸模型評(píng)估

回歸模型的性能的評(píng)價(jià)指標(biāo)主要有：MAE(平均絕對(duì)誤差)、MSE(平均平方誤差)、RMSE(平方根誤差)、R2_score。但是當(dāng)量綱不同時(shí)，RMSE、MAE、MSE難以衡量模型效果好壞，這就需要用到R2_score。

平均絕對(duì)誤差(MAE Mean Absolute Error)

是絕對(duì)誤差的平均值，能更好地反映預(yù)測(cè)值誤差的實(shí)際情況。

均方誤差(MSE mean-square error)

該統(tǒng)計(jì)參數(shù)是預(yù)測(cè)數(shù)據(jù)和原始數(shù)據(jù)對(duì)應(yīng)點(diǎn)誤差的平方和的均值。

根均方根誤差(RMSE Root Mean Square Error)

求均方誤差的根號(hào)

決定系數(shù)(R-Squared Score）

決定系數(shù)R2 score(coefficient of determination)，也稱判定系數(shù)或者擬合優(yōu)度。它是表征回歸方程在多大程度上解釋了因變量的變化，或者說(shuō)方程對(duì)觀測(cè)值的擬合程度如何。擬合優(yōu)度的有效性通常要求：自變量個(gè)數(shù):樣本數(shù)>1:10。

R2 決定系數(shù)，反映因變量的全部變異能通過(guò)回歸關(guān)系被自變量解釋的比例。

大數(shù)據(jù)機(jī)器學(xué)習(xí)與深度學(xué)習(xí)——回歸模型評(píng)估,機(jī)器學(xué)習(xí)與深度學(xué)習(xí),大數(shù)據(jù)人工智能,自然語(yǔ)言處理,機(jī)器學(xué)習(xí),深度學(xué)習(xí),回歸,人工智能,算法
根據(jù) R-Squared 的取值，來(lái)判斷模型的好壞，其取值范圍為[0,1]：

如果結(jié)果是 0，說(shuō)明模型擬合效果很差；

如果結(jié)果是 1，說(shuō)明模型無(wú)錯(cuò)誤。

一般來(lái)說(shuō)，R-Squared 越大，表示模型擬合效果越好。R-Squared 反映的是大概有多準(zhǔn)，因?yàn)?，隨著樣本數(shù)量的增加，R-Square必然增加，無(wú)法真正定量說(shuō)明準(zhǔn)確程度，只能大概定量。

所以要想決定系數(shù)R2越接近1，必須滿足MSE越小，也就是真實(shí)值與預(yù)測(cè)值相差不大，也就是模型擬合程度高，同時(shí)var方差越大，也就是我們的樣本離散程度大，對(duì)應(yīng)的我們實(shí)際采樣過(guò)程中，就是要求樣本是隨機(jī)性，以及全面性，覆蓋度廣。

注意

決定系數(shù)適用于線性回歸，單變量或者多元線性；y=ax或者y=ax1+bx2…； - 擬合模型是非線性的，不能用決定系數(shù)來(lái)評(píng)價(jià)其擬合效果，例如：BP神經(jīng)網(wǎng)絡(luò)；

當(dāng)擬合程度不行，可以調(diào)整參數(shù)或者權(quán)重-例如a,b，使預(yù)測(cè)值與真實(shí)值越接近。

其中，分子部分表示真實(shí)值與預(yù)測(cè)值的平方差之和，類似于均方差 MSE；分母部分表示真實(shí)值與均值的平方差之和，類似于方差 Var。

(R-Squared score）-深度研究

對(duì)于R-Squared score可以通俗地理解為使用均值作為誤差基準(zhǔn)，看預(yù)測(cè)誤差是否大于或者小于均值基準(zhǔn)誤差。

R2_score = 1，樣本中預(yù)測(cè)值和真實(shí)值完全相等，沒(méi)有任何誤差，表示回歸分析中自變量對(duì)因變量的解釋越好。

R2_score =0。此時(shí)分子等于分母，樣本的每項(xiàng)預(yù)測(cè)值都等于均值。

R2_score不是r的平方，也可能為負(fù)數(shù)(分子>分母)，模型等于盲猜，還不如直接計(jì)算目標(biāo)變量的平均值。

# 根據(jù)公式，我們可以寫出r2_score實(shí)現(xiàn)代碼
1- mean_squared_error(y_test,y_preditc)/ np.var(y_test)
# 也可以直接調(diào)用sklearn.metrics中的r2_score
sklearn.metrics.r2_score(y_true, y_pred, sample_weight=None, multioutput='uniform_average')

# y_true：觀測(cè)值 
# y_pred：預(yù)測(cè)值 
# sample_weight：樣本權(quán)重，默認(rèn)None
# multioutput：多維輸入輸出，可選‘raw_values’, ‘uniform_average’,‘variance_weighted’或None。默認(rèn)為’uniform_average’;

# raw_values：分別返回各維度得分 uniform_average：各輸出維度得分的平均
# variance_weighted：對(duì)所有輸出的分?jǐn)?shù)進(jìn)行平均，并根據(jù)每個(gè)輸出的方差進(jìn)行加權(quán)。

r2_score: 0.47

r2_score偏小，預(yù)測(cè)效果一般。

注意事項(xiàng)

1、R-Squared score 一般用在線性模型中(非線性模型也可以用)

2、R-Squared score 不能完全反映模型預(yù)測(cè)能力的高低,某個(gè)實(shí)際觀測(cè)的自變量取值范圍很窄，但此時(shí)所建模型的R2 很大，但這并不代表模型在外推應(yīng)用時(shí)的效果肯定會(huì)很好。

3、數(shù)據(jù)集的樣本越大，R2越大，因此，不同數(shù)據(jù)集的模型結(jié)果比較會(huì)有一定的誤差，此時(shí)可以使用Adjusted R-Square (校正決定系數(shù)),能對(duì)添加的非顯著變量給出懲罰
校正決定系數(shù)（Adjusted R-Square）是多元線性回歸模型中用于評(píng)估模型擬合優(yōu)度的一種統(tǒng)計(jì)指標(biāo)。它對(duì)決定系數(shù)（R-Square）進(jìn)行了修正，考慮了模型中使用的自變量的數(shù)量。

決定系數(shù)（R-Square）用于衡量模型對(duì)因變量變異性的解釋程度，其取值范圍在0到1之間，越接近1表示模型對(duì)數(shù)據(jù)的解釋越好。然而，當(dāng)模型中增加自變量時(shí)，R-Square的值可能會(huì)增加，即使新加入的變量對(duì)模型的解釋并不顯著。為了解決這個(gè)問(wèn)題，引入了校正決定系數(shù)。

校正決定系數(shù)

計(jì)算公式如下：

大數(shù)據(jù)機(jī)器學(xué)習(xí)與深度學(xué)習(xí)——回歸模型評(píng)估,機(jī)器學(xué)習(xí)與深度學(xué)習(xí),大數(shù)據(jù)人工智能,自然語(yǔ)言處理,機(jī)器學(xué)習(xí),深度學(xué)習(xí),回歸,人工智能,算法

其中：

( R^2 ) 是決定系數(shù)。
( n ) 是樣本數(shù)量。
( k ) 是模型中自變量的數(shù)量。
校正決定系數(shù)考慮了模型的自由度，通過(guò)對(duì)決定系數(shù)進(jìn)行修正，避免了在模型中增加自變量時(shí)導(dǎo)致模型擬合度提高的情況。因此，校正決定系數(shù)通常對(duì)模型的泛化能力提供更準(zhǔn)確的評(píng)估。

在實(shí)際應(yīng)用中，分析人員通常會(huì)綜合考慮決定系數(shù)和校正決定系數(shù)，以全面評(píng)估模型的擬合質(zhì)量和適應(yīng)性。

其中，n 是樣本數(shù)量，p 是特征數(shù)量。

Adjusted R-Square 抵消樣本數(shù)量對(duì) R-Square的影響，做到了真正的 0~1，越大越好。

python中可以直接調(diào)用。

統(tǒng)計(jì)學(xué)理論

方差(variance)：
計(jì)算公式：S2=1/n [(x1-X)2+(x2-X)2+(x3-X)2+…(xn-X)2] (X表示平均數(shù)）

方差在概率論和統(tǒng)計(jì)方差衡量隨機(jī)變量或一組數(shù)據(jù)時(shí)離散程度的度量。

概率論中方差用來(lái)度量隨機(jī)變量和其數(shù)學(xué)期望（即均值）之間的偏離程度。

統(tǒng)計(jì)中的方差（樣本方差）是每個(gè)樣本值與全體樣本值的平均數(shù)之差的平方值的平均數(shù)。

代碼實(shí)現(xiàn)

sklearn庫(kù)調(diào)用模型評(píng)估

#導(dǎo)入相應(yīng)的函數(shù)庫(kù)
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
import numpy as np
import pandas as pd

# 使用sklearn調(diào)用衡量線性回歸的MSE 、 RMSE、 MAE、r2
from math import sqrt
from sklearn.metrics import mean_absolute_error
from sklearn.metrics import mean_squared_error
from sklearn.metrics import r2_score
print("mean_absolute_error:", mean_absolute_error(y_test, y_predict))
print("mean_squared_error:", mean_squared_error(y_test, y_predict))
print("rmse:", sqrt(mean_squared_error(y_test, y_predict)))
print("r2 score:", r2_score(y_test, y_predict))

原生實(shí)現(xiàn)

# 衡量線性回歸的MSE 、 RMSE、 MAE、r2
from math import sqrt
mse = np.sum((y_test - y_predict) ** 2) / len(y_test)
rmse = sqrt(mse)
mae = np.sum(np.absolute(y_test - y_predict)) / len(y_test)
r2 = 1-mse/ np.var(y_test)#均方誤差/方差
print(" mae:",mae,"mse:",mse," rmse:",rmse," r2:",r2)

應(yīng)用文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-757810.html

y_test1=np.array(Y_true_3[:,0:1])
y_predict1=np.array(predict[:,0])
y_test2=np.array(Y_true_3[:,1:2])
y_predict2=np.array(predict[:,1])
print("ROP   : R2:%.4f"% r2_score(y_test1, y_predict1),  " MSE:%.4f"%  mean_squared_error(y_test1, y_predict1),  "RMSE:%.4f" % calc_rmse(y_test1, y_predict1))
print("Torque: R2:%.4f"% r2_score(y_test2, y_predict2),  "MSE:%.4f"%  mean_squared_error(y_test2, y_predic

到了這里，關(guān)于大數(shù)據(jù)機(jī)器學(xué)習(xí)與深度學(xué)習(xí)——回歸模型評(píng)估的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

打造你的專屬大模型，學(xué)完即可使用上崗！技術(shù)人的大模型課程（人工智能/機(jī)器學(xué)習(xí)/深度學(xué)習(xí)）
技術(shù)人的大模型課讓一部分人在大模型時(shí)代，先擁抱AI，為編程專家開(kāi)啟AI新篇章在2024年，大模型不再是可選技能，而是技術(shù)行業(yè)的必備。你是否曾在夜深人靜時(shí)想象，從一名代碼專家轉(zhuǎn)型為AI行業(yè)的引領(lǐng)者？如果你的答案是肯定的，那么這門課程正是為你量身定制，針對(duì)
2024年04月27日
瀏覽(28)
機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘03-模型性能評(píng)估指標(biāo)
概念：模型正確預(yù)測(cè)的樣本數(shù)量與總樣本數(shù)量的比例。公式：Accuracy = (TP + TN) / (TP + TN + FP + FN) TP (True Positives)：正確預(yù)測(cè)為正例的樣本數(shù)。即模型正確地將正例判定為正例。 TN (True Negatives)：正確預(yù)測(cè)為負(fù)例的樣本數(shù)。即模型正確地將負(fù)例判定為負(fù)例。 FP (False Positives)：錯(cuò)誤
2024年02月10日
瀏覽(990)
大數(shù)據(jù)、人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)關(guān)系聯(lián)系前言
1.大數(shù)據(jù)和人工智能關(guān)系 2.機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、人工智能關(guān)系 3.監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、遷移學(xué)習(xí)關(guān)系 4.機(jī)器學(xué)習(xí)具體內(nèi)容 1.數(shù)據(jù)驅(qū)動(dòng)的人工智能：人工智能系統(tǒng)需要大量的數(shù)據(jù)來(lái)進(jìn)行訓(xùn)練和學(xué)習(xí)。大數(shù)據(jù)提供了海量的信息，可以用于訓(xùn)練機(jī)器學(xué)習(xí)
2024年02月12日
瀏覽(24)
大數(shù)據(jù)機(jī)器學(xué)習(xí)與深度學(xué)習(xí)——過(guò)擬合、欠擬合及機(jī)器學(xué)習(xí)算法分類
針對(duì)模型的擬合，這里引入兩個(gè)概念：過(guò)擬合，欠擬合。過(guò)擬合：在機(jī)器學(xué)習(xí)任務(wù)中，我們通常將數(shù)據(jù)集分為兩部分：訓(xùn)練集和測(cè)試集。訓(xùn)練集用于訓(xùn)練模型，而測(cè)試集則用于評(píng)估模型在未見(jiàn)過(guò)數(shù)據(jù)上的性能。過(guò)擬合就是指模型在訓(xùn)練集上表現(xiàn)較好，但在測(cè)試集上表現(xiàn)較差的
2024年02月04日
瀏覽(49)
基于深度學(xué)習(xí)的人工智能安全：威脅檢測(cè)、攻擊防御和安全評(píng)估
作者：禪與計(jì)算機(jī)程序設(shè)計(jì)藝術(shù) 隨著人工智能技術(shù)的不斷發(fā)展，給社會(huì)帶來(lái)的影響越來(lái)越大。越來(lái)越多的企業(yè)和個(gè)人都依賴于AI產(chǎn)品或服務(wù)，同時(shí)也面臨著各種各樣的安全風(fēng)險(xiǎn)，比如身份驗(yàn)證缺失、數(shù)據(jù)泄露、惡意軟件等。如何保障AI產(chǎn)品及服務(wù)的安全，成為當(dāng)前和未來(lái)的重
2024年02月13日
瀏覽(24)
機(jī)器學(xué)習(xí)_數(shù)據(jù)升維_多項(xiàng)式回歸代碼_保險(xiǎn)案例數(shù)據(jù)說(shuō)明_補(bǔ)充_均勻分布_標(biāo)準(zhǔn)正太分布---人工智能工作筆記0038
然后我們?cè)賮?lái)看一下官網(wǎng)注意上面這個(gè)舊的,現(xiàn)在2023-05-26 17:26:31..我去看了新的官網(wǎng), scikit-learn已經(jīng)添加了很多新功能, ? ? 我們說(shuō)polynomial多項(xiàng)式回歸其實(shí)是對(duì)數(shù)據(jù),進(jìn)行升維對(duì)吧,從更多角度去看待問(wèn)題,這樣提高模型的準(zhǔn)確度. 其實(shí)y=w0x0+w1x1.. 這里就是提高了這個(gè)x的個(gè)數(shù)對(duì)吧
2024年02月06日
瀏覽(27)
大數(shù)據(jù)機(jī)器學(xué)習(xí)深度解讀ROC曲線：技術(shù)解析與實(shí)戰(zhàn)應(yīng)用
機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)在解決復(fù)雜問(wèn)題時(shí)，經(jīng)常需要評(píng)估模型的性能。其中，ROC（Receiver Operating Characteristic）曲線是一種非常有用的工具，被廣泛應(yīng)用于分類問(wèn)題中。該工具不僅在醫(yī)學(xué)檢測(cè)、信號(hào)處理中有著悠久的歷史，而且在近年來(lái)的機(jī)器學(xué)習(xí)應(yīng)用中也顯得尤為關(guān)鍵。 ROC曲線
2024年02月04日
瀏覽(30)
大數(shù)據(jù)機(jī)器學(xué)習(xí)深度解讀決策樹(shù)算法：技術(shù)全解與案例實(shí)戰(zhàn)
本文深入探討了機(jī)器學(xué)習(xí)中的決策樹(shù)算法，從基礎(chǔ)概念到高級(jí)研究進(jìn)展，再到實(shí)戰(zhàn)案例應(yīng)用，全面解析了決策樹(shù)的理論及其在現(xiàn)實(shí)世界問(wèn)題中的實(shí)際效能。通過(guò)技術(shù)細(xì)節(jié)和案例實(shí)踐，揭示了決策樹(shù)在提供可解釋預(yù)測(cè)中的獨(dú)特價(jià)值。決策樹(shù)算法是機(jī)器學(xué)習(xí)領(lǐng)域的基石之一，其強(qiáng)
2024年02月04日
瀏覽(25)
數(shù)據(jù)預(yù)處理的人工智能與深度學(xué)習(xí)：如何提高模型性能
數(shù)據(jù)預(yù)處理是人工智能(AI)和深度學(xué)習(xí)(DL)領(lǐng)域中的一個(gè)關(guān)鍵環(huán)節(jié)，它涉及到數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)歸一化、數(shù)據(jù)增強(qiáng)等多種操作，以提高模型性能。在過(guò)去的幾年里，隨著數(shù)據(jù)規(guī)模的增加和復(fù)雜性的提高，數(shù)據(jù)預(yù)處理的重要性得到了廣泛認(rèn)識(shí)。本文將從以下幾個(gè)方面進(jìn)行
2024年02月19日
瀏覽(104)
探索人工智能 | 模型訓(xùn)練使用算法和數(shù)據(jù)對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行參數(shù)調(diào)整和優(yōu)化
模型訓(xùn)練是指使用算法和數(shù)據(jù)對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行參數(shù)調(diào)整和優(yōu)化的過(guò)程。模型訓(xùn)練一般包含以下步驟：數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理、模型選擇、模型訓(xùn)練、模型評(píng)估、超參數(shù)調(diào)優(yōu)、模型部署、持續(xù)優(yōu)化。數(shù)據(jù)收集是指為機(jī)器學(xué)習(xí)或數(shù)據(jù)分析任務(wù)收集和獲取用于訓(xùn)練或分析的數(shù)
2024年02月12日
瀏覽(29)