混淆矩陣簡介
混淆矩陣是ROC曲線繪制的基礎(chǔ),同時它也是衡量分類型模型準(zhǔn)確度中最基本,最直觀,計算最簡單的方法。
可以簡單理解為:將一個分類模型的預(yù)測結(jié)果與正確結(jié)果做對比,將預(yù)測正確的統(tǒng)計量和預(yù)測錯誤的統(tǒng)計量分別寫入一張矩陣圖中,得到的這張圖就是混淆矩陣了。
混淆矩陣的使用情況:因為混淆矩陣是用來評判模型結(jié)果的,屬于模型評估的一部分。因此,混淆矩陣多用于判斷分類器(Classifier)的優(yōu)劣,適用于分類型的數(shù)據(jù)模型有:分類樹(Classification Tree)、邏輯回歸(Logistic Regression)、線性判別分析(Linear Discriminant Analysis)等。
混淆矩陣及其參數(shù)
以分類中最簡單的二分類為例,我們的模型訓(xùn)練完之后會進行“0”和“1”的判斷,專業(yè)詞語是positive和negative的判斷。
我們通過樣本可以直接知道真實情況下,哪些數(shù)據(jù)結(jié)果是positive,哪些結(jié)果是negative。同時,我們也可以通過神經(jīng)網(wǎng)絡(luò)或者其它模型跑出結(jié)果,進而可以知道模型認(rèn)為這些數(shù)據(jù)哪些是positive,哪些是negative。
這樣就能得到這樣四個基礎(chǔ)指標(biāo):
1、真實值是positive,模型認(rèn)為是positive的數(shù)量(True Positive=TP)
2、真實值是positive,模型認(rèn)為是negative的數(shù)量(False Negative=FN):這就是統(tǒng)計學(xué)上的第二類錯誤(Type II Error)
3、真實值是negative,模型認(rèn)為是positive的數(shù)量(False Positive=FP):這就是統(tǒng)計學(xué)上的第一類錯誤(Type I Error)
4、真實值是negative,模型認(rèn)為是negative的數(shù)量(True Negative=TN)
將這四個指標(biāo)一起呈現(xiàn)在表格中,就能得到如下這樣一個矩陣,我們稱它為混淆矩陣(Confusion Matrix):
混淆矩陣的指標(biāo)意義:
根據(jù)四個指標(biāo)的含義,很容易看出TP和TN的值越大越好;FP和FN的值是越小越好了。
混淆矩陣的其他指標(biāo)
根據(jù)以上四個基本指標(biāo),混淆矩陣還延申出了另外四個指標(biāo):
準(zhǔn)確率(Accuracy)、精確率(Precision)、靈敏度(Sensitivity)、
特異度(Specificity)
四個參數(shù)的計算方式和意義如下便所示:文章來源:http://www.zghlxwxcb.cn/news/detail-437322.html
參考:
https://blog.csdn.net/upupyon996deqing/article/details/124768166
https://blog.csdn.net/Orange_Spotty_Cat/article/details/80520839文章來源地址http://www.zghlxwxcb.cn/news/detail-437322.html
到了這里,關(guān)于分類模型之混淆矩陣(Confusion Matrix)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!