一:關(guān)于P-R曲線:
? ? 1:1:何為P-R曲線:
? ? ?P為precision即精準率(查準率),R為recall即召回率,所以P-R曲線是反映了準確率與召回率之間的關(guān)系。一般橫坐標為recall,縱坐標為precision。P-R曲線?
? ? 1.2:P-R曲線作用:
? ? ?PR曲線常被用在信息提取領(lǐng)域,同時當我們的數(shù)據(jù)集中類別分布不均衡時我們可以用PR曲線? ? ? ? ?代替。是數(shù)據(jù)挖掘中常見的評價指標。?
? ? 1.3:如何計算P值和R值:
? ? ?首先了解混淆矩陣:
? ? 計算公式;
? ? P(精準率):
? ? R(召回率)
? ? ?如何理解P-R曲線(如圖):
? ? 優(yōu)劣對比:
? ? 1:曲線越靠近右上方,性能越好。(例如上圖黑色曲線)
? ? 2:當一個曲線被另一個曲線完全包含了,則后者性能優(yōu)于前者。(例如橘藍曲線,橘色優(yōu)于藍? ? ? 色)
? ? 3:如果曲線發(fā)生交叉(黑橘曲線),判斷依據(jù):
? ? ? ? 3.1:根據(jù)曲線下方面積大小判斷,面積更大的更優(yōu)于面積小的。
? ? ? ? 3.2:根據(jù)平衡點F判斷:平衡點是查準率與查重率相等時的點。F計算公式為F?= 2 * P * R /(? ? ? ? ? ? P?+R ),F(xiàn)值越大,性能越好。
二:關(guān)于Roc曲線:
? ? ? ?2.1:何為Roc曲線:
? ? ?? ?Roc全稱Receiver Operating Characteristic,即接收器操做特征曲線,坐標圖式的分析工具。
? ? ? ?2.2:Roc作用:
? ? ? ?在機器學習(machine learning)和數(shù)據(jù)挖掘(data mining)領(lǐng)域同樣是對學習器的泛化性能? ? ? ? ?進行評估
? ? ? ?2.3:計算公式:? ? ? ??
? ? ? ? ? ?真正率:?
? ? ? ? ? ?
? ? ? ? ? ?假正率:
?
? ? ? ? ? 如何理解Roc曲線(如圖):
?
? ? ? ?當ROC曲線接近于(1,0)點,表明模型泛化性能越好,接近對角線時,說明模型的預測結(jié)果為? ? ? ? ? ?隨機預測結(jié)果.
? ? ? ?優(yōu)劣對比:
? ? ? ?1:當一個曲線被另一個曲線完全包含了,則后者性能優(yōu)于前者。
? ? ? ?2:ROC曲線下方的面積(AUC)可以用來作為評估模型模型性能的指標.如當兩個模型? ? ? ? ? ? ? ?的ROC曲線發(fā)生交叉,則很難說哪一個模型更好,這時候可以用AUC來作為一個比較? ? ? ? ? ? ? ?合理的判據(jù)
三:兩者曲線對比:
1:pr曲線因為涉及到精確率precision計算,容易受到樣本分布的影響。而roc曲線本質(zhì)上是正樣本或者負樣本召回率計算,不收樣本分布的影響。
2:ROC曲線主要應用于測試集中的樣本分布的較為均勻的情況,且當測試集中的正負樣本的分布變化的時候,ROC曲線能夠保持不變。
3:實際問題中,正負樣本數(shù)量往往很不均衡,P-R曲線的變化就會非常大,而ROC曲線則能夠更加穩(wěn)定地反映模型本身的好壞。
4:當正負樣本比例失調(diào)時,ROC曲線變化不大,此時用PR曲線更加能反映出分類器性能的好壞。文章來源:http://www.zghlxwxcb.cn/news/detail-641731.html
? ?文章來源地址http://www.zghlxwxcb.cn/news/detail-641731.html
到了這里,關(guān)于機器學習:關(guān)于P-R曲線和Roc曲線的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!