国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

成為AI產(chǎn)品經(jīng)理——模型評(píng)估(混淆矩陣)

這篇具有很好參考價(jià)值的文章主要介紹了成為AI產(chǎn)品經(jīng)理——模型評(píng)估(混淆矩陣)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

一、混淆矩陣

1.混淆矩陣的介紹

混淆矩陣有兩個(gè)定義positive(正例)negative(反例)。分別代表模型結(jié)果的好和壞。

下圖就是一個(gè)分類問題的混淆矩陣。橫行代表真實(shí)的情況,而豎行代表預(yù)測(cè)的結(jié)果。

成為AI產(chǎn)品經(jīng)理——模型評(píng)估(混淆矩陣),AI產(chǎn)品經(jīng)理,人工智能,產(chǎn)品經(jīng)理

為了便于理解,我在這里舉一個(gè)分出瓜的好壞的分類問題。

TP:True Positive,真正例。表示這個(gè)瓜實(shí)際上是一個(gè)好瓜,預(yù)測(cè)出來的結(jié)果也是好瓜,所以它是一個(gè)真的好瓜,是一個(gè)真正例。預(yù)測(cè)結(jié)果正確。

FP:False Positive,假正例。表示這個(gè)瓜本身是一個(gè)壞瓜,預(yù)測(cè)結(jié)果卻是一個(gè)好瓜,所以它是一個(gè)假的好瓜,是一個(gè)假正例。預(yù)測(cè)結(jié)果錯(cuò)誤。

FN:False Negative,假反例。表示這個(gè)瓜本身是一個(gè)好瓜,預(yù)測(cè)結(jié)果是壞瓜,所以它是一個(gè)假的壞瓜,是一個(gè)假反例。預(yù)測(cè)結(jié)果錯(cuò)誤。

TN:Truen Negative,真反例。表示這個(gè)瓜本身是一個(gè)壞瓜,預(yù)測(cè)結(jié)果也是一個(gè)壞瓜,所以它是一個(gè)真的壞瓜,是一個(gè)真反例。預(yù)測(cè)結(jié)果正確。

需要明確,明確T和F代表模型預(yù)測(cè)結(jié)果的對(duì)錯(cuò),P和N代表模型預(yù)測(cè)出來的結(jié)果。

接下來,我們舉個(gè)例子,便于我們學(xué)習(xí)混淆矩陣指標(biāo):準(zhǔn)確率、精準(zhǔn)率和召回率。

有100個(gè)瓜,實(shí)際上由40個(gè)好瓜,60個(gè)壞瓜。但是模型預(yù)測(cè)出來的結(jié)果為50個(gè)好瓜,50個(gè)壞瓜。在這50個(gè)好瓜里面,有30個(gè)預(yù)測(cè)對(duì)了,有20個(gè)預(yù)測(cè)錯(cuò)了。

成為AI產(chǎn)品經(jīng)理——模型評(píng)估(混淆矩陣),AI產(chǎn)品經(jīng)理,人工智能,產(chǎn)品經(jīng)理

此時(shí)預(yù)測(cè)的50個(gè)好瓜里面,30個(gè)預(yù)測(cè)對(duì)了,即真好瓜(TP);20個(gè)預(yù)測(cè)錯(cuò)了,即假好瓜。 所以TP = 30,F(xiàn)P = 20。?

成為AI產(chǎn)品經(jīng)理——模型評(píng)估(混淆矩陣),AI產(chǎn)品經(jīng)理,人工智能,產(chǎn)品經(jīng)理

?我們可以知道,40個(gè)好瓜=真的好瓜+預(yù)測(cè)錯(cuò)的壞瓜;60個(gè)壞瓜 = 真的壞瓜+假的好瓜。如下圖:

成為AI產(chǎn)品經(jīng)理——模型評(píng)估(混淆矩陣),AI產(chǎn)品經(jīng)理,人工智能,產(chǎn)品經(jīng)理

根據(jù)以上式子,我們計(jì)算出了混淆矩陣所有的值。

成為AI產(chǎn)品經(jīng)理——模型評(píng)估(混淆矩陣),AI產(chǎn)品經(jīng)理,人工智能,產(chǎn)品經(jīng)理

根據(jù)以上條件,我們能夠?qū)懗龌煜仃嚒?/p>

成為AI產(chǎn)品經(jīng)理——模型評(píng)估(混淆矩陣),AI產(chǎn)品經(jīng)理,人工智能,產(chǎn)品經(jīng)理

我們期待的結(jié)果是預(yù)測(cè)結(jié)果和真實(shí)結(jié)果相一致,但是往往不太可能,所以我們需要評(píng)估的好壞,這里我們需要用到混淆矩陣的指標(biāo):準(zhǔn)確率、精確率、召回率。?

2.準(zhǔn)確率

準(zhǔn)確率是預(yù)測(cè)準(zhǔn)確的樣本數(shù)在所有預(yù)測(cè)樣本數(shù)的比例。在我們這里就是預(yù)測(cè)的真的好瓜和真的壞瓜在總瓜數(shù)的占比。

準(zhǔn)確率的計(jì)算公式為:??成為AI產(chǎn)品經(jīng)理——模型評(píng)估(混淆矩陣),AI產(chǎn)品經(jīng)理,人工智能,產(chǎn)品經(jīng)理

通過準(zhǔn)確率我們可以看出模型的分類能力。

但是準(zhǔn)確率的弊端是:如果在樣本不均衡的情況下,占比大的對(duì)樣本的影響比較大。

考慮一個(gè)極端的例子,其中有100個(gè)樣本,其中99個(gè)屬于類別A,1個(gè)屬于類別B。如果一個(gè)模型將所有樣本都預(yù)測(cè)為類別A,那么它的分子中,預(yù)測(cè)準(zhǔn)確的A樣本為99,預(yù)測(cè)準(zhǔn)確的B樣本為0,除以分母100。成為AI產(chǎn)品經(jīng)理——模型評(píng)估(混淆矩陣),AI產(chǎn)品經(jīng)理,人工智能,產(chǎn)品經(jīng)理

準(zhǔn)確率將是99%。盡管準(zhǔn)確率很高,但模型對(duì)于類別B的預(yù)測(cè)幾乎完全失敗。所以這是不對(duì)的。

這種情況下,我們需要借助精準(zhǔn)率(precision)。

3.精確率

精準(zhǔn)率(precision),是用來計(jì)算模型預(yù)測(cè)的多準(zhǔn)的指標(biāo),又名查準(zhǔn)率。

精準(zhǔn)率的計(jì)算公式為:成為AI產(chǎn)品經(jīng)理——模型評(píng)估(混淆矩陣),AI產(chǎn)品經(jīng)理,人工智能,產(chǎn)品經(jīng)理

精確率關(guān)注的是在所有模型認(rèn)為是正類別的樣本中,有多大比例是真實(shí)的正類別。因此,精確率通常被解釋為模型有多準(zhǔn)確地"查準(zhǔn)"了正類別,即模型有多能夠確保它的正類別預(yù)測(cè)是準(zhǔn)確的。

在一些應(yīng)用中,比如垃圾郵件過濾,我們希望模型盡可能地準(zhǔn)確地標(biāo)識(shí)出正類別(即真正的垃圾郵件),同時(shí)避免將負(fù)類別(即正常郵件)錯(cuò)誤地分類為正類別。在這種情況下,我們希望精確率盡可能高,以確保模型的正類別預(yù)測(cè)是可靠的。

3.召回率?

如果說精確度是模型預(yù)測(cè)的多準(zhǔn)的指標(biāo),那么召回率就是模型廣度的指標(biāo),又被稱為查全率。

召回率的計(jì)算公式為:成為AI產(chǎn)品經(jīng)理——模型評(píng)估(混淆矩陣),AI產(chǎn)品經(jīng)理,人工智能,產(chǎn)品經(jīng)理?

公式表示需要分類的類別,在實(shí)際的該種類總數(shù)中,占比多少。好瓜在實(shí)際好瓜的總數(shù)是多少。所以召回率(查全率)是指模型在多大程度上能夠預(yù)測(cè)出我需要的類別。

比如說:我有100個(gè)好瓜,你識(shí)別出50個(gè),那么你的就在識(shí)別出我所需要的類別的能力就有50%。?

在實(shí)際的評(píng)估工作中,我們通常使用精確率和召回率來評(píng)估模型的效果。通過召回率看找到了多少我們想要找的好瓜,通過精確率來看我們找好瓜有多準(zhǔn)。

召回率關(guān)注的是在實(shí)際為正類別的樣本中,模型有多大程度地能夠成功地識(shí)別出來。因此,召回率通常被解釋為模型有多好地"查找"或"捕捉"了正類別,即模型有多能夠找到所有實(shí)際存在的正類別樣本。

在一些應(yīng)用中,如醫(yī)學(xué)診斷或欺詐檢測(cè),對(duì)于正類別的遺漏是不可接受的,因?yàn)檫@可能導(dǎo)致嚴(yán)重的后果。在這種情況下,我們希望模型的召回率盡可能高,以確保盡可能多地捕捉到所有真實(shí)的正類別。

由于精確率和召回率相互矛盾。模型如果想要查找的更準(zhǔn)確,會(huì)減少識(shí)別的范圍,所以精準(zhǔn)率高,召回率低;反之,如果想要召回率高一點(diǎn),那么精確率也會(huì)隨之下降。

所以我們一般給算法同學(xué)提需求的時(shí)候會(huì)同時(shí)考慮。比如:30%的召回率下精準(zhǔn)率提升5倍。

4.F1值

F1指標(biāo)可以綜合反映召回率和精準(zhǔn)率,F1值越高,代表模型在精確率和召回率的綜合表現(xiàn)越高。

F1的計(jì)算公式:成為AI產(chǎn)品經(jīng)理——模型評(píng)估(混淆矩陣),AI產(chǎn)品經(jīng)理,人工智能,產(chǎn)品經(jīng)理

5.總結(jié)?

準(zhǔn)確率:比較容易理解,在樣本不均衡的時(shí)候指標(biāo)偏差過大。

精確率:模型預(yù)測(cè)的準(zhǔn)確度。寧肯不預(yù)測(cè),也不能預(yù)測(cè)錯(cuò),秉持寧缺毋濫的原則。比如在刷臉支付的場(chǎng)景下,我們寧可檢測(cè)不通過,而不能預(yù)測(cè)出錯(cuò)。

召回率:關(guān)注篩選的結(jié)果是不是全面的場(chǎng)景,秉持寧可錯(cuò)殺一千,也不放過一個(gè)的原則。

成為AI產(chǎn)品經(jīng)理——模型評(píng)估(混淆矩陣),AI產(chǎn)品經(jīng)理,人工智能,產(chǎn)品經(jīng)理

PS:如果對(duì)于這幾個(gè)指標(biāo)還是不明白,推薦大家看這篇博文,講的比較清晰。

準(zhǔn)確率,精準(zhǔn)率,召回率,真正率,假正率,ROC/AUC-CSDN博客

參考文獻(xiàn): 劉海豐——《成為AI產(chǎn)品經(jīng)理》文章來源地址http://www.zghlxwxcb.cn/news/detail-773211.html

到了這里,關(guān)于成為AI產(chǎn)品經(jīng)理——模型評(píng)估(混淆矩陣)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 分類模型評(píng)估(混淆矩陣, precision, recall, f1-score)的原理和Python實(shí)現(xiàn)

    當(dāng)我們已經(jīng)獲取到一個(gè)分類模型的預(yù)測(cè)值,可以通過不同指標(biāo)來進(jìn)行評(píng)估。 往往衡量二分類模型是基于以下的混淆矩陣概念: True Positive:真實(shí)值為正、預(yù)測(cè)值為正(真陽(yáng)性) False Positive:真實(shí)值為負(fù)、預(yù)測(cè)值為正(假陽(yáng)性) False Negative:真實(shí)值為正、預(yù)測(cè)值為負(fù)(假陰性)

    2024年02月04日
    瀏覽(27)
  • 【超詳細(xì)】機(jī)器學(xué)習(xí)sklearn之分類模型評(píng)估 混淆矩陣、ROC曲線、召回率與精度、F1分?jǐn)?shù)

    【超詳細(xì)】機(jī)器學(xué)習(xí)sklearn之分類模型評(píng)估 混淆矩陣、ROC曲線、召回率與精度、F1分?jǐn)?shù)

    機(jī)器學(xué)習(xí)之分類模型的評(píng)估 學(xué)習(xí)分類模型評(píng)估的方法: 1、混淆矩陣 2、分類結(jié)果匯總 3、ROC曲線 4、召回率與精度 5、F1分?jǐn)?shù) 一、評(píng)估分類器性能的度量 1、真正(true positive, TP)或f++,對(duì)應(yīng)的是被分類模型正確預(yù)測(cè)的正樣本數(shù)。 2、假負(fù)(false negative, FN)或f±對(duì)應(yīng)的是被分類模型錯(cuò)

    2023年04月08日
    瀏覽(27)
  • 深度學(xué)習(xí)之卷積神經(jīng)網(wǎng)絡(luò)中常用模型評(píng)估指標(biāo)(混淆矩陣,精確率,召回率,特異度計(jì)算方法)——python代碼

    深度學(xué)習(xí)之卷積神經(jīng)網(wǎng)絡(luò)中常用模型評(píng)估指標(biāo)(混淆矩陣,精確率,召回率,特異度計(jì)算方法)——python代碼

    深度學(xué)習(xí)之卷積神經(jīng)網(wǎng)絡(luò)中常用模型評(píng)估指標(biāo)(混淆矩陣,精確率,召回率,特異度計(jì)算方法): 混淆矩陣,精確率,召回率,特異度作為卷積神經(jīng)網(wǎng)絡(luò)的模型性能評(píng)價(jià)指標(biāo),它們的計(jì)算和繪制具有非常重要的意義,特別是在寫論文的時(shí)候,我們往往需要這些指標(biāo)來證明我們模

    2024年02月06日
    瀏覽(26)
  • 大學(xué)生畢業(yè)后想成為產(chǎn)品經(jīng)理?那你得先從以下幾個(gè)方面入手!

    產(chǎn)品經(jīng)理,一個(gè)改變世界的職位:QQ、百度、微信、360·······這一個(gè)個(gè)改變世界的產(chǎn)品其背后都是響當(dāng)當(dāng)?shù)漠a(chǎn)品經(jīng)理:李彥宏、馬化騰、張小龍、周鴻煒。他們?cè)诨ヂ?lián)網(wǎng)世界里改變著人們的生活方式,也同時(shí)在改變著這世界的趨勢(shì)。 尤其在這幾年,隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展

    2024年02月08日
    瀏覽(23)
  • 產(chǎn)品經(jīng)理內(nèi)容分享(六):AI產(chǎn)品經(jīng)理需必備那些能力

    產(chǎn)品經(jīng)理內(nèi)容分享(六):AI產(chǎn)品經(jīng)理需必備那些能力

    目錄 必備的AI技術(shù)知識(shí) 第一章:AI產(chǎn)品經(jīng)理是否需要懂技術(shù)及其程度 第二章:AI產(chǎn)品經(jīng)理必備的AI技術(shù)基礎(chǔ)知識(shí)——基礎(chǔ)算法與機(jī)器學(xué)習(xí)方法 第三章:AI產(chǎn)品經(jīng)理必須要懂的AI技術(shù)知識(shí)——場(chǎng)景應(yīng)用 第四章:AI算法與模型的關(guān)系 第五章:AI產(chǎn)品經(jīng)理如何學(xué)習(xí)技術(shù)知識(shí) 第六章:

    2024年02月19日
    瀏覽(18)
  • AI時(shí)代產(chǎn)品經(jīng)理升級(jí)之道:ChatGPT讓產(chǎn)品經(jīng)理插上翅膀

    AI時(shí)代產(chǎn)品經(jīng)理升級(jí)之道:ChatGPT讓產(chǎn)品經(jīng)理插上翅膀

    ?? 個(gè)人網(wǎng)站:【工具大全】【游戲大全】【神級(jí)源碼資源網(wǎng)】 ?? 前端學(xué)習(xí)課程:??【28個(gè)案例趣學(xué)前端】【400個(gè)JS面試題】 ?? 尋找學(xué)習(xí)交流、摸魚劃水的小伙伴,請(qǐng)點(diǎn)擊【摸魚學(xué)習(xí)交流群】 AI時(shí)代的產(chǎn)品經(jīng)理面臨著前所未有的機(jī)遇和挑戰(zhàn)。隨著人工智能技術(shù)的不斷發(fā)展和

    2024年02月06日
    瀏覽(23)
  • AI產(chǎn)品經(jīng)理-借力

    AI產(chǎn)品經(jīng)理-借力

    AI產(chǎn)品經(jīng)理-借力:學(xué)會(huì)善用供應(yīng)商改造自有產(chǎn)品 1.整個(gè)項(xiàng)目的工作方法 2. 項(xiàng)目啟動(dòng) - 行業(yè)調(diào)研 ? 3. 項(xiàng)目啟動(dòng) - 供應(yīng)商選型

    2024年02月03日
    瀏覽(28)
  • 混淆矩陣、精確率、召回率和F1值:如何評(píng)估分類器的性能?

    混淆矩陣、精確率、召回率和F1值:如何評(píng)估分類器的性能?

    ??覺得內(nèi)容不錯(cuò)的話,歡迎點(diǎn)贊收藏加關(guān)注??????,后續(xù)會(huì)繼續(xù)輸入更多優(yōu)質(zhì)內(nèi)容?? ??有問題歡迎大家加關(guān)注私戳或者評(píng)論(包括但不限于NLP算法相關(guān),linux學(xué)習(xí)相關(guān),讀研讀博相關(guān)......)?? (封面圖由文心一格生成) 在機(jī)器學(xué)習(xí)中,分類是一項(xiàng)非常重要的任務(wù)。在

    2024年02月02日
    瀏覽(28)
  • 【ChatGPT】萬(wàn)字長(zhǎng)文揭秘 GPT 背后:為何“大模型” 就一下子成為了引領(lǐng)人工智能 AI2.0時(shí)代熱門技術(shù)?

    【ChatGPT】萬(wàn)字長(zhǎng)文揭秘 GPT 背后:為何“大模型” 就一下子成為了引領(lǐng)人工智能 AI2.0時(shí)代熱門技術(shù)?

    GPT (Generative Pre-trained Transformer) ,生成式預(yù)訓(xùn)練Transformer: 是一種基于 深度學(xué)習(xí) 的 自然語(yǔ)言處理模型 ,GPT 由 OpenAI 開發(fā)。 GPT 是一種基于 Transformer 模型的語(yǔ)言模型,可以通過大量的文本數(shù)據(jù)進(jìn)行訓(xùn)練,從而學(xué)習(xí)到語(yǔ)言的規(guī)律和模式,進(jìn)而生成自然流暢的語(yǔ)言文本。 本文將詳

    2023年04月19日
    瀏覽(33)
  • 第一周:AI產(chǎn)品經(jīng)理跳槽準(zhǔn)備工作

    第一周:AI產(chǎn)品經(jīng)理跳槽準(zhǔn)備工作

    因素1:AI行業(yè)發(fā)展現(xiàn)狀機(jī)會(huì)和未來 可以關(guān)注一些AI行業(yè)報(bào)告,這里我讀了大概十來份報(bào)告,截取了一些關(guān)注點(diǎn)。 報(bào)告下載: 2023中國(guó)AI商業(yè)落地投資價(jià)值研究報(bào)告(63頁(yè)):人工智能機(jī)會(huì)、價(jià)值評(píng)估和AI+行業(yè)場(chǎng)景分析、服務(wù)商案例、未來發(fā)展; 2. AI人才市場(chǎng)情況 報(bào)告下載:2

    2024年02月02日
    瀏覽(22)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包