国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

《機器學習核心技術(shù)》分類算法 - 決策樹

這篇具有很好參考價值的文章主要介紹了《機器學習核心技術(shù)》分類算法 - 決策樹。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

「作者主頁」:士別三日wyx
「作者簡介」:CSDN top100、阿里云博客專家、華為云享專家、網(wǎng)絡安全領(lǐng)域優(yōu)質(zhì)創(chuàng)作者
「推薦專欄」:小白零基礎(chǔ)《Python入門到精通》

《機器學習核心技術(shù)》分類算法 - 決策樹,《機器學習入門到精通》,機器學習,分類,決策樹


決策樹是一種 「二叉樹形式」的預測模型,每個 「節(jié)點」對應一個 「判斷條件」, 「滿足」上一個條件才能 「進入下一個」判斷條件。

就比如找對象,第一個條件肯定是長得帥,長得帥的才考慮下一個條件;長得不帥就直接pass,不往下考慮了。

《機器學習核心技術(shù)》分類算法 - 決策樹,《機器學習入門到精通》,機器學習,分類,決策樹

決策樹的「核心」在于:如何找到「最高效」「決策順序」。

1、決策樹API

sklearn.tree.DecisionTreeClassifier() 是決策樹分類算法的API

參數(shù)

  • criterion:(可選)衡量分裂的質(zhì)量,可選值有gini、entropy、log_loss,默認值 gini
  • splitter:(可選)給每個節(jié)點選擇分割的策略,可選值有bestrandom,默認值 best
  • max_depth:(可選)樹的最大深度,默認值 None
  • min_samples_split:(可選)分割節(jié)點所需要的的最小樣本數(shù),默認值 2
  • min_samples_leaf:(可選)葉節(jié)點上所需要的的最小樣本數(shù),默認值 1
  • min_weight_fraction_leaf:(可選)葉節(jié)點的權(quán)重總和的最小加權(quán)分數(shù),默認值 0.0
  • max_features:(可選)尋找最佳分割時要考慮的特征數(shù)量,默認值 None
  • random_state:(可選)控制分裂特征的隨機數(shù),默認值 None
  • max_leaf_nodes:(可選)最大葉子節(jié)點數(shù),默認值 None
  • min_impurity_decrease:(可選)如果分裂指標的減少量大于該值,就進行分裂,默認值 0.0
  • class_weight:(可選)每個類的權(quán)重,默認值 None
  • ccp_alpha:(可選)將選擇成本復雜度最大且小于ccp_alpha的子樹。默認情況下,不執(zhí)行修剪。

函數(shù)

  • fit( x_train, y_train ):接收訓練集特征 和 訓練集目標
  • predict( x_test ):接收測試集特征,返回數(shù)據(jù)的類標簽。
  • score( x_test, y_test ):接收測試集特征 和 測試集目標,返回準確率。
  • predict_log_proba():預測樣本的類對數(shù)概率

屬性

  • classes_:類標簽
  • feature_importances_:特征的重要性
  • max_features_:最大特征推斷值
  • n_classes_:類的數(shù)量
  • n_features_in_:特征數(shù)
  • feature_names_in_:特征名稱
  • n_outputs_:輸出的數(shù)量
  • tree_:底層的tree對象

2、決策時實際應用

2.1、獲取數(shù)據(jù)集

這里使用sklearn自帶的鳶尾花數(shù)據(jù)集進行演示。

from sklearn import datasets

# 1、獲取數(shù)據(jù)集
iris = datasets.load_iris()

2.2、劃分數(shù)據(jù)集

傳入數(shù)據(jù)集的特征值和目標值,按照默認的比例劃分數(shù)據(jù)集。

from sklearn import datasets
from sklearn import model_selection

# 1、獲取數(shù)據(jù)集
iris = datasets.load_iris()
# # 2、劃分數(shù)據(jù)集
x_train, x_test, y_train, y_test = model_selection.train_test_split(iris.data, iris.target)

2.3、決策樹處理

實例化對象,傳入訓練集特征值和目標值,開始訓練。

from sklearn import datasets
from sklearn import model_selection
from sklearn import tree

# 1、獲取數(shù)據(jù)集
iris = datasets.load_iris()
# # 2、劃分數(shù)據(jù)集
x_train, x_test, y_train, y_test = model_selection.train_test_split(iris.data, iris.target)
# # 3、決策樹處理
estimator = tree.DecisionTreeClassifier()
estimator.fit(x_train, y_train)

2.4、模型評估

對比測試集,驗證準確率。

from sklearn import datasets
from sklearn import model_selection
from sklearn import tree

# 1、獲取數(shù)據(jù)集
iris = datasets.load_iris()
# # 2、劃分數(shù)據(jù)集
x_train, x_test, y_train, y_test = model_selection.train_test_split(iris.data, iris.target)
# # 3、決策樹處理
estimator = tree.DecisionTreeClassifier()
estimator.fit(x_train, y_train)
# # 4、模型評估
y_predict = estimator.predict(x_test)
print('對比真實值和預測值', y_test == y_predict)
score = estimator.score(x_test, y_test)
print('準確率:', score)

輸出:

對比真實值和預測值 [ True  True  True  True  True False  True  True  True  True  True  True
 False  True  True  True  True  True  True  True  True  True  True  True
  True  True  True  True  True  True  True  True  True  True  True  True
  True  True]
準確率: 0.9473684210526315

從結(jié)果可以看到,準確率達到了94%文章來源地址http://www.zghlxwxcb.cn/news/detail-677302.html

到了這里,關(guān)于《機器學習核心技術(shù)》分類算法 - 決策樹的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權(quán),不承擔相關(guān)法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務器費用

相關(guān)文章

  • python機器學習——分類模型評估 & 分類算法(k近鄰,樸素貝葉斯,決策樹,隨機森林,邏輯回歸,svm)

    python機器學習——分類模型評估 & 分類算法(k近鄰,樸素貝葉斯,決策樹,隨機森林,邏輯回歸,svm)

    交叉驗證:為了讓被評估的模型更加準確可信 交叉驗證:將拿到的數(shù)據(jù),分為訓練和驗證集。以下圖為例:將數(shù)據(jù)分成5份,其中一份作為驗證集。然后經(jīng)過5次(組)的測試,每次都更換不同的驗證集。即得到5組模型的結(jié)果,取平均值作為最終結(jié)果。又稱5折交叉驗證。 通常情

    2024年02月03日
    瀏覽(31)
  • Python 機器學習入門 - - 決策樹算法學習筆記

    Python 機器學習入門 - - 決策樹算法學習筆記

    提示:文章寫完后,目錄可以自動生成,如何生成可參考右邊的幫助文檔 ChatGPT一問世就給整個社會帶來巨大的震撼和沖擊,不禁讓人驚嘆現(xiàn)在AI的強大,我們好像離通用人工智能更近一步。在過去十幾年人工智能領(lǐng)域的蓬勃發(fā)展中,扮演著主導地位的算法基本都是神經(jīng)網(wǎng)絡和

    2023年04月08日
    瀏覽(25)
  • 【機器學習入門】決策樹算法(三):C5.0算法

    【機器學習入門】決策樹算法(三):C5.0算法

    C5.0算法是昆蘭在C4.5算法的基礎(chǔ)上提出的 商用改進 版本,目的是對含有大量數(shù)據(jù)的數(shù)據(jù)集進行分析。 C5.0算法的訓練過程大致如下。 假設訓練的樣本集S共有n個樣本,訓練決策樹模型的次數(shù)為T,用Ct表示t次訓練產(chǎn)生的決策樹模型,經(jīng)過T次訓練后最終構(gòu)建的復合決策樹模型表

    2024年02月08日
    瀏覽(17)
  • python機器學習(六)決策樹(上) 構(gòu)造樹、信息熵的分類和度量、信息增益、CART算法、剪枝

    python機器學習(六)決策樹(上) 構(gòu)造樹、信息熵的分類和度量、信息增益、CART算法、剪枝

    模擬相親的過程,通過相親決策圖,男的去相親,會先選擇性別為女的,然后依次根據(jù)年齡、長相、收入、職業(yè)等信息對相親的另一方有所了解。 通過決策圖可以發(fā)現(xiàn),生活中面臨各種各樣的選擇,基于我們的經(jīng)驗和自身需求進行一些篩選,把判斷背后的邏輯整理成結(jié)構(gòu)圖,

    2024年02月14日
    瀏覽(22)
  • 大數(shù)據(jù)機器學習深度解讀決策樹算法:技術(shù)全解與案例實戰(zhàn)

    大數(shù)據(jù)機器學習深度解讀決策樹算法:技術(shù)全解與案例實戰(zhàn)

    本文深入探討了機器學習中的決策樹算法,從基礎(chǔ)概念到高級研究進展,再到實戰(zhàn)案例應用,全面解析了決策樹的理論及其在現(xiàn)實世界問題中的實際效能。通過技術(shù)細節(jié)和案例實踐,揭示了決策樹在提供可解釋預測中的獨特價值。 決策樹算法是機器學習領(lǐng)域的基石之一,其強

    2024年02月04日
    瀏覽(25)
  • 【AI機器學習入門與實戰(zhàn)】機器學習算法都有哪些分類?

    【AI機器學習入門與實戰(zhàn)】機器學習算法都有哪些分類?

    ??【 AI機器學習入門與實戰(zhàn) 】目錄 ?? 基礎(chǔ)篇 ?? 第一篇:【AI機器學習入門與實戰(zhàn)】AI 人工智能介紹 ?? 第二篇:【AI機器學習入門與實戰(zhàn)】機器學習核心概念理解 ?? 第三篇:【AI機器學習入門與實戰(zhàn)】機器學習算法都有哪些分類? ?? 第四篇:【AI機器學習入門與實戰(zhàn)】

    2024年02月12日
    瀏覽(20)
  • 機器學習~從入門到精通(二)線性回歸算法和多元線性回歸

    機器學習~從入門到精通(二)線性回歸算法和多元線性回歸

    SimpleLinearRegression.py moduel_selection.py draft.py lin_fit(x,y) lin_fit2(x,y) x.shape y.shape MSE mean squared error 均方誤差 R squared error

    2024年02月01日
    瀏覽(39)
  • 機器學習:分類、回歸、決策樹

    ? ? ? ? 如:去銀行借錢,會有借或者不借的兩種類別 ? ? ? ? 如:去銀行借錢,預測銀行會借給我多少錢,如:1~100000之間的一個數(shù)值 ????????為了要將表格轉(zhuǎn)化為一棵樹,決策樹需要找出最佳節(jié)點和最佳的分枝方法,對分類樹來說,衡量這個?“?最佳?”?的指標 叫

    2024年02月02日
    瀏覽(27)
  • 【100天精通Python】Day73:python機器學習入門算法詳解與代碼示例

    目錄 1. 監(jiān)督學習算法: 1.1 線性回歸(Linear Regression): 1.2? 邏輯回歸(Logistic Regression): 1.3 決策樹(Decision Tree): 1.4 支持向量機(Support Vector Machine): 1.5 隨機森林(Random Forest): ?2. 無監(jiān)督學習算法: ?2.1 聚類算法(Clustering): 2.2 主成分分析(PCA): 2.3 K均值聚

    2024年02月05日
    瀏覽(51)
  • 機器學習:什么是分類/回歸/聚類/降維/決策

    機器學習:什么是分類/回歸/聚類/降維/決策

    目錄 學習模式分為三大類:監(jiān)督,無監(jiān)督,強化學習 監(jiān)督學習基本問題 分類問題 回歸問題 無監(jiān)督學習基本問題 聚類問題 降維問題 強化學習基本問題 決策問題 如何選擇合適的算法 我們將涵蓋目前「五大」最常見機器學習任務: 回歸 分類 聚類 降維 決策 分類是監(jiān)督學習

    2024年02月12日
    瀏覽(32)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包