国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

《機器學習核心技術(shù)》分類算法 - 決策樹

2年前作者：士別三日wyx分類：Toy博客閱讀(28)違法舉報

這篇具有很好參考價值的文章主要介紹了《機器學習核心技術(shù)》分類算法 - 決策樹。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

「作者主頁」：士別三日wyx
「作者簡介」：CSDN top100、阿里云博客專家、華為云享專家、網(wǎng)絡安全領(lǐng)域優(yōu)質(zhì)創(chuàng)作者
「推薦專欄」：小白零基礎(chǔ)《Python入門到精通》

《機器學習核心技術(shù)》分類算法 - 決策樹,《機器學習入門到精通》,機器學習,分類,決策樹

決策樹是一種「二叉樹形式」的預測模型，每個「節(jié)點」對應一個「判斷條件」，「滿足」上一個條件才能「進入下一個」判斷條件。

就比如找對象，第一個條件肯定是長得帥，長得帥的才考慮下一個條件；長得不帥就直接pass，不往下考慮了。

《機器學習核心技術(shù)》分類算法 - 決策樹,《機器學習入門到精通》,機器學習,分類,決策樹

決策樹的「核心」在于：如何找到「最高效」的「決策順序」。

1、決策樹API

sklearn.tree.DecisionTreeClassifier() 是決策樹分類算法的API

參數(shù)

criterion：（可選）衡量分裂的質(zhì)量，可選值有gini、entropy、log_loss，默認值 gini
splitter：（可選）給每個節(jié)點選擇分割的策略，可選值有best、random，默認值 best
max_depth：（可選）樹的最大深度，默認值 None
min_samples_split：（可選）分割節(jié)點所需要的的最小樣本數(shù)，默認值 2
min_samples_leaf：（可選）葉節(jié)點上所需要的的最小樣本數(shù)，默認值 1
min_weight_fraction_leaf：（可選）葉節(jié)點的權(quán)重總和的最小加權(quán)分數(shù)，默認值 0.0
max_features：（可選）尋找最佳分割時要考慮的特征數(shù)量，默認值 None
random_state：（可選）控制分裂特征的隨機數(shù)，默認值 None
max_leaf_nodes：（可選）最大葉子節(jié)點數(shù)，默認值 None
min_impurity_decrease：（可選）如果分裂指標的減少量大于該值，就進行分裂，默認值 0.0
class_weight：（可選）每個類的權(quán)重，默認值 None
ccp_alpha：（可選）將選擇成本復雜度最大且小于ccp_alpha的子樹。默認情況下，不執(zhí)行修剪。

函數(shù)

fit( x_train, y_train )：接收訓練集特征和訓練集目標
predict( x_test )：接收測試集特征，返回數(shù)據(jù)的類標簽。
score( x_test, y_test )：接收測試集特征和測試集目標，返回準確率。
predict_log_proba()：預測樣本的類對數(shù)概率

屬性

classes_：類標簽
feature_importances_：特征的重要性
max_features_：最大特征推斷值
n_classes_：類的數(shù)量
n_features_in_：特征數(shù)
feature_names_in_：特征名稱
n_outputs_：輸出的數(shù)量
tree_：底層的tree對象

2、決策時實際應用

2.1、獲取數(shù)據(jù)集

這里使用sklearn自帶的鳶尾花數(shù)據(jù)集進行演示。

from sklearn import datasets

# 1、獲取數(shù)據(jù)集
iris = datasets.load_iris()

2.2、劃分數(shù)據(jù)集

傳入數(shù)據(jù)集的特征值和目標值，按照默認的比例劃分數(shù)據(jù)集。

from sklearn import datasets
from sklearn import model_selection

# 1、獲取數(shù)據(jù)集
iris = datasets.load_iris()
# # 2、劃分數(shù)據(jù)集
x_train, x_test, y_train, y_test = model_selection.train_test_split(iris.data, iris.target)

2.3、決策樹處理

實例化對象，傳入訓練集特征值和目標值，開始訓練。

from sklearn import datasets
from sklearn import model_selection
from sklearn import tree

# 1、獲取數(shù)據(jù)集
iris = datasets.load_iris()
# # 2、劃分數(shù)據(jù)集
x_train, x_test, y_train, y_test = model_selection.train_test_split(iris.data, iris.target)
# # 3、決策樹處理
estimator = tree.DecisionTreeClassifier()
estimator.fit(x_train, y_train)

2.4、模型評估

對比測試集，驗證準確率。

from sklearn import datasets
from sklearn import model_selection
from sklearn import tree

# 1、獲取數(shù)據(jù)集
iris = datasets.load_iris()
# # 2、劃分數(shù)據(jù)集
x_train, x_test, y_train, y_test = model_selection.train_test_split(iris.data, iris.target)
# # 3、決策樹處理
estimator = tree.DecisionTreeClassifier()
estimator.fit(x_train, y_train)
# # 4、模型評估
y_predict = estimator.predict(x_test)
print('對比真實值和預測值', y_test == y_predict)
score = estimator.score(x_test, y_test)
print('準確率：', score)

輸出：

對比真實值和預測值 [ True  True  True  True  True False  True  True  True  True  True  True
 False  True  True  True  True  True  True  True  True  True  True  True
  True  True  True  True  True  True  True  True  True  True  True  True
  True  True]
準確率： 0.9473684210526315

從結(jié)果可以看到，準確率達到了94%文章來源地址http://www.zghlxwxcb.cn/news/detail-677302.html

到了這里，關(guān)于《機器學習核心技術(shù)》分類算法 - 決策樹的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權(quán)，不承擔相關(guān)法律責任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務器費用

python機器學習——分類模型評估 & 分類算法（k近鄰，樸素貝葉斯，決策樹，隨機森林，邏輯回歸，svm）
交叉驗證：為了讓被評估的模型更加準確可信交叉驗證：將拿到的數(shù)據(jù)，分為訓練和驗證集。以下圖為例：將數(shù)據(jù)分成5份，其中一份作為驗證集。然后經(jīng)過5次(組)的測試，每次都更換不同的驗證集。即得到5組模型的結(jié)果，取平均值作為最終結(jié)果。又稱5折交叉驗證。通常情
2024年02月03日
瀏覽(31)
Python 機器學習入門 - - 決策樹算法學習筆記
提示：文章寫完后，目錄可以自動生成，如何生成可參考右邊的幫助文檔 ChatGPT一問世就給整個社會帶來巨大的震撼和沖擊，不禁讓人驚嘆現(xiàn)在AI的強大，我們好像離通用人工智能更近一步。在過去十幾年人工智能領(lǐng)域的蓬勃發(fā)展中，扮演著主導地位的算法基本都是神經(jīng)網(wǎng)絡和
2023年04月08日
瀏覽(25)
【機器學習入門】決策樹算法（三）：C5.0算法
C5.0算法是昆蘭在C4.5算法的基礎(chǔ)上提出的商用改進版本，目的是對含有大量數(shù)據(jù)的數(shù)據(jù)集進行分析。 C5.0算法的訓練過程大致如下。假設訓練的樣本集S共有n個樣本，訓練決策樹模型的次數(shù)為T，用Ct表示t次訓練產(chǎn)生的決策樹模型，經(jīng)過T次訓練后最終構(gòu)建的復合決策樹模型表
2024年02月08日
瀏覽(17)
python機器學習（六）決策樹(上) 構(gòu)造樹、信息熵的分類和度量、信息增益、CART算法、剪枝
模擬相親的過程，通過相親決策圖，男的去相親，會先選擇性別為女的，然后依次根據(jù)年齡、長相、收入、職業(yè)等信息對相親的另一方有所了解。通過決策圖可以發(fā)現(xiàn)，生活中面臨各種各樣的選擇，基于我們的經(jīng)驗和自身需求進行一些篩選，把判斷背后的邏輯整理成結(jié)構(gòu)圖，
2024年02月14日
瀏覽(22)
大數(shù)據(jù)機器學習深度解讀決策樹算法：技術(shù)全解與案例實戰(zhàn)
本文深入探討了機器學習中的決策樹算法，從基礎(chǔ)概念到高級研究進展，再到實戰(zhàn)案例應用，全面解析了決策樹的理論及其在現(xiàn)實世界問題中的實際效能。通過技術(shù)細節(jié)和案例實踐，揭示了決策樹在提供可解釋預測中的獨特價值。決策樹算法是機器學習領(lǐng)域的基石之一，其強
2024年02月04日
瀏覽(25)
【AI機器學習入門與實戰(zhàn)】機器學習算法都有哪些分類？
??【 AI機器學習入門與實戰(zhàn) 】目錄 ?? 基礎(chǔ)篇 ?? 第一篇：【AI機器學習入門與實戰(zhàn)】AI 人工智能介紹 ?? 第二篇：【AI機器學習入門與實戰(zhàn)】機器學習核心概念理解 ?? 第三篇：【AI機器學習入門與實戰(zhàn)】機器學習算法都有哪些分類？ ?? 第四篇：【AI機器學習入門與實戰(zhàn)】
2024年02月12日
瀏覽(20)
機器學習~從入門到精通（二）線性回歸算法和多元線性回歸
SimpleLinearRegression.py moduel_selection.py draft.py lin_fit(x,y) lin_fit2(x,y) x.shape y.shape MSE mean squared error 均方誤差 R squared error
2024年02月01日
瀏覽(39)
機器學習：分類、回歸、決策樹
? ? ? ? 如：去銀行借錢，會有借或者不借的兩種類別 ? ? ? ? 如：去銀行借錢，預測銀行會借給我多少錢，如：1~100000之間的一個數(shù)值 ????????為了要將表格轉(zhuǎn)化為一棵樹，決策樹需要找出最佳節(jié)點和最佳的分枝方法，對分類樹來說，衡量這個?“?最佳?”?的指標叫
2024年02月02日
瀏覽(27)
【100天精通Python】Day73：python機器學習入門算法詳解與代碼示例
目錄 1. 監(jiān)督學習算法： 1.1 線性回歸（Linear Regression）： 1.2? 邏輯回歸（Logistic Regression）： 1.3 決策樹（Decision Tree）： 1.4 支持向量機（Support Vector Machine）： 1.5 隨機森林（Random Forest）： ?2. 無監(jiān)督學習算法： ?2.1 聚類算法（Clustering）： 2.2 主成分分析（PCA）： 2.3 K均值聚
2024年02月05日
瀏覽(51)
機器學習:什么是分類/回歸/聚類/降維/決策
目錄學習模式分為三大類：監(jiān)督，無監(jiān)督，強化學習監(jiān)督學習基本問題分類問題回歸問題無監(jiān)督學習基本問題聚類問題降維問題強化學習基本問題決策問題如何選擇合適的算法我們將涵蓋目前「五大」最常見機器學習任務：回歸分類聚類降維決策分類是監(jiān)督學習
2024年02月12日
瀏覽(32)