国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<ul id="4gu6i"><del id="4gu6i"></del></ul>

<bdo id="4gu6i"><blockquote id="4gu6i"></blockquote></bdo>

<li id="4gu6i"><cite id="4gu6i"></cite></li>

<ul id="4gu6i"><small id="4gu6i"></small></ul>

【人工智能與機器學(xué)習(xí)】決策樹ID3及其python實現(xiàn)

2年前作者：日常脫發(fā)的小邁分類：Toy博客閱讀(510)違法舉報

這篇具有很好參考價值的文章主要介紹了【人工智能與機器學(xué)習(xí)】決策樹ID3及其python實現(xiàn)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

1 決策樹算法

決策樹（Decision Tree)是一類常見的機器學(xué)習(xí)方法，是一種非常常用的分類方法，它是一種監(jiān)督學(xué)習(xí)。常見的決策樹算法有ID3，C4.5、C5.0和CART（classification and regression tree），CART的分類效果一般要優(yōu)于其他決策樹。

決策樹是基于樹狀結(jié)構(gòu)來進行決策的，一般地，一棵決策樹包含一個根節(jié)點、若干個內(nèi)部節(jié)點和若干個葉節(jié)點。

每個內(nèi)部節(jié)點表示一個屬性上的判斷
每個分支代表一個判斷結(jié)果的輸出
每個葉節(jié)點代表一種分類結(jié)果。
根節(jié)點包含樣本全集
決策樹學(xué)習(xí)的目的是為了產(chǎn)生一棵泛化能力強，即處理未見示例能力強的決策樹，其基本流程遵循簡單且直觀的“分而治之”（divide-and-conquer）策略。

本文主要介紹ID3算法，ID3算法的核心是根據(jù)信息增益來選擇進行劃分的特征，然后遞歸地構(gòu)建決策樹。

1.1 特征選擇

特征選擇也即選擇最優(yōu)劃分屬性，從當(dāng)前數(shù)據(jù)的特征中選擇一個特征作為當(dāng)前節(jié)點的劃分標(biāo)準(zhǔn)。隨著劃分過程不斷進行，希望決策樹的分支節(jié)點所包含的樣本盡可能屬于同一類別，即節(jié)點的“純度”越來越高。

1.2 熵（entropy）

熵表示事務(wù)不確定性的程度，也就是信息量的大?。ㄒ话阏f信息量大，就是指這個時候背后的不確定因素太多），熵的公式如下：

id3決策樹python,人工智能,機器學(xué)習(xí),決策樹

其中， p(xi)是分類 xi 出現(xiàn)的概率，n是分類的數(shù)目?？梢钥闯?，熵的大小只和變量的概率分布有關(guān)。
對于在X的條件下Y的條件熵，是指在X的信息之后，Y這個變量的信息量（不確定性）的大小，計算公式如下：

id3決策樹python,人工智能,機器學(xué)習(xí),決策樹

例如，當(dāng)只有A類和B類的時候，p(A)=p(B)=0.5，熵的大小為：

id3決策樹python,人工智能,機器學(xué)習(xí),決策樹

當(dāng)只有A類或只有B類時，

id3決策樹python,人工智能,機器學(xué)習(xí),決策樹

所以當(dāng)Entropy最大為1的時候，是分類效果最差的狀態(tài)，當(dāng)它最小為0的時候，是完全分類的狀態(tài)。因為熵等于零是理想狀態(tài)，一般實際情況下，熵介于0和1之間。

熵的不斷最小化，實際上就是提高分類正確率的過程。

1.3 信息增益

信息增益：在劃分?jǐn)?shù)據(jù)集之前之后信息發(fā)生的變化，計算每個特征值劃分?jǐn)?shù)據(jù)集獲得的信息增益，獲得信息增益最高的特征就是最好的選擇。

定義屬性A對數(shù)據(jù)集D的信息增益為infoGain(D|A)，它等于D本身的熵，減去給定A的條件下D的條件熵，即：

id3決策樹python,人工智能,機器學(xué)習(xí),決策樹

信息增益的意義：引入屬性A后，原來數(shù)據(jù)集D的不確定性減少了多少。

計算每個屬性引入后的信息增益，選擇給D帶來的信息增益最大的屬性，即為最優(yōu)劃分屬性。一般，信息增益越大，則意味著使用屬性A來進行劃分所得到的的“純度提升”越大。

2 ID3算法的python實現(xiàn)

以西瓜數(shù)據(jù)集為例
·watermalon.csv·文件內(nèi)容如下：

id3決策樹python,人工智能,機器學(xué)習(xí),決策樹

讀取文件數(shù)據(jù)

import numpy as np
import pandas as pd
import math
data = pd.read_csv('work/watermalon.csv')
data

id3決策樹python,人工智能,機器學(xué)習(xí),決策樹

計算熵

def info(x,y):
    if x != y and x != 0:
        # 計算當(dāng)前情況的熵
        return -(x/y)*math.log2(x/y) - ((y-x)/y)*math.log2((y-x)/y)
    if x == y or x == 0:
        # 純度最大，熵值為0
        return 0
info_D = info(8,17)
info_D

結(jié)果為：
0.9975025463691153

計算信息增益

# 計算每種情況的熵
seze_black_entropy = -(4/6)*math.log2(4/6)-(2/6)*math.log2(2/6)
seze_green_entropy = -(3/6)*math.log2(3/6)*2
seze_white_entropy = -(1/5)*math.log2(1/5)-(4/5)*math.log2(4/5)

# 計算色澤特征色信息熵
seze_entropy = (6/17)*seze_black_entropy+(6/17)*seze_green_entropy+(5/17)*seze_white_entropy
print(seze_entropy)
# 計算信息增益
info_D - seze_entropy

結(jié)果為：
0.10812516526536531

查看每種根蒂中好壞瓜情況的分布情況

data.根蒂.value_counts()
# 查看每種根蒂中好壞瓜情況的分布情況
print(data[data.根蒂=='蜷縮'])
print(data[data.根蒂=='稍蜷'])
print(data[data.根蒂=='硬挺'])

id3決策樹python,人工智能,機器學(xué)習(xí),決策樹

gendi_entropy = (8/17)*info(5,8)+(7/17)*info(3,7)+(2/17)*info(0,2)
gain_col = info_D - gendi_entropy
gain_col

根蒂的信息增益為：0.142674959566793

查看每種敲聲中好壞瓜情況的分布情況

data.敲聲.value_counts()
# 查看每種敲聲中好壞瓜情況的分布情況
print(data[data.敲聲=='濁響'])
print(data[data.敲聲=='沉悶'])
print(data[data.敲聲=='清脆'])
qiaosheng_entropy = (10/17)*info(6,10)+(5/17)*info(2,5)+(2/17)*info(0,2)
info_gain = info_D - qiaosheng_entropy
info_gain

id3決策樹python,人工智能,機器學(xué)習(xí),決策樹

查看每種紋理中好壞瓜情況的分布情況

data.紋理.value_counts()
# 查看每種紋理中好壞瓜情況的分布情況
print(data[data.紋理=="清晰"])
print(data[data.紋理=="稍糊"])
print(data[data.紋理=="模糊"])
wenli_entropy = (9/17)*info(7,9)+(5/17)*info(1,5)+(3/17)*info(0,3)
info_gain = info_D - wenli_entropy
info_gain

id3決策樹python,人工智能,機器學(xué)習(xí),決策樹

同理查看其他列的分布情況，這里不做演示

繪制可視化樹

import matplotlib.pylab as plt
import matplotlib

# 能夠顯示中文
matplotlib.rcParams['font.sans-serif'] = ['SimHei']
matplotlib.rcParams['font.serif'] = ['SimHei']

# 分叉節(jié)點，也就是決策節(jié)點
decisionNode = dict(boxstyle="sawtooth", fc="0.8")

# 葉子節(jié)點
leafNode = dict(boxstyle="round4", fc="0.8")

# 箭頭樣式
arrow_args = dict(arrowstyle="<-")


def plotNode(nodeTxt, centerPt, parentPt, nodeType):
    """
    繪制一個節(jié)點
    :param nodeTxt: 描述該節(jié)點的文本信息
    :param centerPt: 文本的坐標(biāo)
    :param parentPt: 點的坐標(biāo)，這里也是指父節(jié)點的坐標(biāo)
    :param nodeType: 節(jié)點類型,分為葉子節(jié)點和決策節(jié)點
    :return:
    """
    createPlot.ax1.annotate(nodeTxt, xy=parentPt, xycoords='axes fraction',
                            xytext=centerPt, textcoords='axes fraction',
                            va="center", ha="center", bbox=nodeType, arrowprops=arrow_args)


def getNumLeafs(myTree):
    """
    獲取葉節(jié)點的數(shù)目
    :param myTree:
    :return:
    """
    # 統(tǒng)計葉子節(jié)點的總數(shù)
    numLeafs = 0

    # 得到當(dāng)前第一個key，也就是根節(jié)點
    firstStr = list(myTree.keys())[0]

    # 得到第一個key對應(yīng)的內(nèi)容
    secondDict = myTree[firstStr]

    # 遞歸遍歷葉子節(jié)點
    for key in secondDict.keys():
        # 如果key對應(yīng)的是一個字典，就遞歸調(diào)用
        if type(secondDict[key]).__name__ == 'dict':
            numLeafs += getNumLeafs(secondDict[key])
        # 不是的話，說明此時是一個葉子節(jié)點
        else:
            numLeafs += 1
    return numLeafs


def getTreeDepth(myTree):
    """
    得到數(shù)的深度層數(shù)
    :param myTree:
    :return:
    """
    # 用來保存最大層數(shù)
    maxDepth = 0

    # 得到根節(jié)點
    firstStr = list(myTree.keys())[0]

    # 得到key對應(yīng)的內(nèi)容
    secondDic = myTree[firstStr]

    # 遍歷所有子節(jié)點
    for key in secondDic.keys():
        # 如果該節(jié)點是字典，就遞歸調(diào)用
        if type(secondDic[key]).__name__ == 'dict':
            # 子節(jié)點的深度加1
            thisDepth = 1 + getTreeDepth(secondDic[key])

        # 說明此時是葉子節(jié)點
        else:
            thisDepth = 1

        # 替換最大層數(shù)
        if thisDepth > maxDepth:
            maxDepth = thisDepth

    return maxDepth


def plotMidText(cntrPt, parentPt, txtString):
    """
    計算出父節(jié)點和子節(jié)點的中間位置，填充信息
    :param cntrPt: 子節(jié)點坐標(biāo)
    :param parentPt: 父節(jié)點坐標(biāo)
    :param txtString: 填充的文本信息
    :return:
    """
    # 計算x軸的中間位置
    xMid = (parentPt[0]-cntrPt[0])/2.0 + cntrPt[0]
    # 計算y軸的中間位置
    yMid = (parentPt[1]-cntrPt[1])/2.0 + cntrPt[1]
    # 進行繪制
    createPlot.ax1.text(xMid, yMid, txtString)


def plotTree(myTree, parentPt, nodeTxt):
    """
    繪制出樹的所有節(jié)點，遞歸繪制
    :param myTree: 樹
    :param parentPt: 父節(jié)點的坐標(biāo)
    :param nodeTxt: 節(jié)點的文本信息
    :return:
    """
    # 計算葉子節(jié)點數(shù)
    numLeafs = getNumLeafs(myTree=myTree)

    # 計算樹的深度
    depth = getTreeDepth(myTree=myTree)

    # 得到根節(jié)點的信息內(nèi)容
    firstStr = list(myTree.keys())[0]

    # 計算出當(dāng)前根節(jié)點在所有子節(jié)點的中間坐標(biāo),也就是當(dāng)前x軸的偏移量加上計算出來的根節(jié)點的中心位置作為x軸（比如說第一次：初始的x偏移量為：-1/2W,計算出來的根節(jié)點中心位置為：(1+W)/2W，相加得到：1/2），當(dāng)前y軸偏移量作為y軸
    cntrPt = (plotTree.xOff + (1.0 + float(numLeafs))/2.0/plotTree.totalW, plotTree.yOff)

    # 繪制該節(jié)點與父節(jié)點的聯(lián)系
    plotMidText(cntrPt, parentPt, nodeTxt)

    # 繪制該節(jié)點
    plotNode(firstStr, cntrPt, parentPt, decisionNode)

    # 得到當(dāng)前根節(jié)點對應(yīng)的子樹
    secondDict = myTree[firstStr]

    # 計算出新的y軸偏移量，向下移動1/D，也就是下一層的繪制y軸
    plotTree.yOff = plotTree.yOff - 1.0/plotTree.totalD

    # 循環(huán)遍歷所有的key
    for key in secondDict.keys():
        # 如果當(dāng)前的key是字典的話，代表還有子樹，則遞歸遍歷
        if isinstance(secondDict[key], dict):
            plotTree(secondDict[key], cntrPt, str(key))
        else:
            # 計算新的x軸偏移量，也就是下個葉子繪制的x軸坐標(biāo)向右移動了1/W
            plotTree.xOff = plotTree.xOff + 1.0/plotTree.totalW
            # 打開注釋可以觀察葉子節(jié)點的坐標(biāo)變化
            # print((plotTree.xOff, plotTree.yOff), secondDict[key])
            # 繪制葉子節(jié)點
            plotNode(secondDict[key], (plotTree.xOff, plotTree.yOff), cntrPt, leafNode)
            # 繪制葉子節(jié)點和父節(jié)點的中間連線內(nèi)容
            plotMidText((plotTree.xOff, plotTree.yOff), cntrPt, str(key))

    # 返回遞歸之前，需要將y軸的偏移量增加，向上移動1/D，也就是返回去繪制上一層的y軸
    plotTree.yOff = plotTree.yOff + 1.0/plotTree.totalD


def createPlot(inTree):
    """
    需要繪制的決策樹
    :param inTree: 決策樹字典
    :return:
    """
    # 創(chuàng)建一個圖像
    fig = plt.figure(1, facecolor='white')
    fig.clf()
    axprops = dict(xticks=[], yticks=[])
    createPlot.ax1 = plt.subplot(111, frameon=False, **axprops)
    # 計算出決策樹的總寬度
    plotTree.totalW = float(getNumLeafs(inTree))
    # 計算出決策樹的總深度
    plotTree.totalD = float(getTreeDepth(inTree))
    # 初始的x軸偏移量，也就是-1/2W，每次向右移動1/W，也就是第一個葉子節(jié)點繪制的x坐標(biāo)為：1/2W，第二個：3/2W，第三個：5/2W，最后一個：(W-1)/2W
    plotTree.xOff = -0.5/plotTree.totalW
    # 初始的y軸偏移量，每次向下或者向上移動1/D
    plotTree.yOff = 1.0
    # 調(diào)用函數(shù)進行繪制節(jié)點圖像
    plotTree(inTree, (0.5, 1.0), '')
    # 繪制
    plt.show()


if __name__ == '__main__':
    createPlot(mytree)

id3決策樹python,人工智能,機器學(xué)習(xí),決策樹

總結(jié)

決策樹ID3是一種經(jīng)典的機器學(xué)習(xí)算法，用于解決分類問題。它通過在特征空間中構(gòu)建樹形結(jié)構(gòu)來進行決策，并以信息增益作為劃分標(biāo)準(zhǔn)。ID3算法的關(guān)鍵在于選擇最佳的屬性進行劃分，以最大化信息增益。通過Python實現(xiàn)ID3算法，我們可以構(gòu)建出一棵高效而準(zhǔn)確的決策樹模型，用于分類預(yù)測和決策分析。

參考
https://zhuanlan.zhihu.com/p/133846252
https://cuijiahua.com/blog/2017/11/ml_2_decision_tree_1.html
https://blog.csdn.net/tauvan/article/details/121028351文章來源地址http://www.zghlxwxcb.cn/news/detail-717007.html

到了這里，關(guān)于【人工智能與機器學(xué)習(xí)】決策樹ID3及其python實現(xiàn)的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

【人工智能】深度強化學(xué)習(xí)的新突破：如何打造智能決策系統(tǒng)
2024年02月06日
瀏覽(95)
ID3 決策樹
西瓜數(shù)據(jù)集D如下: 編號色澤根蒂敲聲紋理臍部觸感好瓜 1 青綠蜷縮濁響清晰凹陷硬滑是 2 烏黑蜷縮沉悶清晰凹陷硬滑是 3 烏黑蜷縮濁響清晰凹陷硬滑是 4 青綠蜷縮沉悶清晰凹陷硬滑是 5 淺白蜷縮濁響清晰凹陷硬滑是 6 青綠稍蜷濁響清晰稍凹軟粘
2024年02月13日
瀏覽(81)
決策樹ID3
學(xué)習(xí)地址: https://www.bilibili.com/video/BV1Cq4y1S7k1/?spm_id_from=333.1007.top_right_bar_window_history.content.clickvd_source=de1f9cbc33f7115533aa33c9d6b5257b ID3算法畫出決策樹關(guān)系： gain=E-info 先算天氣的信息增益算氣溫的信息增益算濕度的信息增益算風(fēng)的信息增益選擇信息增益最大的作為根節(jié)點畫出根
2024年02月12日
瀏覽(90)
決策樹——ID3算法
所謂決策樹，顧名思義，是一種樹，一種依托于策略抉擇而建立起來的樹。機器學(xué)習(xí)中，決策樹是一個預(yù)測模型；它代表的是對象屬性與對象值之間的一種映射關(guān)系。樹中每個節(jié)點表示某個對象，而每個分叉路徑則代表的是某個可能的屬性值，而每個葉子節(jié)點則對應(yīng)根節(jié)點到
2024年02月03日
瀏覽(85)
決策樹之ID3的matlab實現(xiàn)
森林內(nèi)的兩條分叉路，我選擇了人跡罕見的一條，從此一切變得不一樣。 ------佛洛斯特Robert Frost 目錄一 .決策樹介紹 1.1 相關(guān)概念 1.2 圖形表示 1.3 規(guī)則表示二.決策樹的信息計算三.ID3相關(guān)介紹 3.1 ID3算法概述 3.2 算法流程四.matlab實現(xiàn)
2024年02月11日
瀏覽(86)
基于weka手工實現(xiàn)ID3決策樹
相比于logistic回歸、BP網(wǎng)絡(luò)、支持向量機等基于超平面的方法，決策樹更像一種算法，里面的數(shù)學(xué)原理并不是很多，較好理解。決策樹就是一個不斷地屬性選擇、屬性劃分地過程，直到滿足某一情況就停止劃分。當(dāng)前樣本全部屬于同一類別了（信息增益為0）；已經(jīng)是空葉子
2024年02月14日
瀏覽(87)
ID3決策樹及Python實現(xiàn)（詳細）
目錄一、劃分特征的評價指標(biāo)：二、決策樹學(xué)習(xí)算法偽代碼：三、決策樹生成實例：四、Python實現(xiàn)ID3決策樹： 1、信息熵 Ent(D)：信息熵，是度量樣本集合純度的一種指標(biāo)，Ent(D)的值越小，則樣本集D的純度越高； 2、信息增益 Gain(D,a)：信息增益越大，則意味著使用屬性a來
2024年02月09日
瀏覽(91)
機器學(xué)習(xí)入門教學(xué)——人工智能、機器學(xué)習(xí)、深度學(xué)習(xí)
1、人工智能人工智能相當(dāng)于人類的代理人，我們現(xiàn)在所接觸到的人工智能基本上都是弱AI，主要作用是正確解釋從外部獲得的數(shù)據(jù)，并對這些數(shù)據(jù)加以學(xué)習(xí)和利用，以便靈活的實現(xiàn)特定目標(biāo)和任務(wù)。例如：阿爾法狗、智能汽車簡單來說：人工智能使機器像人類一樣進行感
2024年02月09日
瀏覽(94)
人工智能|機器學(xué)習(xí)——基于機器學(xué)習(xí)的舌苔檢測
基于深度學(xué)習(xí)的舌苔檢測畢設(shè)留檔.zip資源-CSDN文庫目前隨著人們生活水平的不斷提高，對于中醫(yī)主張的理念越來越認可，對中醫(yī)的需求也越來越多。在診斷中，中醫(yī)通過觀察人的舌頭的舌質(zhì)、苔質(zhì)等舌象特征，了解人體內(nèi)的體質(zhì)信息從而對癥下藥。傳統(tǒng)中醫(yī)的舌診主要依賴
2024年02月22日
瀏覽(93)
【機器學(xué)習(xí)】人工智能概述
???♂? 個人主頁：@艾派森的個人主頁 ???作者簡介：Python學(xué)習(xí)者 ?? 希望大家多多支持，我們一起進步！?? 如果文章對你有幫助的話，歡迎評論 ??點贊???? 收藏 ??加關(guān)注+ 目錄 1.人工智能概述 1.1 機器學(xué)習(xí)、人工智能與深度學(xué)習(xí) 1.2 機器學(xué)習(xí)、深度學(xué)習(xí)能做些什么
2024年02月09日
瀏覽(27)

<bdo id="kqg8e"><cite id="kqg8e"></cite></bdo><object id="kqg8e"></object>

<optgroup id="kqg8e"></optgroup>

<bdo id="kqg8e"><cite id="kqg8e"></cite></bdo>

<object id="kqg8e"></object>

<wbr id="kqg8e"><blockquote id="kqg8e"></blockquote></wbr>

<optgroup id="kqg8e"><td id="kqg8e"></td></optgroup>

<em id="kqg8e"></em>

<object id="kqg8e"><s id="kqg8e"></s></object>

<ul id="kqg8e"><cite id="kqg8e"></cite></ul>