作者:禪與計(jì)算機(jī)程序設(shè)計(jì)藝術(shù)
1.簡(jiǎn)介
在機(jī)器學(xué)習(xí)領(lǐng)域,決策樹(shù)(decision tree)是一種常用的模式分類算法。它能夠?qū)⑤斎霐?shù)據(jù)劃分成不同類別或不同輸出值,并據(jù)此做出預(yù)測(cè)。而對(duì)于復(fù)雜的數(shù)據(jù)分析任務(wù)來(lái)說(shuō),用決策樹(shù)這種經(jīng)典算法進(jìn)行分析就顯得十分合適了。本文將通過(guò)對(duì)決策樹(shù)算法的基本原理和具體實(shí)現(xiàn)過(guò)程,帶領(lǐng)讀者一步步了解其工作原理。
本文假定讀者具備相關(guān)機(jī)器學(xué)習(xí)基礎(chǔ)知識(shí),比如機(jī)器學(xué)習(xí)的相關(guān)理論、算法、模型等。文章所涉及到的算法一般采用CART(Classification And Regression Tree,即分類回歸樹(shù)),并且所涉及的代碼示例主要基于python語(yǔ)言。文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-720029.html
2.背景介紹
決策樹(shù)算法起源于1974年西班牙的卡羅爾·卡西多(Carlos Carrasco)提出的一種監(jiān)督機(jī)器學(xué)習(xí)方法。當(dāng)時(shí)他在西班牙諾瓦那大學(xué)取得博士學(xué)位后,利用該博士論文中的數(shù)據(jù)集對(duì)決策樹(shù)進(jìn)行了研究。他對(duì)決策樹(shù)算法的命名由來(lái)自于“Decision”之意,在西班牙語(yǔ)里代表行動(dòng)或決策。
概括地說(shuō),決策樹(shù)算法就是從數(shù)據(jù)集中找到一條最優(yōu)的劃分路徑,使得各個(gè)類別的數(shù)據(jù)點(diǎn)盡可能集中在同一區(qū)域。在機(jī)器學(xué)習(xí)領(lǐng)域,決策樹(shù)算法具有以下幾個(gè)優(yōu)點(diǎn):文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-720029.html
- 可理解性強(qiáng): 通過(guò)一棵樹(shù)結(jié)構(gòu)可直觀地呈現(xiàn)數(shù)據(jù)的分布情況,便于人們理解和分析;
- 模型訓(xùn)練速度快: 決策樹(shù)算法采用遞歸方式生成樹(shù)節(jié)點(diǎn),因此訓(xùn)練速度非???,可以處理大規(guī)模的數(shù)據(jù)集;
- 處理多維數(shù)據(jù): 可以對(duì)多維特征數(shù)據(jù)進(jìn)行有效的建模;
- 準(zhǔn)確性高: 對(duì)異常值不敏感;
- 不需要特征縮放: 不依賴輸入變量之間的量綱大?。?/li>
- 無(wú)參數(shù)調(diào)整
到了這里,關(guān)于如何在Python中實(shí)現(xiàn)一個(gè)決策樹(shù)算法?的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!