個(gè)人簡(jiǎn)介
??????個(gè)人主頁:以山河作禮。
??????:Python領(lǐng)域新星創(chuàng)作者,CSDN實(shí)力新星認(rèn)證,CSDN內(nèi)容合伙人,阿里云社區(qū)專家博主,新星計(jì)劃導(dǎo)師,在職數(shù)據(jù)分析師。
????免費(fèi)學(xué)習(xí)專欄:1. 《Python基礎(chǔ)入門》——0基礎(chǔ)入門
2.《Python網(wǎng)絡(luò)爬蟲》——從入門到精通
3.《Web全棧開發(fā)》——涵蓋了前端、后端和數(shù)據(jù)庫等多個(gè)領(lǐng)域????悲索之人烈焰加身,墮落者不可饒恕。永恒燃燒的羽翼,帶我脫離凡間的沉淪。
機(jī)器學(xué)習(xí)算法分類:監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)
一·監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)中最常用的一種重要方法,它利用一組已知類別的樣本調(diào)整分類器的參數(shù),使其達(dá)到所要求性能的過程。簡(jiǎn)單來說,監(jiān)督學(xué)習(xí)就是從已有的標(biāo)記數(shù)據(jù)中學(xué)習(xí)模型,然后利用這個(gè)模型對(duì)新的未知數(shù)據(jù)進(jìn)行預(yù)測(cè)。
在監(jiān)督學(xué)習(xí)中,每個(gè)樣本都包含輸入特征和對(duì)應(yīng)的輸出標(biāo)簽。
輸入特征也稱為特征向量,是一個(gè)可以描述樣本特性的值;
輸出標(biāo)簽通常是離散的類別標(biāo)簽或者連續(xù)的數(shù)值標(biāo)簽,用來表示樣本所屬的類別或者具有的屬性。
通過訓(xùn)練,模型將學(xué)會(huì)從輸入特征中預(yù)測(cè)出相應(yīng)的輸出標(biāo)簽。
監(jiān)督學(xué)習(xí)的應(yīng)用場(chǎng)景非常廣泛,包括但不限于分類、回歸、聚類、降維等任務(wù)。分類是監(jiān)督學(xué)習(xí)中最為常見的一種任務(wù),它將輸入特征映射到某個(gè)離散的類別標(biāo)簽上;回歸則將輸入特征映射到某個(gè)連續(xù)的數(shù)值標(biāo)簽上。
1. 監(jiān)督學(xué)習(xí)分類任務(wù)舉例:
假設(shè)我們有一組包含房屋信息的數(shù)據(jù)集,其中每個(gè)樣本包含房屋所在街區(qū)、房屋價(jià)格、住房面積、住房格局等特征
,以及一個(gè)表示該房屋是否售出的標(biāo)簽
。我們可以使用監(jiān)督學(xué)習(xí)算法來訓(xùn)練一個(gè)分類器
,通過分析這些特征和標(biāo)簽的關(guān)系,預(yù)測(cè)新的房屋是否能夠售出。
特征向量包括房屋所在街區(qū)、價(jià)格、面積和格局等屬性;
1.1 特征
房屋所在街區(qū):我們可以將其劃分為不同的區(qū)域,比如市中心、郊區(qū)等。
房屋價(jià)格:具體的房屋售價(jià),以貨幣單位表示。
住房面積:房屋的建筑面積,以平方米為單位。
住房格局:房屋的內(nèi)部布局,比如一室一廳、兩室一廳等。
輸出標(biāo)簽為離散的類別標(biāo)簽,表示房屋是否售出。
1.2 標(biāo)簽
房屋是否售出:這是一個(gè)二元分類問題,可以用0和1來表示。0表示房屋未售出,1表示房屋已售出。
在這個(gè)例子中,我們的目標(biāo)是構(gòu)建一個(gè)分類器,通過分析輸入特征(房屋所在街區(qū)、價(jià)格、面積和格局),預(yù)測(cè)輸出標(biāo)簽(房屋是否售出)。這個(gè)任務(wù)可以被視為一個(gè)分類問題,其中每個(gè)樣本的輸入特征被映射到一個(gè)離散的類別標(biāo)簽上(0或1)。
為了解決這個(gè)問題,我們可以使用監(jiān)督學(xué)習(xí)算法來訓(xùn)練一個(gè)分類器。常見的監(jiān)督學(xué)習(xí)算法包括邏輯回歸、支持向量機(jī)、決策樹和隨機(jī)森林等。這些算法可以根據(jù)訓(xùn)練數(shù)據(jù)集中的特征和標(biāo)簽之間的關(guān)系,構(gòu)建出一個(gè)模型,用于預(yù)測(cè)新的未知數(shù)據(jù)的標(biāo)簽。
在訓(xùn)練過程中,我們需要將訓(xùn)練數(shù)據(jù)集分成訓(xùn)練集和驗(yàn)證集兩部分。訓(xùn)練集用于訓(xùn)練模型,驗(yàn)證集用于評(píng)估模型的性能和調(diào)整模型參數(shù)。常見的評(píng)估指標(biāo)包括準(zhǔn)確率、精確率、召回率和F1分?jǐn)?shù)等。通過不斷調(diào)整模型參數(shù)和優(yōu)化模型結(jié)構(gòu),我們可以提高模型的預(yù)測(cè)準(zhǔn)確性和泛化能力。通過訓(xùn)練這個(gè)分類器,我們可以發(fā)現(xiàn)一些規(guī)律,比如在某個(gè)街區(qū)的房屋更容易售出,或者價(jià)格較高的房屋更難售出等。
二·無監(jiān)督學(xué)習(xí)
無監(jiān)督學(xué)習(xí)是一種機(jī)器學(xué)習(xí)訓(xùn)練方法,其本質(zhì)是一個(gè)統(tǒng)計(jì)手段。在這種方法中,我們利用無標(biāo)簽的數(shù)據(jù)來探索和發(fā)現(xiàn)潛在的結(jié)構(gòu)或模式。無監(jiān)督學(xué)習(xí)在許多領(lǐng)域中都有廣泛的應(yīng)用,包括數(shù)據(jù)挖掘、機(jī)器視覺、自然語言處理等。
1.關(guān)鍵特點(diǎn)
- 無明確目標(biāo):與監(jiān)督學(xué)習(xí)不同,無監(jiān)督學(xué)習(xí)沒有明確的預(yù)測(cè)目標(biāo)。它的目的是在數(shù)據(jù)中尋找隱藏的模式或結(jié)構(gòu)。
- 不需要標(biāo)簽:在無監(jiān)督學(xué)習(xí)中,數(shù)據(jù)集中的樣本不需要預(yù)先標(biāo)記或分類。學(xué)習(xí)過程是通過數(shù)據(jù)內(nèi)在的相似性或關(guān)聯(lián)性來進(jìn)行的。
- 效果難以量化:由于無監(jiān)督學(xué)習(xí)沒有明確的預(yù)測(cè)目標(biāo),因此很難用一個(gè)統(tǒng)一的指標(biāo)來衡量其效果。通常,我們關(guān)注的是發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在結(jié)構(gòu)或關(guān)系。
2.應(yīng)用示例
- 異常值檢測(cè)(風(fēng)控):在金融領(lǐng)域,異常值檢測(cè)常用于識(shí)別潛在的欺詐行為或非正常交易模式。通過無監(jiān)督學(xué)習(xí),可以將交易數(shù)據(jù)根據(jù)其特征進(jìn)行聚類,然后識(shí)別出與大多數(shù)聚類明顯不同的樣本,這些樣本可能代表異常行為。
- 用戶細(xì)分:在市場(chǎng)營銷中,用戶細(xì)分是一個(gè)重要的步驟。通過無監(jiān)督學(xué)習(xí),可以根據(jù)用戶的特征和行為將他們分成不同的群體,以便更好地理解每個(gè)群體的需求和偏好,從而制定更有針對(duì)性的營銷策略。
- 推薦系統(tǒng):這是無監(jiān)督學(xué)習(xí)的一個(gè)廣泛應(yīng)用領(lǐng)域。通過分析用戶的瀏覽歷史、購買記錄等行為數(shù)據(jù),推薦系統(tǒng)可以識(shí)別出用戶可能感興趣的商品或內(nèi)容,并進(jìn)行相應(yīng)的推薦。這種推薦往往基于用戶之間的相似性或物品之間的關(guān)聯(lián)性。
3.常見的無監(jiān)督學(xué)習(xí)算法
- 聚類算法:這類算法的目標(biāo)是將相似的數(shù)據(jù)樣本聚集成不同的群組或簇。常見的聚類算法包括K-means、層次聚類、DBSCAN等。聚類算法在數(shù)據(jù)挖掘和圖像處理等領(lǐng)域有廣泛應(yīng)用。
- 降維算法:這類算法用于降低數(shù)據(jù)的維度,以減少計(jì)算復(fù)雜度和更好地理解數(shù)據(jù)的內(nèi)在結(jié)構(gòu)。常見的降維算法包括主成分分析(PCA)、t-分布鄰域嵌入算法(t-SNE)等。降維算法在可視化、特征提取和機(jī)器視覺等領(lǐng)域有重要應(yīng)用。
三·強(qiáng)化學(xué)習(xí)
1.定義
強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL)是機(jī)器學(xué)習(xí)的一個(gè)重要分支,它主要研究智能體(agent)在與環(huán)境(environment)的交互過程中如何通過學(xué)習(xí)策略以達(dá)成回報(bào)最大化或?qū)崿F(xiàn)特定目標(biāo)的問題。強(qiáng)化學(xué)習(xí)的核心思想是,智能體通過與環(huán)境進(jìn)行交互,不斷獲取新的信息并更新自身的策略,以最大化長(zhǎng)期的累積獎(jiǎng)勵(lì)。與監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)不同,強(qiáng)化學(xué)習(xí)沒有明確的正確答案或標(biāo)簽,而是依賴于環(huán)境的反饋來指導(dǎo)學(xué)習(xí)過程。
強(qiáng)化學(xué)習(xí)的常見模型是標(biāo)準(zhǔn)的馬爾可夫決策過程(Markov Decision Process,MDP),它由狀態(tài)
、動(dòng)作
和獎(jiǎng)勵(lì)
三個(gè)基本要素組成。在強(qiáng)化學(xué)習(xí)中,智能體根據(jù)當(dāng)前狀態(tài)選擇一個(gè)動(dòng)作,并從環(huán)境中獲得新的狀態(tài)和獎(jiǎng)勵(lì)。智能體的目標(biāo)是找到一個(gè)最優(yōu)策略,使得在給定狀態(tài)下采取最優(yōu)動(dòng)作能夠最大化長(zhǎng)期的累積獎(jiǎng)勵(lì)。
強(qiáng)化學(xué)習(xí)的算法可以分為策略搜索算法
和值函數(shù)(value function)算法
兩類。
策略搜索算法通過直接搜索策略空間來找到最優(yōu)策略,而值函數(shù)算法通過迭代更新值函數(shù)來逼近最優(yōu)策略。此外,深度學(xué)習(xí)模型可以在強(qiáng)化學(xué)習(xí)中得到使用,形成深度強(qiáng)化學(xué)習(xí)。
強(qiáng)化學(xué)習(xí)中兩個(gè)核心的概念就是:「智能體」agent和「環(huán)境」environment。環(huán)境表示智能體生存以及交互的世界。每一次交互時(shí),智能體會(huì)觀察到世界當(dāng)前所處「狀態(tài)」state的「觀測(cè)值」observation,然后決定采取什么「動(dòng)作」action。環(huán)境會(huì)隨著智能體的動(dòng)作而發(fā)生變化,當(dāng)然環(huán)境自身也可能一直處于變化中。
智能體會(huì)從環(huán)境中接收到一個(gè)「獎(jiǎng)勵(lì)」reward信號(hào),這個(gè)信號(hào)可能是一個(gè)數(shù)值,表示當(dāng)前環(huán)境所處狀態(tài)的好壞。智能體的目標(biāo)是:最大化「累積獎(jiǎng)勵(lì)」cumulative reward,也稱為「收益」return。強(qiáng)化學(xué)習(xí)方法就表示智能體通過學(xué)習(xí)行為來達(dá)到這個(gè)目標(biāo)的途徑。
強(qiáng)化學(xué)習(xí)算法的思路非常簡(jiǎn)單,以游戲?yàn)槔?,如果在游戲中采取某種策略可以取得較高的得分,那么就進(jìn)一步「強(qiáng)化」這種策略,以期繼續(xù)取得較好的結(jié)果。這種策略與日常生活中的各種「績(jī)效獎(jiǎng)勵(lì)」非常類似。我們平時(shí)也常常用這樣的策略來提高自己的游戲水平。
在 Flappy bird 這個(gè)游戲中,我們需要簡(jiǎn)單的點(diǎn)擊操作來控制小鳥,躲過各種水管,飛的越遠(yuǎn)越好,因?yàn)轱w的越遠(yuǎn)就能獲得更高的積分獎(jiǎng)勵(lì)。
2.示例場(chǎng)景
這就是一個(gè)典型的強(qiáng)化學(xué)習(xí)場(chǎng)景:
- 機(jī)器有一個(gè)明確的小鳥角色——代理
- 需要控制小鳥飛的更遠(yuǎn)——目標(biāo)
- 整個(gè)游戲過程中需要躲避各種水管——環(huán)境
- 躲避水管的方法是讓小鳥用力飛一下——行動(dòng)
- 飛的越遠(yuǎn),就會(huì)獲得越多的積分——獎(jiǎng)勵(lì)
你會(huì)發(fā)現(xiàn),強(qiáng)化學(xué)習(xí)和監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí) 最大的不同就是不需要大量的“數(shù)據(jù)喂養(yǎng)”。而是通過自己不停的嘗試來學(xué)會(huì)某些技能。
四·機(jī)器學(xué)習(xí)開發(fā)流程
文章來源:http://www.zghlxwxcb.cn/news/detail-800498.html
流程圖:文章來源地址http://www.zghlxwxcb.cn/news/detail-800498.html
到了這里,關(guān)于1.機(jī)器學(xué)習(xí)-機(jī)器學(xué)習(xí)算法分類概述的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!