摘要: 本貼描述分類、回歸、聚類問(wèn)題的基本概念.
1. 基本概念
機(jī)器學(xué)習(xí)常識(shí) 2: 數(shù)據(jù)類型從輸入數(shù)據(jù)的角度來(lái)進(jìn)行討論, 這里從輸出數(shù)據(jù), 或者目標(biāo)的角度來(lái)討論.
分類是指將一個(gè)樣本預(yù)測(cè)為給定類別之一. 也稱為該樣本打標(biāo)簽.
-
例 1: 如果我去向那個(gè)女生表白, 她會(huì)同意嗎? (Y/N)
由于可能的類別只有兩種, 這被稱為二分類問(wèn)題. -
例 2: 哪個(gè)國(guó)家會(huì)奪得下屆奧運(yùn)會(huì)團(tuán)體射擊冠軍? (中國(guó)隊(duì)/美國(guó)隊(duì)/法國(guó)隊(duì)/…)
由于可能的類別有多種, 這被稱為多分類問(wèn)題.
回歸是指為一個(gè)輸出為實(shí)型值的預(yù)測(cè).
- 例 3: 根據(jù)一張照片判斷人的年齡. (
[
0
,
100
]
[0, 100]
[0,100])
由于人的年齡是實(shí)型 (雖然這里是整型, 但它的值可以比較大小, 也可以當(dāng)成實(shí)型對(duì)待) - 例 4: 根據(jù)某只股票這段時(shí)間的價(jià)格波動(dòng), 判斷明天的漲/跌. (
[
?
10
%
,
+
10
%
]
[-10\%, +10\%]
[?10%,+10%])
由于它的輸入數(shù)據(jù)是前面若干天的數(shù)據(jù), 而不是當(dāng)天的數(shù)據(jù), 這被稱為時(shí)序回歸問(wèn)題.
聚類是指根據(jù)樣本的屬性, 把給定的樣本集合劃分為若干個(gè)子集.
- 例 5: 把一大堆照片分成若干小堆. 如果能夠獲得關(guān)于這個(gè)劃分良好的解釋更好.
聚類與分類 (回歸) 之間存在本質(zhì)的區(qū)別, 它不進(jìn)行新樣本的預(yù)測(cè). 這是迫不得已的事情, 因?yàn)楹芏鄶?shù)據(jù)并沒(méi)有人類先給的標(biāo)簽, 導(dǎo)致缺乏一個(gè)確定的目標(biāo), 機(jī)器只有根據(jù)自己理解來(lái)劃分.文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-456608.html
2. 擴(kuò)展概念
多標(biāo)簽分類是指類別之間沒(méi)有互斥性.文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-456608.html
- 例 6: 明天的天氣如何? (有雨/無(wú)雨, 有風(fēng)/無(wú)風(fēng), 有太陽(yáng)/無(wú)太陽(yáng), …) 明天可以既刮風(fēng)又下雨, 甚至邊下雨邊出太陽(yáng).
- 例 7: 圖片中有哪些動(dòng)物? (貓, 狗, 老鼠)
到了這里,關(guān)于機(jī)器學(xué)習(xí)常識(shí) 3: 分類、回歸、聚類的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!