1.1 獨(dú)熱編碼
提問(wèn):什么是獨(dú)熱編碼?
回答:獨(dú)熱編碼是一種常用的數(shù)據(jù)編碼方法,用于將分類(lèi)變量轉(zhuǎn)換為 二進(jìn)制
的表示形式。它將每個(gè)類(lèi)別表示為一個(gè)只包含 0和1
的二進(jìn)制向量,其中每個(gè)類(lèi)別對(duì)應(yīng)一個(gè)維度,維度上的值為1表示該樣本屬于該類(lèi)別,為0表示不屬于該類(lèi)別。
對(duì)于離散特征可以采用One-Hot編碼的方式來(lái)處理,使用M位狀態(tài)寄存器對(duì)M個(gè)狀態(tài)進(jìn)行編碼,M個(gè)變量用M維表示,每個(gè)維度的數(shù)值或?yàn)?,或?yàn)?。
舉例說(shuō)明:文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-769668.html
對(duì)于學(xué)歷特征,可以將其取值 “小學(xué)”、“中學(xué)”、“本科”、“碩士” 和 “博士” 進(jìn)行獨(dú)熱編碼。下面是各個(gè)取值的獨(dú)熱編碼示例:文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-769668.html
"小學(xué)":[1, 0, 0, 0, 0]
"中學(xué)":[0, 1, 0, 0, 0]
"本科":[0, 0, 1, 0, 0]
"碩士":[0, 0, 0, 1
到了這里,關(guān)于大數(shù)據(jù)HCIE成神之路之?dāng)?shù)據(jù)預(yù)處理(6)——特征編碼的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!