在傳統(tǒng)的軟件工程中,核心是代碼,然而,在機器學習項目中,重點則是特征——也就是說,開發(fā)人員優(yōu)化模型的方法之一是增加和改進其輸入特征。很多時候,優(yōu)化特征比優(yōu)化模型帶來的增益要大得多。
筆者曾經(jīng)參與過一個“商品推薦”的項目,在項目中,筆者發(fā)現(xiàn)商品的類目(劃分類別的標記,如紙品家清、米面糧油、數(shù)碼產(chǎn)品等)雖然有 100 多個,但是運營人員經(jīng)驗不足,將超過 70% 的商品采用了默認的類目(精品好貨)標記。如此一來,原本可以用來標記商品類型的關(guān)鍵特征(類目)的實際作用大打折扣。于是,我們重新整理了這個特征,將所有商品重新標記,在未改變算法模型的前提下,推薦效果(uvctr)提升了8%+。
目錄
1.將原始數(shù)據(jù)映射到特征文章來源:http://www.zghlxwxcb.cn/news/detail-513868.html
1.1 映射數(shù)值文章來源地址http://www.zghlxwxcb.cn/news/detail-513868.html
到了這里,關(guān)于機器學習7:特征工程的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!