目錄
前言
課題背景和意義
實(shí)現(xiàn)技術(shù)思路
一、文獻(xiàn)綜述
二、基于用戶協(xié)同過(guò)濾推薦系統(tǒng)算法
三、實(shí)證分析
四、總結(jié)
實(shí)現(xiàn)效果圖樣例
最后
前言
? ? ??大四是整個(gè)大學(xué)期間最忙碌的時(shí)光,一邊要忙著備考或?qū)嵙?xí)為畢業(yè)后面臨的就業(yè)升學(xué)做準(zhǔn)備,一邊要為畢業(yè)設(shè)計(jì)耗費(fèi)大量精力。近幾年各個(gè)學(xué)校要求的畢設(shè)項(xiàng)目越來(lái)越難,有不少課題是研究生級(jí)別難度的,對(duì)本科同學(xué)來(lái)說(shuō)是充滿挑戰(zhàn)。為幫助大家順利通過(guò)和節(jié)省時(shí)間與精力投入到更重要的就業(yè)和考試中去,學(xué)長(zhǎng)分享優(yōu)質(zhì)的選題經(jīng)驗(yàn)和畢設(shè)項(xiàng)目與技術(shù)思路。
??對(duì)畢設(shè)有任何疑問(wèn)都可以問(wèn)學(xué)長(zhǎng)哦!
選題指導(dǎo):?https://blog.csdn.net/qq_37340229/article/details/128243277
大家好,這里是海浪學(xué)長(zhǎng)畢設(shè)專題,本次分享的課題是
??畢業(yè)設(shè)計(jì)-基于協(xié)同過(guò)濾算法的電商平臺(tái)推薦系統(tǒng)
課題背景和意義
電商平臺(tái)消費(fèi)客戶千人千面,客戶的需求、特征和其價(jià) 值體現(xiàn)相對(duì)比較復(fù)雜,并且受多方面的影響。分析歷史訂單信 息能準(zhǔn)確地定位買家的心理,進(jìn)一步調(diào)整運(yùn)營(yíng)方向以此提高客 戶忠誠(chéng)度,穩(wěn)定客流,保持平臺(tái)自身的競(jìng)爭(zhēng)力。以電商平臺(tái)為實(shí)例,借助協(xié)同過(guò)濾推薦算法,考慮用戶對(duì)商品的 偏好以及對(duì)熱門商品流行度進(jìn)行懲罰的措施,優(yōu)化推薦模型。在消費(fèi)品零售行業(yè)數(shù)字化的推動(dòng)下,網(wǎng)絡(luò)零售對(duì)國(guó)內(nèi)消 費(fèi)市場(chǎng)的貢獻(xiàn)作用持續(xù)提升。統(tǒng)計(jì)局最新數(shù)據(jù)顯示,2021 年, 全國(guó)網(wǎng)上零售額達(dá) 13.1 萬(wàn)億元,同比增長(zhǎng) 14.1%,增速比上 年加快 3.2 個(gè)百分點(diǎn)。隨著互聯(lián)網(wǎng)各類基礎(chǔ)設(shè)施的應(yīng)用和完 善,供應(yīng)商將數(shù)字技術(shù)應(yīng)用于產(chǎn)品研發(fā)、生產(chǎn)和銷售等環(huán)節(jié), 實(shí)現(xiàn)流程再造,從而促進(jìn)企業(yè)的智能化轉(zhuǎn)型升級(jí)。因此,探 索如何利用大數(shù)據(jù)、人工智能等技術(shù)分析消費(fèi)者的購(gòu)物習(xí)慣, 有助于電商平臺(tái)挖掘客戶個(gè)性化需求,實(shí)現(xiàn)精準(zhǔn)營(yíng)銷。在激烈的市場(chǎng)競(jìng)爭(zhēng)中,如何精準(zhǔn)定位買家的需求一直是電商平臺(tái)需要考慮的重點(diǎn)問(wèn)題。因此,研究用戶的行 為數(shù)據(jù),通過(guò)這些數(shù)據(jù)的信息分析出買家的購(gòu)買需求度,對(duì)實(shí)現(xiàn)個(gè)性化推薦具有一定的現(xiàn)實(shí)意義。
實(shí)現(xiàn)技術(shù)思路
一、文獻(xiàn)綜述
學(xué)者們對(duì)相關(guān)問(wèn)題進(jìn)行了研究,取得一定的成果。WIJAYA 表示吸 引購(gòu)買者關(guān)注的特征之一就是商品推薦特征,同時(shí)每個(gè)電子 商務(wù)平臺(tái)提供的功能完備性是買家決定在哪里進(jìn)行交易的標(biāo) 準(zhǔn)之一,因此電商企業(yè)需要構(gòu)建實(shí)現(xiàn)產(chǎn)品的精準(zhǔn)推薦系統(tǒng)。 HUSSIEN 使用統(tǒng)計(jì)方法改進(jìn)了傳統(tǒng)推薦系統(tǒng)算法,以提高向 客戶推薦列表的準(zhǔn)確性。HUSSIEN 對(duì)推薦系統(tǒng)的價(jià)值進(jìn)行 了研究概述,并對(duì)協(xié)同推薦系統(tǒng)技術(shù)進(jìn)行了深入分析,指出 協(xié)同推薦系統(tǒng)技術(shù)能更好根據(jù)客戶的興趣向客戶提出建議, 使客戶更容易搜索,從而選擇適合他的商品。
二、基于用戶協(xié)同過(guò)濾推薦系統(tǒng)算法
基于用戶協(xié)同過(guò)濾推薦系統(tǒng)算法基本步驟
通過(guò)協(xié)同過(guò)濾算法選取和目標(biāo)用戶相關(guān)的 K 個(gè)最相似的 用戶,在 K 個(gè)用戶的訂單記錄中選取目標(biāo)用戶尚未購(gòu)買的物 品進(jìn)行推薦,計(jì)算這 K 個(gè)用戶的推薦得分,從而選取得分最 高的 N 個(gè)商品,生成最后的推薦列表,主要步驟如下。
1、相似度計(jì)算
計(jì)算余弦相似度時(shí),需計(jì)算用戶共同購(gòu)買商品的次數(shù), 再統(tǒng)計(jì)每個(gè)用戶購(gòu)買商品的數(shù)目,這里采用余弦相似度進(jìn)行計(jì) 算,兩個(gè)用戶之間的相似度公式為:
?式中:Wuv 表示用戶 u 和用戶 v 的相似度;N(u) 表示用戶 u 歷史偏愛(ài)物品集合;N(v) 表示用戶 v 歷史偏愛(ài)物品集合。
2、用戶最近鄰搜尋
根據(jù)相似度將目標(biāo)用戶的近鄰用戶進(jìn)行排序后,選取前 K 個(gè)用戶進(jìn)入最近鄰集合。
3、預(yù)測(cè)評(píng)分并生成 top-N 推薦
完成最近鄰搜尋后能夠獲得目標(biāo)用戶的近鄰集,將項(xiàng)目按 照預(yù)測(cè)評(píng)分降序進(jìn)行排序,把前 N 個(gè)項(xiàng)目推薦給目標(biāo)用戶,Pu, j 為目標(biāo)用戶 u 對(duì)未評(píng)分項(xiàng)目 j 的預(yù)測(cè)評(píng)分,其計(jì)算公式為:
?式中:用戶 u 的最近鄰集合為 C;用戶 u 與鄰近用戶 v 之 間的相似度為 Wuv;鄰近用戶 v 對(duì)項(xiàng)目 j 的評(píng)分為 Rv, j 。
根據(jù)以上算法用戶前一年的購(gòu)買歷史數(shù)據(jù),預(yù)測(cè)他們?cè)?月有可能購(gòu)買的產(chǎn)品,并評(píng)估算法的準(zhǔn)確性。
老用戶推薦模型——考慮對(duì)熱門商品進(jìn)行懲罰
使用用戶興趣相似度的最簡(jiǎn)單的公式(余弦相似度公式), 推薦模型的預(yù)測(cè)結(jié)果中會(huì)出現(xiàn)大量的熱門商品的情況。原因是 根據(jù)余弦相似度公式進(jìn)行計(jì)算,熱門商品會(huì)頻繁的出現(xiàn)在用戶 和商品的共現(xiàn)矩陣中,熱門商品的頻繁出現(xiàn)導(dǎo)致在生成最后的 推薦列表中包含了大量重復(fù)的熱門商品,但這并不是個(gè)性化推 薦想得到的預(yù)期結(jié)果。在模型當(dāng)中為了更好地挖掘客戶的興趣 愛(ài)好,有必要對(duì)熱門商品的流行度進(jìn)行懲罰。
本文選用商品的流行度對(duì)相似度計(jì)算的算法進(jìn)行 改進(jìn)。改進(jìn)的用戶興趣相似度為:
?式中:選擇通過(guò)添加系數(shù) 1/?log 1?+ N|(i)|?來(lái)對(duì)熱門商品進(jìn)行 懲罰,這里的 N(i) 為商品的流行度,商品的流行度越高代表 著其懲罰系數(shù)越小,對(duì)相似度的影響會(huì)相應(yīng)的下降。
新用戶推薦模型——冷啟動(dòng)問(wèn)題
在推薦系統(tǒng)中,都是基于用戶的歷史行為數(shù)據(jù)集,而新 用戶并不存在歷史數(shù)據(jù)。用戶最鄰近搜索在用戶數(shù)量比較大的 時(shí)候,搜索的效率會(huì)得到極大的提升,本文中用戶數(shù)量和物品 數(shù)量并不算太大,選擇考慮將這一思想應(yīng)用到解決冷啟動(dòng)問(wèn)題 中。由于不存在客戶的基本信息,數(shù)據(jù)當(dāng)中唯一包含的客戶 信息只有客戶身份標(biāo)識(shí)號(hào)碼(Identity document,ID)這一項(xiàng), 相近的客戶 ID 意味著客戶可能是因?yàn)橥粋€(gè)渠道了解到這一 購(gòu)物平臺(tái),或者意味著客戶有著相同的購(gòu)物習(xí)慣,從而根據(jù)客 戶 ID 進(jìn)行近鄰搜索,尋找 ID 接近的用戶。
在對(duì)新用戶進(jìn)行推薦時(shí),考慮是否需要對(duì)熱門商品進(jìn)行 懲罰。本文考慮選用的是未對(duì)熱門商品進(jìn)行權(quán)重懲罰的模型, 在對(duì)新用戶進(jìn)行推薦的時(shí)候,本文挑選的是在統(tǒng)計(jì)意義上的優(yōu) 質(zhì)商品,或者是電商平臺(tái)主打的“明星產(chǎn)品”,這樣的推薦雖 然降低了一定的“個(gè)性化”推薦程度,但是針對(duì)歷史信息空 白的新用戶,推薦統(tǒng)計(jì)意義上的優(yōu)質(zhì)商品是一個(gè)不錯(cuò)的選擇。 在搜集到客戶一定的購(gòu)物歷史信息,再考慮對(duì)用戶的歷史行為 進(jìn)行分析,對(duì)其進(jìn)行個(gè)性化推薦。
推薦算法準(zhǔn)確性評(píng)估
通過(guò) Python 3.9.0 實(shí)現(xiàn)上述推薦算法,并使用準(zhǔn)確率 (Precision)和召回率(Recall)來(lái)評(píng)估算法的準(zhǔn)確性。 它的計(jì)算方式為
?式中:TP 為被模型預(yù)測(cè)為正的正樣本數(shù)量;FP 為被模型 預(yù)測(cè)為正的負(fù)樣本數(shù)量;FN 為被模型預(yù)測(cè)為負(fù)的正樣本數(shù)量。
結(jié)合電商購(gòu)物平臺(tái)的商品推薦場(chǎng)景,對(duì) Precision 和 Recall 進(jìn)行了改進(jìn),使評(píng)價(jià)結(jié)果更貼合實(shí)際場(chǎng)景。改進(jìn)后的計(jì) 算公式為
?同時(shí),本文考慮到企業(yè)更希望產(chǎn)品被更大范圍的推薦, 而不是僅僅推薦熱銷品,因此本文引入了覆蓋率 Cover 來(lái)評(píng)估 該推薦算法。它的計(jì)算公式為
三、實(shí)證分析
某禮品批發(fā)電商平臺(tái)一年中產(chǎn)生的訂單數(shù) 據(jù)。累計(jì) 378 823 條交易記錄,其中銷售出 3676 個(gè)產(chǎn)品,產(chǎn) 生了 19 636 個(gè)訂單。本文選擇在歷史數(shù)據(jù)集中選取 30% 的數(shù) 據(jù)當(dāng)作測(cè)試集,用于對(duì)本文建立的模型進(jìn)行評(píng)估。
老用戶推薦模型——考慮對(duì)熱門商品進(jìn)行懲罰
用原始的模型對(duì)預(yù)測(cè)數(shù)據(jù)中的老用戶進(jìn)行預(yù)測(cè),該推薦 模型對(duì)預(yù)測(cè)數(shù)據(jù)中未加懲罰預(yù)測(cè) 645 個(gè)存在歷史數(shù)據(jù)的老用戶 一共推薦了 1234 個(gè)商品種類,用加入懲罰之后的模型進(jìn)行預(yù) 測(cè),共推薦了 1308 個(gè)商品種類。兩個(gè)模型推薦次數(shù)前 5 的商 品如表所示。
?兩個(gè)模型推薦前 5 的商品有 4 個(gè)相同,且流行度都很高, 但加懲罰模型推薦熱門商品的次數(shù)明顯下降,下降 52.19%。 說(shuō)明非熱門商品推薦次數(shù)有明顯提升。
以 ID 為 12409 的老用戶為例,分別用兩個(gè)模型進(jìn)行商品 推薦,未加懲罰預(yù)測(cè)推薦商品流行度均分為 378.5,用加入懲 罰之后的模型對(duì)進(jìn)行預(yù)測(cè),推薦商品流行度均分為 332.5。推 薦商品得分如表所示。
?通過(guò)對(duì)比整體推薦次數(shù)和商品流行度本文不難發(fā)現(xiàn),熱 門商品的推薦次數(shù)減少的同時(shí),在個(gè)體的商品流行度上下降比 較明顯,而在整體的結(jié)果當(dāng)中,流行度高的商品依然占了較大 的比重。推薦系統(tǒng)推薦的高流行度商品的推薦頻次下降明顯,也就是意味著更多的流行度不低的商品被推薦出來(lái),推薦商品 的種類明顯提升。
新用戶推薦模型——冷啟動(dòng)問(wèn)題
根據(jù)鄰近 ID 用戶搜索得到推薦商品得分,以 ID 為 12367 的新用戶為例,搜尋臨近的客戶 ID,并且累加臨近的客戶 ID 的推薦列表得分,考慮對(duì)新用戶的推薦是否需要對(duì)熱門商品進(jìn) 行懲罰。用加入懲罰前后的模型預(yù)測(cè)最終的數(shù)據(jù),對(duì)新用戶的 預(yù)測(cè)結(jié)果(部分展示)如表所示。
?兩個(gè)模型推薦前 5 的商品只有一個(gè)相同,且加懲罰模型 推薦熱門商品的流行度較低,且推薦熱門商品的次數(shù)明顯下 降,說(shuō)明非熱門商品推薦次數(shù)有明顯提升。 加懲罰模型和不加懲罰模型的商品推薦對(duì)比如圖所示。
?從圖中可以很直觀看出,模型加入懲罰之后推薦的商品種類 得到了明顯的提升,加入懲罰的模型商品的推薦更加多樣化, 商品的覆蓋率更高。對(duì)比兩模型下熱門商品流行度可見(jiàn),推薦 出來(lái)的商品依舊是流行度較高的商品。加入懲罰之后雖然在推 薦模型當(dāng)中出現(xiàn)了更多的商品,熱門商品依然會(huì)出現(xiàn)在推薦的 列表當(dāng)中,雖然熱門商品的推薦順序會(huì)相對(duì)延后,但流行度不 高的商品也有機(jī)會(huì)出現(xiàn)在流行度高的商品之前,這樣的推薦更 具有個(gè)性化,而不是千篇一律的熱門商品,加入懲罰之后的模 型依然是保持著優(yōu)質(zhì)推薦的基礎(chǔ)理念進(jìn)行推薦。
加入懲罰的模型對(duì)用戶購(gòu)買商品的行為進(jìn)行預(yù) 測(cè),預(yù)測(cè)的部分結(jié)果如表所示。
推薦算法準(zhǔn)確性評(píng)估
本文基于商品和客戶之間的關(guān)系對(duì)客戶進(jìn)行了個(gè)性化的 銷售預(yù)測(cè),將平臺(tái)歷史數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集。同時(shí),利 用加入懲罰模型和用推薦得分代替相似度權(quán)重的模型進(jìn)行銷 售預(yù)測(cè),對(duì)比兩者的準(zhǔn)確率、召回率 、覆蓋度及推薦商品流 行度,結(jié)果如表所示。
?用推薦得分代替相似度權(quán)重的模型的準(zhǔn)確率在所有的測(cè) 試集上有 35% 左右,也就是說(shuō)在推薦的 10 個(gè)商品中平均有 3.5 個(gè)商品會(huì)被客戶購(gòu)買,該模型的召回率有 40% 左右,意味著 在客戶每購(gòu)買 10 個(gè)商品中大約有 4 個(gè)商品會(huì)出現(xiàn)在本文的推 薦列表中。準(zhǔn)確率和召回率相差不大,意味著在測(cè)試集的數(shù)據(jù) 當(dāng)中,用戶平均購(gòu)買商品的種類在 10 左右,也就是一個(gè)用戶 大概會(huì)購(gòu)買 10 種商品??紤]到該數(shù)據(jù)集中用戶和物品的信息 有限,無(wú)法像深度學(xué)習(xí)模型一樣挖掘深層次的客戶物品交叉特 征,這個(gè)準(zhǔn)確率和召回率是在一個(gè)可以接受的范圍之 內(nèi)的。
四、總結(jié)
利用平臺(tái)的訂單數(shù)據(jù),利用基于用戶協(xié)同過(guò)濾算法 實(shí)現(xiàn)對(duì)客戶的個(gè)性化推薦??紤]到流行商品在推薦中的權(quán)重較 大,在傳統(tǒng)的基于用戶的協(xié)同過(guò)濾推薦算法上添加了懲罰 以平衡推薦結(jié)果的均衡性,同時(shí)解決新用戶的冷啟動(dòng)問(wèn)題。
實(shí)現(xiàn)效果圖樣例
電商平臺(tái)推薦系統(tǒng):
我是海浪學(xué)長(zhǎng),創(chuàng)作不易,歡迎點(diǎn)贊、關(guān)注、收藏、留言。文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-720842.html
畢設(shè)幫助,疑難解答,歡迎打擾!文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-720842.html
最后
到了這里,關(guān)于畢業(yè)設(shè)計(jì)-基于協(xié)同過(guò)濾算法的電商平臺(tái)推薦系統(tǒng)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!