全文鏈接:http://tecdat.cn/?p=32118
假如你有一個購物類的網(wǎng)站,那么你如何給你的客戶來推薦產(chǎn)品呢?(點擊文末“閱讀原文”獲取完整文檔、數(shù)據(jù))
相關(guān)視頻
這個功能在很多電商類網(wǎng)站都有,那么,通過SQL Server Analysis Services的數(shù)據(jù)挖掘功能,你也可以輕松的來構(gòu)建類似的功能。
將分為三個部分來演示如何實現(xiàn)這個功能。
此篇文章演示了如何幫助客戶使用SQL Server Analysis Services基于此問題來構(gòu)建簡單的挖掘模型。
步驟
準(zhǔn)備工作:數(shù)據(jù).xls 數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫中。
在相應(yīng)數(shù)據(jù)庫中找到對應(yīng)的數(shù)據(jù)
(1)?打開visual?studio,新建項目,選擇商業(yè)智能項目,analysis?services項目
將data-mining數(shù)據(jù)庫中的數(shù)據(jù)導(dǎo)入數(shù)據(jù)源
在可用對象中,將要分析數(shù)據(jù)所在表添加到包含的對象中,繼續(xù)下一步。
在解決方案資源管理器中,右鍵單擊挖掘結(jié)構(gòu),選擇新建挖掘結(jié)構(gòu)。
選擇microsoft?決策樹,繼續(xù)下一步
設(shè)置測試集和訓(xùn)練集
勾選允許鉆取,完成。
然后對模型進行部署,繼而進行挖掘(點擊運行)
決策樹模型
以下我們對電商購物網(wǎng)站的用戶的信譽等級進行預(yù)測,使用其他用戶的特征屬性對其進行預(yù)測分類。建立如下的決策樹模型。
從決策樹模型的結(jié)果來看,
樹一共有5個分支。其中重要節(jié)點分別為購物積分、家里人口數(shù)、居住面積、居住面積等。
點擊標(biāo)題查閱往期內(nèi)容
PYTHON用戶流失數(shù)據(jù)挖掘:建立邏輯回歸、XGBOOST、隨機森林、決策樹、支持向量機、樸素貝葉斯和KMEANS聚類用戶畫像
左右滑動查看更多
01
02
03
04
從圖中可以看到購物積分越高的用戶,決策樹得到的用戶信譽等級越高。同時家里人口數(shù)越多,則信譽等級也越高。說明購物積分直接影響著信譽等級。一般購物次數(shù)越多則買家的信譽越高。同時家里人口數(shù)越多,則該用戶在網(wǎng)上購物的開支越多。因此會導(dǎo)致網(wǎng)上購物越多,最后導(dǎo)致信譽增加。
然后可以看到依賴網(wǎng)絡(luò)。依賴網(wǎng)絡(luò)圖是指預(yù)測變量和其他變量直接的依賴性。從圖中可以看到在用戶屬性中,幾個屬性會影響信用等級,包括購物積分、次數(shù)、居住面積以及人口數(shù)量。
聚類
從聚類結(jié)果可以看到,聚類將所有用戶分成了10個信用級別。
從不同類別的依賴圖可以看到,類別10、4、8、5之間具有較強的相關(guān)關(guān)系。說明這幾個類別中的信用級別是類似的。下面可以具體看下每個類別中的各個屬性的分布的比例。
從上圖可以看到不同類別的購物積分是不同的。
總的來看,相對來說,第4和7類別的購物積分最小的,其他幾個類別中積分較高,因此可以認(rèn)為這些類別中的用戶的信用級別較高。同時可以看到這些類別的其他信息,這類用戶的月收入較低,購物次數(shù)也較小。同時可以看到,這類用戶大多的交易成功也較少。另一方面,可以看到低購物積分用戶中 ,家庭人口數(shù)也較小。
從每個類別的傾向程度來看,購物總次數(shù)多的用戶交易成功次數(shù)也高。從另一方面來看,月收入較高的用戶,傾向于是非分類1的用戶,也就是它們的信用等級較好。同時可以看到,戶交易成功次數(shù)多喝購物積分高的用戶傾向于非分類1的用戶。說明用戶的信用等級相對較高。另一方面,可以看到擁有房屋的用戶的交易成功次數(shù) 電商網(wǎng)站購物次數(shù)反而低于沒有房屋的用戶,可能是因為沒有房屋的用戶年齡段較低,因此更傾向于網(wǎng)絡(luò)購物。
然后建立關(guān)聯(lián)規(guī)則挖掘模型
運行關(guān)聯(lián)規(guī)則,得到以下重要的關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則就是發(fā)現(xiàn)數(shù)據(jù)集中相互有關(guān)聯(lián)的項目。它已經(jīng)成為數(shù)據(jù)挖掘領(lǐng)域中具有重要影響的一種算法。也是數(shù)據(jù)挖掘領(lǐng)域的一個重要分支。最近幾年已經(jīng)被廣泛的應(yīng)用。在電子商務(wù)領(lǐng)域,關(guān)聯(lián)規(guī)則技術(shù)主要用于物品鏈接頁面等的推薦,它只需要購物記錄的數(shù)據(jù)即可,而不需要過多的商品信息,通過關(guān)聯(lián)規(guī)則可以發(fā)現(xiàn)用戶的一些常見的購物模式和購物規(guī)律。找出用戶通常會一起購買的商品。從而對用戶進行推薦和挖掘。
本文中分析的數(shù)據(jù)和完整文檔分享到會員群,掃描下面二維碼即可加群!
點擊文末“閱讀原文”
獲取全文完整數(shù)據(jù)資料。
本文選自《SQL SERVER ANALYSIS SERVICES決策樹、聚類、關(guān)聯(lián)規(guī)則挖掘分析電商購物網(wǎng)站的用戶行為數(shù)據(jù)》。
點擊標(biāo)題查閱往期內(nèi)容
Python對商店數(shù)據(jù)進行l(wèi)stm和xgboost銷售量時間序列建模預(yù)測分析
PYTHON集成機器學(xué)習(xí):用ADABOOST、決策樹、邏輯回歸集成模型分類和回歸和網(wǎng)格搜索超參數(shù)優(yōu)化
R語言集成模型:提升樹boosting、隨機森林、約束最小二乘法加權(quán)平均模型融合分析時間序列數(shù)據(jù)
Python對商店數(shù)據(jù)進行l(wèi)stm和xgboost銷售量時間序列建模預(yù)測分析
R語言用主成分PCA、?邏輯回歸、決策樹、隨機森林分析心臟病數(shù)據(jù)并高維可視化
R語言基于樹的方法:決策樹,隨機森林,Bagging,增強樹
R語言用邏輯回歸、決策樹和隨機森林對信貸數(shù)據(jù)集進行分類預(yù)測
spss modeler用決策樹神經(jīng)網(wǎng)絡(luò)預(yù)測ST的股票
R語言中使用線性模型、回歸決策樹自動組合特征因子水平
R語言中自編基尼系數(shù)的CART回歸決策樹的實現(xiàn)
R語言用rle,svm和rpart決策樹進行時間序列預(yù)測
python在Scikit-learn中用決策樹和隨機森林預(yù)測NBA獲勝者
python中使用scikit-learn和pandas決策樹進行iris鳶尾花數(shù)據(jù)分類建模和交叉驗證
R語言里的非線性模型:多項式回歸、局部樣條、平滑樣條、 廣義相加模型GAM分析
R語言用標(biāo)準(zhǔn)最小二乘OLS,廣義相加模型GAM?,樣條函數(shù)進行邏輯回歸LOGISTIC分類
R語言ISLR工資數(shù)據(jù)進行多項式回歸和樣條回歸分析
R語言中的多項式回歸、局部回歸、核平滑和平滑樣條回歸模型
R語言用泊松Poisson回歸、GAM樣條曲線模型預(yù)測騎自行車者的數(shù)量
R語言分位數(shù)回歸、GAM樣條曲線、指數(shù)平滑和SARIMA對電力負荷時間序列預(yù)測
R語言樣條曲線、決策樹、Adaboost、梯度提升(GBM)算法進行回歸、分類和動態(tài)可視化
如何用R語言在機器學(xué)習(xí)中建立集成模型?
R語言ARMA-EGARCH模型、集成預(yù)測算法對SPX實際波動率進行預(yù)測
在python 深度學(xué)習(xí)Keras中計算神經(jīng)網(wǎng)絡(luò)集成模型
R語言ARIMA集成模型預(yù)測時間序列分析
R語言基于Bagging分類的邏輯回歸(Logistic Regression)、決策樹、森林分析心臟病患者
R語言基于樹的方法:決策樹,隨機森林,Bagging,增強樹
R語言基于Bootstrap的線性回歸預(yù)測置信區(qū)間估計方法
R語言使用bootstrap和增量法計算廣義線性模型(GLM)預(yù)測置信區(qū)間
R語言樣條曲線、決策樹、Adaboost、梯度提升(GBM)算法進行回歸、分類和動態(tài)可視化
Python對商店數(shù)據(jù)進行l(wèi)stm和xgboost銷售量時間序列建模預(yù)測分析
R語言隨機森林RandomForest、邏輯回歸Logisitc預(yù)測心臟病數(shù)據(jù)和可視化分析
R語言用主成分PCA、?邏輯回歸、決策樹、隨機森林分析心臟病數(shù)據(jù)并高維可視化
Matlab建立SVM,KNN和樸素貝葉斯模型分類繪制ROC曲線
matlab使用分位數(shù)隨機森林(QRF)回歸樹檢測異常值
文章來源:http://www.zghlxwxcb.cn/news/detail-601769.html
文章來源地址http://www.zghlxwxcb.cn/news/detail-601769.html
到了這里,關(guān)于SQL SERVER ANALYSIS SERVICES決策樹、聚類、關(guān)聯(lián)規(guī)則挖掘分析電商購物網(wǎng)站的用戶行為數(shù)據(jù)...的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!