基于系統(tǒng)決策樹分類的移動用戶體驗(yàn)影響因素研究
?
?摘要
? ? ? ? 本題主要是一個(gè)研究預(yù)測模型,以中國移動通信集團(tuán)北京公司為背景,讓客戶根據(jù) 自身在網(wǎng)絡(luò)覆蓋與信號強(qiáng)度方面的體驗(yàn)和語音通話過程中的整體體驗(yàn)來進(jìn)行語音通話 整體滿意度的打分,統(tǒng)計(jì)出客戶語音業(yè)務(wù)體驗(yàn)中的影響因素,從而提升客戶語音業(yè)務(wù)滿 意度。通過分析影響滿意度的各項(xiàng)因素,得出量化分析結(jié)果,進(jìn)而進(jìn)行預(yù)測研究。本文 主要建立了決策樹分類模型,隨機(jī)森林和梯度提升樹分類模型,基于這三個(gè)模型,進(jìn)行 附加 1 和附件 2 的滿意度評估,附件 3 和附件 4 的打分預(yù)測。
? ? ? ?針對問題一,主要有三個(gè)小問題,首先分析影響客戶語音業(yè)務(wù)的主要因素,然后分 析影響客戶上網(wǎng)業(yè)務(wù)的主要因素,最后給出各因素對客戶打分影響程度的量化分析和結(jié) 果,也就是說給出個(gè)影響因素的影響權(quán)重。在解決問題時(shí),首先進(jìn)行了數(shù)據(jù)預(yù)處理的操 作,對附件 1 和附件 2 中的數(shù)據(jù)進(jìn)行了數(shù)據(jù)的刪減與補(bǔ)充、數(shù)據(jù)編碼和整體性分析等操 作,同時(shí)進(jìn)行了異常值的處理。然后,我們建立決策樹分類模型,隨機(jī)森林分類模型來 解決該問題,訓(xùn)練數(shù)據(jù)的過程中,對數(shù)據(jù)的預(yù)測精度進(jìn)行了較好的把控,根據(jù)預(yù)測精度 選擇合適的模型,合適的參數(shù)值。主要使用了決策樹的分類模型,得到了語音業(yè)務(wù)和手 機(jī)上網(wǎng)業(yè)務(wù)是相關(guān)影響因素的權(quán)重,在文中也給出了相應(yīng)的表格。之后得出結(jié)果:影響 客戶語音業(yè)務(wù)滿意度的主要因素有 4 個(gè),分別是當(dāng)月 ARPU、是否遇到網(wǎng)絡(luò)問題、前三 月 MOU 和 GPRS 國際漫游流量;影響客戶手機(jī)上網(wǎng)業(yè)務(wù)滿意度的主要因素有 4 個(gè),分 別是上網(wǎng)過程中網(wǎng)絡(luò)時(shí)斷時(shí)續(xù)或時(shí)快時(shí)慢、重定向次數(shù)、優(yōu)酷視頻使用流量和當(dāng)月 MOU。 最后計(jì)算數(shù)據(jù)得出了各因素對客戶打分項(xiàng)目的影響程度,得出了量化分析結(jié)果,在文中 主要以權(quán)重表格的方式呈現(xiàn)。
? ? ? ?針對問題二,根據(jù)題目要求,需要建立客戶打分基于相關(guān)影響因素的相關(guān)數(shù)學(xué)模型, 該題仍然可以使用第一問的模型,在這里補(bǔ)充使用了梯度提升樹模型,根據(jù)預(yù)測精度選 擇合適的模型。首先我們根據(jù)問題一的預(yù)測結(jié)果,對相關(guān)訓(xùn)練集進(jìn)行預(yù)測精度的檢查, 發(fā)現(xiàn)預(yù)測精度高于 97%,證明該模型具備較高的合理性,接著開始進(jìn)行實(shí)際性預(yù)測,先 對附件 3 和附件 4 的表格數(shù)據(jù)進(jìn)行預(yù)處理,預(yù)處理之后使數(shù)據(jù)成為了與問題一的訓(xùn)練數(shù) 據(jù)完全一樣的格式,接著代入模型,得出了所有客戶打分的分類預(yù)測結(jié)果,根據(jù)題目要 求,將預(yù)測結(jié)果填入到 result 表格中,完成預(yù)測任務(wù),最終我們對結(jié)果的合理性進(jìn)行了 分析和解釋說明。
關(guān)鍵詞:決策樹分類 數(shù)據(jù)預(yù)處理 隨機(jī)森林分類 影響權(quán)重 梯度提升樹分
目錄
一、問題的重述...................................................................................................................... 1
1.1 問題背景..................................................................................................................... 1
1.2 問題要求..................................................................................................................... 1
二、問題的分析...................................................................................................................... 1
2.1 問題一的分析............................................................................................................. 1
2.2 問題二的分析............................................................................................................. 1
三、模型的假設(shè)...................................................................................................................... 2
四、符號說明.......................................................................................................................... 2
五、模型的建立與求解.......................................................................................................... 2
5.1 問題一的初步分析求解............................................................................................. 2
5.1.1 數(shù)據(jù)預(yù)處理....................................................................................................... 3
5.1.2 數(shù)據(jù)整體性分析............................................................................................... 4
5.2 問題一模型建立與求解............................................................................................. 5
5.2.1 基于決策樹模型的建立................................................................................... 5
5.2.2 影響客戶滿意度主要因素............................................................................... 7
5.2.3 各因素對客戶打分的影響程度..................................................................... 11
5.3 問題二模型建立與求解........................................................................................... 14
5.3.1 決策樹分類模型的訓(xùn)練................................................................................. 14
5.3.2 基于決策樹分類的預(yù)測................................................................................. 15
六、結(jié)果檢驗(yàn)和誤差分析.................................................................................................... 17
6.1 結(jié)果檢驗(yàn)................................................................................................................... 17
6.2 誤差分析................................................................................................................... 17
七、模型的評價(jià)與推廣........................................................................................................ 18
7.1 模型的優(yōu)點(diǎn)............................................................................................................... 18
7.2 模型的缺點(diǎn)............................................................................................................... 18
7.3 模型的推廣............................................................................................................... 18
八、參考文獻(xiàn)........................................................................................................................ 18
九、附錄................................................................................................................................ 19
一、問題的重述
1.1 問題背景
? ? ? ?客戶對運(yùn)營商開發(fā)產(chǎn)品的服務(wù)滿意程度即客戶滿意度,反映出了客戶對產(chǎn)品的期 望與實(shí)際使用體驗(yàn)之間的差異。隨著信息越來越透明,產(chǎn)品同質(zhì)化,客戶滿意度愈來 愈能體現(xiàn)各大運(yùn)營商市場運(yùn)營狀況。在我們熟知的數(shù)字信息時(shí)代,客戶體驗(yàn)是很重要 的一項(xiàng)指標(biāo),客戶反饋是有利于商業(yè)決策的,商業(yè)決策有時(shí)候可以為公司帶來豐厚的 回報(bào),各大公司運(yùn)用合適的經(jīng)營手段,建立起客戶相關(guān)的改善體系,進(jìn)一步實(shí)現(xiàn)客戶 滿意度評價(jià)的數(shù)字化方向轉(zhuǎn)型,從而來推動移動網(wǎng)絡(luò)這一領(lǐng)域的的高質(zhì)量和 可持續(xù)發(fā) 展。傳統(tǒng)提升客戶滿意度的方法是根據(jù)客戶投訴,逐點(diǎn)解決影響用戶體驗(yàn)的問題。但 是用戶的數(shù)量,產(chǎn)品的種類,客戶的需求促使運(yùn)營商們需要尋求更加有效的方法,從 而實(shí)現(xiàn)更早、更全面的提升客戶滿意度。
? ? ? ?中國移動通信集團(tuán)北京公司,讓客戶根據(jù)自身在網(wǎng)絡(luò)覆蓋與信號強(qiáng)度方面的體驗(yàn) 和語音通話過程中的整體體驗(yàn)來進(jìn)行語音通話整體滿意度的打分,統(tǒng)計(jì)出客戶語音業(yè) 務(wù)體驗(yàn)中的影響因素,從而提升客戶語音業(yè)務(wù)滿意度。同時(shí),中國移動北京公司還讓 客戶根據(jù)自身在手機(jī)上網(wǎng)中的整體體驗(yàn),以及在網(wǎng)絡(luò)覆蓋與信號強(qiáng)度方面的體驗(yàn)來進(jìn) 行手機(jī)上網(wǎng)整體滿意度的打分,并統(tǒng)計(jì)整理出影響客戶上網(wǎng)體驗(yàn)中的影響因素,從而 提升客戶的上網(wǎng)體驗(yàn)。
1.2 問題要求
問題一:首先第一小問是根據(jù)附件一和附件二,分別研究影響客戶語音業(yè)務(wù)和上 網(wǎng)業(yè)務(wù)滿意度的主要因素,然后第二小問是在第一小問的基礎(chǔ)上給出各因素對客戶打 分影響程度的量化分析和結(jié)果。
問題二:結(jié)合問題一中的分析,由此分別建立基于客戶語音業(yè)務(wù)和上網(wǎng)業(yè)務(wù)中影 響客戶打分的相關(guān)因素的數(shù)學(xué)模型;據(jù)此對附件三和附件四中的客戶打分進(jìn)行預(yù)測研 究分析,并將預(yù)測結(jié)果分別填寫在 result.xlsx 的 sheet1“語音”和 sheet2“上網(wǎng)”兩個(gè)工作 表中,上傳到競賽平臺說明預(yù)測的合理性。
二、問題的分析
2.1 問題一的分析
? ? ? ? 在解決問題一時(shí),根據(jù)題目要求,將題目分為三小問。首先分析影響客戶語音業(yè) 務(wù)的主要因素,然后分析影響客戶上網(wǎng)業(yè)務(wù)的主要因素,最后給出各因素對客戶打分 影響程度的量化分析和結(jié)果,也就是說給出個(gè)影響因素的影響權(quán)重。解決問題時(shí),需 要對數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理操作,通過觀察表格發(fā)現(xiàn),表格中有一些數(shù)據(jù)缺失,而且為 了方便數(shù)據(jù)處理,需要刪減一些數(shù)據(jù),同時(shí)在經(jīng)過異常值檢測后,完成數(shù)據(jù)預(yù)處理的 工作。接下來為了解決問題,引入決策樹分類模型,我們又根據(jù)預(yù)測精度合理的進(jìn)行 了模型的選用和參數(shù)選取,最終,我們給出了影響相關(guān)滿意度的權(quán)重,得到了主要因 素,同時(shí)給出了相關(guān)權(quán)重表格和統(tǒng)計(jì)圖。
2.2 問題二的分析
? ? ? ?在解決問題二時(shí),根據(jù)題目要求,我們發(fā)現(xiàn)我們已經(jīng)建立了客戶打分基于相關(guān)影 響因素的相關(guān)數(shù)學(xué)模型,也就是決策樹模型,首先我們根據(jù)問題一的預(yù)測結(jié)果,對相 關(guān)訓(xùn)練集進(jìn)行預(yù)測精度的檢查,發(fā)現(xiàn)預(yù)測精度高于 95%,證明該模型具備較高的合理 性,同時(shí),我們又對該模型的合理性進(jìn)行了分析和解釋說明。然后,解決問題時(shí),首 2 先對附件 3 和附件 4 的表格數(shù)據(jù)進(jìn)行預(yù)處理,預(yù)處理之后使數(shù)據(jù)成為了與問題一的訓(xùn) 練數(shù)據(jù)完全一樣的格式,接著在模型進(jìn)行引入后,得出了所有客戶打分的分類預(yù)測結(jié) 果,最終,我們對結(jié)果的合理性進(jìn)行了分析和解釋說明。
三、模型的假設(shè)
為了便于模型求解,現(xiàn)做如下假設(shè):
? ? ? 忽略影響因素之間彼此的影響,便于量化分析的計(jì)算;
? ? ? 檢測分析時(shí),不考慮可能產(chǎn)生的極端因素的影響;
? ? ? 假定實(shí)驗(yàn)數(shù)據(jù)在進(jìn)行處理的過程中沒有人為的操作誤差;
? ? ? 假定在試驗(yàn)的過程中除因素自身外其他影響指標(biāo)的因素都保持不變;
? ? ? 預(yù)測研究時(shí),不考慮極端異常值對實(shí)驗(yàn)預(yù)測結(jié)果的影響。
四、符號說明
五、模型的建立與求解
5.1 問題一的初步分析求解
? ? ? ?首先根據(jù)題目的要求將題目分為三個(gè)小問。首先分析兩個(gè)主要因素,也就是影響 客戶語音業(yè)務(wù)的主要因素和影響客戶上網(wǎng)業(yè)務(wù)的主要因素,其次分析影響權(quán)重,也就 是給出各因素對客戶打分影響程度的量化分析和結(jié)果。在解決問題時(shí),需要對數(shù)據(jù)進(jìn) 3 行數(shù)據(jù)預(yù)處理操作,通過觀察表格發(fā)現(xiàn),表格中有一些數(shù)據(jù)缺失,因此需要添加一些 數(shù)據(jù),而且為了方便數(shù)據(jù)處理,需要刪減一些數(shù)據(jù),同時(shí)在經(jīng)過異常值檢測后,完成 了數(shù)據(jù)預(yù)處理的工作。接下來引入決策樹分類模型,我們又根據(jù)預(yù)測精度合理的進(jìn)行 了模型的選用和參數(shù)選取,也就是引入了隨機(jī)森林等模型。最終,我們給出了影響相 關(guān)客戶打分滿意度的權(quán)重,得到了主要因素,同時(shí)給出了相關(guān)權(quán)重表格和統(tǒng)計(jì)圖,并 進(jìn)行了分析說明。
5.1.1 數(shù)據(jù)預(yù)處理
? ? ? ?為了方便數(shù)據(jù)的分析與計(jì)算,首先對數(shù)據(jù)進(jìn)行預(yù)處理,從而更加簡便而且更加直 觀的分析出影響滿意度的主要因素,也更加便于通過結(jié)合決策樹分類的類型,分析出 各個(gè)主要因素之間的統(tǒng)計(jì)規(guī)律。
Step1.數(shù)據(jù)的刪減和補(bǔ)充添加
? ? ? ? 在進(jìn)行數(shù)據(jù)的處理之前,需要對表格進(jìn)行比較深度的理解,通過對表格 5 的一定 行分析理解,對表格數(shù)據(jù)尤其是表格中空白的數(shù)據(jù)進(jìn)行理解,接下來去進(jìn)行數(shù)據(jù)預(yù)處 理操作,我們重點(diǎn)關(guān)注表格中一些空白的數(shù)據(jù)。 對于附件一中的用戶描述數(shù)據(jù)是空白的,根據(jù)附件 5 中的文字說明,即除了前面 幾個(gè)場景之外的情況,-1 表示沒有,98 就表示有,用戶描述是具體的情況,沒有的時(shí) 候是空的,可以分析得到這一行數(shù)據(jù)可以直接刪去。 對于附件一中的重定向次數(shù)和重定向駐留時(shí)長,雖然其數(shù)據(jù)不是完全缺失,但數(shù) 據(jù)值明顯缺失較多,根據(jù)附件 5 的相關(guān)文字說明,發(fā)現(xiàn)這兩個(gè)數(shù)據(jù)和上網(wǎng)滿意度有較 大的關(guān)系,和語音滿意度幾乎沒有關(guān)系,因此說這一行數(shù)據(jù)可以直接刪去。 對于附件一中的是否關(guān)懷用戶和是否去過營業(yè)廳數(shù)據(jù),根據(jù)附件 5 的相關(guān)信息, 發(fā)現(xiàn)空白的即為“否”,所以說將空白表格填上“否”即可。下表展示了附件一的數(shù) 據(jù)處理方法
六、結(jié)果檢驗(yàn)和誤差分析
七、模型的評價(jià)與推廣
八、參考文獻(xiàn)
九、附錄
因論文的長度過長,不在一一列舉。 我以上傳論文,請感興趣去下面的網(wǎng)址自取。本論文以獲本科組一等獎,如果各位覺得還可以,請點(diǎn)贊關(guān)注啦,謝謝各位
GitHub - Ggy-king/MathorCup-University-Mathematical-Modeling-Challenge-big-Data: MathorCup高校數(shù)學(xué)建模挑戰(zhàn)賽大數(shù)據(jù) 本科組省一MathorCup高校數(shù)學(xué)建模挑戰(zhàn)賽大數(shù)據(jù) 本科組省一. Contribute to Ggy-king/MathorCup-University-Mathematical-Modeling-Challenge-big-Data development by creating an account on GitHub.https://github.com/Ggy-king/MathorCup-University-Mathematical-Modeling-Challenge-big-Data文章來源:http://www.zghlxwxcb.cn/news/detail-437434.html
如果上面的網(wǎng)址打不開請用下面的網(wǎng)址:
不愿意學(xué)全棧的小白 / MathorCup University Mathematical Modeling Challenge Big Data · GitCodeMathorCup高校數(shù)學(xué)建模挑戰(zhàn)賽大數(shù)據(jù) 本科組一等獎https://gitcode.net/qq_63438888/MathorCup-University-Mathematical-Modeling-Challenge-big-Data文章來源地址http://www.zghlxwxcb.cn/news/detail-437434.html
到了這里,關(guān)于第三屆2022MathorCup高校數(shù)學(xué)建模挑戰(zhàn)賽大數(shù)據(jù)論文加代碼(附詳解)的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!