国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析

這篇具有很好參考價(jià)值的文章主要介紹了數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析

作者:i阿極

作者簡(jiǎn)介:Python領(lǐng)域新星作者、多項(xiàng)比賽獲獎(jiǎng)?wù)撸翰┲鱾€(gè)人首頁(yè)

??????如果覺(jué)得文章不錯(cuò)或能幫助到你學(xué)習(xí),可以點(diǎn)贊??收藏??評(píng)論??+關(guān)注哦!??????

??????如果有小伙伴需要數(shù)據(jù)集和學(xué)習(xí)交流,文章下方有交流學(xué)習(xí)區(qū)!一起學(xué)習(xí)進(jìn)步!??


一、前言

旅游景區(qū)作為旅游業(yè)持續(xù)發(fā)展的重要載體,在旅游業(yè)中起到中流砥柱的作用。隨著人們的生活水平的不斷提升,對(duì)旅游服務(wù)質(zhì)量的要求也越來(lái)越高,特別是在旅游景區(qū),大部分游客已經(jīng)不再滿足于現(xiàn)有的旅游服務(wù)水平,因此旅游景區(qū)服務(wù)質(zhì)量的改善提升對(duì)旅游景區(qū)的發(fā)展具有一定的現(xiàn)實(shí)意義。目前,由于互聯(lián)網(wǎng)大數(shù)據(jù)時(shí)代的來(lái)臨,網(wǎng)絡(luò)數(shù)據(jù)呈爆炸式增長(zhǎng),可以通過(guò)各種網(wǎng)站游客的評(píng)論數(shù)據(jù)獲得游客對(duì)于旅游景區(qū)的感知情況。但這類數(shù)據(jù)隨意性、社會(huì)性、分散性等特點(diǎn),很難直接使用,文本分析技術(shù)應(yīng)運(yùn)而生。本文使用文本分析技術(shù)從冗雜的評(píng)論數(shù)據(jù)中識(shí)別出用戶談?wù)摰闹饕谋緝?nèi)容,提煉旅游景區(qū)應(yīng)該主要關(guān)注問(wèn)題。本文基于游客感知的視角,通過(guò)分析、挖掘游客對(duì)旅游景區(qū)的網(wǎng)絡(luò)評(píng)論了解游客對(duì)景區(qū)形象的評(píng)價(jià)和感受。(來(lái)自于網(wǎng)絡(luò))

二、數(shù)據(jù)準(zhǔn)備

1.導(dǎo)入所需要的模塊。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
plt.rcParams['font.sans-serif']=['SimHei']# 用來(lái)正常顯示中文標(biāo)簽
from datetime import datetime

2.導(dǎo)入數(shù)據(jù),查看前十?dāng)?shù)據(jù)。

df = pd.read_csv(r"C:\Users\XWJ\Desktop\kelu.csv")
df.head()

數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析
3.使用函數(shù)info():數(shù)據(jù)表的基本信息(維度,列名稱,數(shù)據(jù)格式,所占空間等)。

df.info()

數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析
4…使用describe()函數(shù),計(jì)算數(shù)據(jù)集中每列的總數(shù)、均值、標(biāo)準(zhǔn)差、最小值、25%、50%、75%分位數(shù)以及最大值。

df.describe()

數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析

根據(jù)平均分92,和1/2分位得知,大多數(shù)用戶評(píng)分在100,效果非常不錯(cuò)。
16年~19年門票價(jià)格都是110。

三、分析數(shù)據(jù)

1.每天銷量分析。

df['time'] = pd.to_datetime(df['time'],format='%Y/%m/%d')
df.groupby('time')['rating'].count().plot(figsize=(12,4))

數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析

整體來(lái)看每日銷量呈現(xiàn)上升趨勢(shì),但是在18年5月份前后(2,3,4)出現(xiàn)一次較大的波動(dòng),銷量急劇下滑,猜測(cè):臺(tái)風(fēng),疫情,運(yùn)營(yíng)推廣不利。
6年9月~17年1月,銷量非常低,每天平均2-3張門票,猜測(cè):101觀景臺(tái)門票剛剛上線發(fā)售,觀景臺(tái)剛剛對(duì)游客進(jìn)行開(kāi)放。

2.每月銷量分析。

df['month'] = df['time'].values.astype('datetime64[M]')  #保留月份精度的日期
df.head()
df.groupby('month')['rating'].count().plot(figsize=(12,4))  #按照月份進(jìn)度進(jìn)行計(jì)數(shù)
plt.xlabel('月份')
plt.ylabel('銷售數(shù)量')
plt.title('16~19年每月銷量分析')

數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析

月份整體銷量依然呈現(xiàn)上升趨勢(shì),但是在18年2,3,4月份月銷量下滑明顯。跟每天銷量下降有關(guān)。猜測(cè):臺(tái)風(fēng),疫情,運(yùn)營(yíng)推廣不利。

3.每個(gè)用戶的購(gòu)買量和消費(fèi)金額分析。

df1 = pd.DataFrame({
    'name':['zhangsan','lisi'],
    'group':['A','B']
})
df2 =  pd.DataFrame({
    'name':['wangwu','lisi'],
    'score':[88,90],
    'group':['C','D']
})
pd.merge(left=df1,right=df2,on='name',how='inner',suffixes=['_1','_2'])

數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析

#按照游客分組,統(tǒng)計(jì)每個(gè)游客的購(gòu)買次數(shù)
grouped_count_author = df.groupby('author')['frequency'].count().reset_index() 
#按照游客分組,統(tǒng)計(jì)每個(gè)游客的消費(fèi)金額
grouped_sum_amount = df.groupby('author')['amount'].sum().reset_index()
user_purchase_retention = pd.merge(left=grouped_count_author,
                                  right=grouped_sum_amount,
                                  on='author',
                                  how='inner')
user_purchase_retention.tail(60)
user_purchase_retention.plot.scatter(x='frequency',y='amount',figsize=(12,4))
plt.title('用戶的購(gòu)買次數(shù)和消費(fèi)金額關(guān)系圖')
plt.xlabel('購(gòu)物次數(shù)')
plt.ylabel('消費(fèi)金額')

數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析

四、用戶購(gòu)買門票數(shù)量分析

1.用戶購(gòu)買門票數(shù)量。

df.groupby('author')['frequency'].count().plot.hist(bins=50)  #影響柱子的寬度,寬度= (最大值-最小值)/bins
plt.xlim(1,17)
plt.xlabel('購(gòu)買數(shù)量')
plt.ylabel('人數(shù)')
plt.title('用戶購(gòu)買門票數(shù)量直方圖')

數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析

絕大多數(shù)用戶購(gòu)買過(guò)1張門票,用戶在7000人次左右。
少數(shù)人購(gòu)買過(guò)2~4張門票,猜測(cè):可能是臺(tái)北周邊用戶。

2.用戶購(gòu)買門票2次及以上情況分析。

df_frequency_2 = df.groupby('author').count().reset_index()
df_frequency_2.head()
df_frequency_2[df_frequency_2['frequency']>=2].groupby('author')['frequency'].sum().plot.hist(bins=50)
plt.xlabel('購(gòu)買數(shù)量')
plt.ylabel('人數(shù)')
plt.title('購(gòu)買門票在2次及以上的用戶數(shù)量')

數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析

消費(fèi)兩次的用戶在整體上占比較大,大于2次的用戶占小部分,用戶購(gòu)買次數(shù)最多為8次。

3.查看購(gòu)買2次及以上的具體人數(shù)。

df_frequency_2[df_frequency_2['frequency']>=2].groupby('frequency')['author'].count()

數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析

出去購(gòu)買一次的顧客,可以看出購(gòu)買2次有402人,購(gòu)買3次的99人,以此類推得知大多數(shù)據(jù)傾向于購(gòu)買2~5。

4.購(gòu)買次數(shù)在1~5次之間的用戶占比分析。

#1.按照用戶進(jìn)行分組  2.取出購(gòu)買次數(shù)  3.過(guò)濾出1~5次用戶  4.繪制餅圖
df_frequency_gte_1 = df.groupby('author')['frequency'].count().reset_index()
#過(guò)濾出<=5次的用戶
values = list(df_frequency_gte_1[df_frequency_gte_1['frequency']<=5].groupby('frequency')['frequency'].count())
print(values)
plt.pie(values,labels=['購(gòu)買1次','購(gòu)買2次','購(gòu)買3次','購(gòu)買4次','購(gòu)買5次'],autopct='%1.1f%%')
plt.title('購(gòu)買次數(shù)在1~5次之間的人數(shù)占比')
plt.legend()

數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析

可以看出購(gòu)買一次的占比83%,其次逐漸遞減。并且遞減比較明顯,購(gòu)買3.4.5的占比相近,人數(shù)都很少。

5.購(gòu)買次數(shù)在2~5次之間的用戶占比分析。

#過(guò)濾出>=2次并且<=5次的用戶
df_frequency_gte_2 = df_frequency_2[df_frequency_2['frequency']>=2].reset_index()
values = list(df_frequency_gte_2[df_frequency_gte_2['frequency']<=5].groupby('frequency')['frequency'].count())
print(values)
plt.pie(values,labels=['購(gòu)買2次','購(gòu)買3次','購(gòu)買4次','購(gòu)買5次'],autopct='%1.1f%%')
plt.title('購(gòu)買次數(shù)在2~5次之間的人數(shù)占比')
plt.legend()

數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析

在2~5次之間,購(gòu)買2.3次用戶占比最大,綜合占據(jù)了80%

五、用戶復(fù)購(gòu)分析

1.復(fù)購(gòu)率分析。

復(fù)購(gòu)率:在某一時(shí)間窗口內(nèi)(多指一個(gè)月)內(nèi)消費(fèi)次數(shù)在兩次及以上的用戶在總消費(fèi)用戶的占比
三種情況:
消費(fèi)次數(shù)>1,為復(fù)購(gòu)用戶,用1表示
消費(fèi)次數(shù)=1,為非復(fù)購(gòu)用戶,用0表示
消費(fèi)次數(shù)=0, 未消費(fèi)用戶,用na表示

applymap:df,處理每一個(gè)元素
apply:df,處理每一行或者每一列數(shù)據(jù)
map:Serise,處理每一個(gè)元素

pivot_count = df.pivot_table(index='author',
                            columns='month',
                            values='frequency',
                            aggfunc='count').fillna(0)
pivot_count = pivot_count.applymap(lambda x: 1 if x>1 else np.NAN  if x==0 else 0)
# pivot_count[pivot_count['2016-09-01']==1]
(pivot_count.sum()/pivot_count.count()).plot()
plt.xlabel('時(shí)間(月)')
plt.ylabel('百分比(%)')
plt.title('16~19年每月用戶復(fù)購(gòu)率')

數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析

16年9月份復(fù)購(gòu)率最高達(dá)到了7.5%,然后開(kāi)始下降,趨于平穩(wěn)在1.2%。

2.復(fù)購(gòu)用戶人數(shù)。

pivot_count.sum().plot()
plt.xlabel('時(shí)間/月')
plt.ylabel('復(fù)購(gòu)人數(shù)')
plt.title('16~19年每月的復(fù)購(gòu)人數(shù)折線圖')

數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析
整體來(lái)看,復(fù)購(gòu)人數(shù)長(zhǎng)線上升趨勢(shì)。
但是在18年2.3.4.10和19年2月份,復(fù)購(gòu)人數(shù)下降較為明顯,出現(xiàn)異常信號(hào),需要和業(yè)務(wù)部門具體分析情況。

六、用戶回購(gòu)分析

1.回購(gòu)率分析。

回購(gòu)率:在某一個(gè)時(shí)間窗口內(nèi)消費(fèi)過(guò)的用戶,在下一個(gè)時(shí)間窗口仍舊消費(fèi)的占比

pivot_purchase = df.pivot_table(index='author',
                columns='month',
               values='frequency',
               aggfunc='count'
              ).fillna(0)
pivot_purchase.head()

def purchase_return(data): #data:代表的是每一名游客的所有月份消費(fèi)記錄
    status = [] #存儲(chǔ)每一個(gè)月回購(gòu)狀態(tài)
    for i in range(30):#遍歷每一個(gè)月(最后一個(gè)月除外)
        ####本月消費(fèi)
        if data[i] == 1:
            if data[i+1] ==1:#下個(gè)月有消費(fèi),是回購(gòu)用戶,1
                status.append(1)
            else:#na|未消費(fèi)
                status.append(0) #非回購(gòu)用戶,0
        else: ####本月未消費(fèi)
            status.append(np.NaN)
    status.append(np.NaN)
    return pd.Series(status,pivot_purchase.columns)
pivot_purchase_return = pivot_purchase.apply(purchase_return,axis=1)  #用戶回購(gòu)狀態(tài)
(pivot_purchase_return.sum()/pivot_purchase_return.count()).plot()
plt.title('16年~19年每月的回購(gòu)率')
plt.xlabel('月份')
plt.ylabel('回購(gòu)率%')

數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析

回購(gòu)率最高在18年6月份,達(dá)到4%
整體來(lái)看,回購(gòu)率呈現(xiàn)微弱上升趨勢(shì)
出現(xiàn)了幾次較大下滑,分別是17年6月份,18年1月份,18年8月份,19年1月份

2.回購(gòu)人數(shù)分析。

pivot_purchase_return.sum().plot()
plt.title('16年~19年每月的回購(gòu)人數(shù)')
plt.xlabel('月份')
plt.ylabel('回購(gòu)人數(shù)')
print(pivot_purchase_return.sum())

數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析

數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析

整體呈現(xiàn)上升趨勢(shì),回購(gòu)人數(shù)最多時(shí)在18年11月份,人數(shù)未17人
其中有幾次回購(gòu)人數(shù)下降較為明顯,主要在分別是17年6月份,18年1月份,18年8月份,19年1月份

七、占比分析

1.每個(gè)月分層用戶占比情況。

#活躍用戶|不活躍用戶|回流用戶|新用戶
def active_status(data): #data:每一行數(shù)據(jù)(共31列)
    status = [] #存儲(chǔ)用戶31個(gè)月的狀態(tài)(new|active|unactive|return|unreg)
    for i in range(31):
        #判斷本月沒(méi)有消費(fèi)==0
        if data[i] ==0:
            if len(status)==0: #前幾個(gè)月沒(méi)有任何記錄(也就是97年1月==0)
                status.append('unreg')  
            else:#之前的月份有記錄(判斷上一個(gè)月?tīng)顟B(tài))
                if status[i-1] =='unreg':#一直沒(méi)有消費(fèi)過(guò)
                    status.append('unreg')
                else:#上個(gè)月的狀態(tài)可能是:new|active|unative|reuturn
                    status.append('unactive')
        else:#本月有消費(fèi)==1
            if len(status)==0:
                status.append('new') #第一次消費(fèi)
            else:#之前的月份有記錄(判斷上一個(gè)月?tīng)顟B(tài))
                if status[i-1]=='unactive':
                    status.append('return') #前幾個(gè)月不活躍,現(xiàn)在又回來(lái)消費(fèi)了,回流用戶
                elif  status[i-1]=='unreg':
                    status.append('new') #第一次消費(fèi)
                else:#new|active
                    status.append('active') #活躍用戶
            
    return pd.Series(status,pivot_purchase.columns) #值:status,列名:18個(gè)月份
pivot_purchase_status  =pivot_purchase.apply(active_status,axis=1)
pivot_status_count =pivot_purchase_status.replace('unreg',np.NaN).apply(pd.value_counts)
pivot_status_count.T.plot.area()

數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析

可以看出,紅色(不活躍用戶)占據(jù)網(wǎng)站用戶的主體
橙色(新用戶)從17年的1月~19年1月,呈現(xiàn)上升趨勢(shì);但是在18年4月份左右,新用戶的量突然急劇下降,異常信號(hào);
以后,新用戶又開(kāi)始逐漸上漲,回復(fù)穩(wěn)定狀態(tài)
綠色(回流用戶),一直維持穩(wěn)定穩(wěn)定狀態(tài),但是在18年2~4月份,出現(xiàn)異常下降情況,異常信號(hào);

2.每月不同用戶的占比

return_rate = pivot_status_count.apply(lambda x:x/x.sum())
return_rate.T.plot()

數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析

在17年1月份過(guò)后,網(wǎng)站用戶主體由不活躍用戶組成,新用戶占比開(kāi)始逐漸下降,并且趨于穩(wěn)定,穩(wěn)定在10%左右
活躍用戶和會(huì)用戶,一直很穩(wěn)定,并且占比較小
16年9月前后,新用戶和不活躍用戶,發(fā)生較大的變化,猜測(cè):活動(dòng)或者節(jié)假日造成…

3.每月活躍用戶的占比

return_rate.T['active'].plot(figsize=(12,6))
plt.xlabel('時(shí)間(月)')
plt.ylabel('百分比')
plt.title('每月活躍用戶的占比分析')

數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析
在17年1月份活躍用戶占比較高,在0.5%,但是在1-2月份,急劇下降,猜測(cè):春節(jié)的影響,或者溫度
結(jié)合歷年1~2月份銷量來(lái)看,都會(huì)出現(xiàn)一定比例的下降,再次驗(yàn)證我們的猜測(cè):春節(jié)的影響
在18年2月和5月出現(xiàn)異常,門票銷量下降,猜測(cè):雨水或者臺(tái)風(fēng)影響

4.每月回流用戶占比

return_rate.T['return'].plot(figsize=(12,6))
plt.xlabel('時(shí)間(月)')
plt.ylabel('百分比')
plt.title('每月回流用戶的占比分析')

數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析

整體來(lái)看,回流用戶比例上升趨勢(shì),但是波動(dòng)較大
在17年1月和6月,18年4月,19年2月,回流用戶比例都出現(xiàn)了較大幅度下降,表現(xiàn)為異常信號(hào)
不論是回流用戶還是活躍用戶,在以上幾個(gè)月份中都表現(xiàn)出下降趨勢(shì)。

np.mean(return_rate.T['return'])
#0.00736823576229978 

回流用戶平均值在0.73%左右
在17年9月份以后,僅有連個(gè)異常點(diǎn)在平均值一下
在17年9月份以前,所有數(shù)據(jù)都顯示出回流用戶比例低于平均值,猜測(cè):景點(diǎn)開(kāi)放不久,很多游客尚未發(fā)現(xiàn)本景點(diǎn);本景點(diǎn)在該平臺(tái)上線不久

勵(lì)志語(yǔ)錄

人生從來(lái)沒(méi)有固定的路線,決定你能夠走多遠(yuǎn)的,并不是年齡,而是你的努力程度。無(wú)論到了什么時(shí)候,只要你還有心情對(duì)著糟糕的生活揮拳宣戰(zhàn),都不算太晚。遲做,總比不做好!文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-404321.html

到了這里,關(guān)于數(shù)據(jù)分析:旅游景點(diǎn)銷售門票和消費(fèi)情況分析的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包