一、引言
? ? ? ? 購物籃分析是商業(yè)領(lǐng)域最前沿、最具挑戰(zhàn)性的問題之一,也是許多企業(yè)重點研究的問題。購物籃分析是通過發(fā)現(xiàn)顧客在一次購買行為中放入購物籃中不同商品之間的關(guān)聯(lián),研究顧客的購買行為,從而輔助零售企業(yè)制定營銷策略的一種數(shù)據(jù)分析方法。
? ? ? ?本篇文章使用 Apriori 關(guān)聯(lián)規(guī)則算法實現(xiàn)購物籃分析,發(fā)現(xiàn)超市不同商品之間的關(guān)聯(lián)關(guān)系,并根據(jù)商品之間的關(guān)聯(lián)規(guī)則制定銷售策略。
二、數(shù)據(jù)探索分析
2.1 查看數(shù)據(jù)特征
搜索數(shù)據(jù)的特征,查看每列屬性、最大值、最小值、是了解數(shù)據(jù)的第一步。
import numpy as np
import pandas as pd
inputfile = './data/GoodsOrder.csv' # 輸入的數(shù)據(jù)文件
data = pd.read_csv(inputfile,encoding = 'gbk') # 讀取數(shù)據(jù)
data .info() # 查看數(shù)據(jù)屬性
data = data['id']
description = [data.count(),data.min(), data.max()] # 依次計算總數(shù)、最小值、最大值
description = pd.DataFrame(description, index = ['Count','Min', 'Max']).T # 將結(jié)果存入數(shù)據(jù)框
print('描述性統(tǒng)計結(jié)果:\n',np.round(description)) # 輸出結(jié)果
結(jié)果如下
?可到每列屬性共有43367個觀測值,并不存在缺失值?!癷d”屬性的最大值和最小值,可得某商品零售企業(yè)共收集9835個購物籃數(shù)據(jù),其中包含169個不同的商品類別,售出商品總數(shù)43367件。
2.2 分析熱銷商品
熱銷情況分析可以助力商品優(yōu)選。計算銷量排名前10的商品銷量及占比,并繪制條形圖顯示銷量前10的商品銷量情況。
# 銷量排行前10商品的銷量及其占比
import pandas as pd
inputfile = './data/GoodsOrder.csv' # 輸入的數(shù)據(jù)文件
data = pd.read_csv(inputfile,encoding = 'gbk') # 讀取數(shù)據(jù)
group = data.groupby(['Goods']).count().reset_index() # 對商品進(jìn)行分類匯總
sorted=group.sort_values('id',ascending=False)
print('銷量排行前10商品的銷量:\n', sorted[:10]) # 排序并查看前10位熱銷商品
# 畫條形圖展示出銷量排行前10商品的銷量
import matplotlib.pyplot as plt
x=sorted[:10]['Goods']
y=sorted[:10]['id']
plt.figure(figsize = (8, 4)) # 設(shè)置畫布大小
plt.barh(x,y)
plt.rcParams['font.sans-serif'] = 'SimHei'
plt.xlabel('銷量') # 設(shè)置x軸標(biāo)題
plt.ylabel('商品類別') # 設(shè)置y軸標(biāo)題
plt.title('商品的銷量TOP10(3001)') # 設(shè)置標(biāo)題
plt.savefig('./data//top10.png') # 把圖片以.png格式保存
plt.show() # 展示圖片
# 銷量排行前10商品的銷量占比
data_nums = data.shape[0]
for idnex, row in sorted[:10].iterrows():
print(row['Goods'],row['id'],row['id']/data_nums)
結(jié)果如下
?
?通過分析熱銷商品的結(jié)果可知,全脂牛奶的銷量最高,為2513件,占比5.795%;其次是其他蔬菜、面包卷和蘇打,占比分別為4.388%、4.171%、3.955%。文章來源:http://www.zghlxwxcb.cn/news/detail-457758.html
2.3 分析商品結(jié)構(gòu)
對每一類商品的熱銷程度進(jìn)行分析,有利于商品制定商品在貨架上的擺放策略和位置。分析歸類后各類別商品的銷量及其占比后,繪制餅圖顯示各類商品的銷量占比情況文章來源地址http://www.zghlxwxcb.cn/news/detail-457758.html
import pandas as pd
inputfile1 = './data/GoodsOrder.csv'
inputfile2 = './data/GoodsTypes.csv'
data = pd.read_csv(inputfile1,encoding =
到了這里,關(guān)于python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)(商品零售購物籃分析)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!