国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目

這篇具有很好參考價(jià)值的文章主要介紹了【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

一、數(shù)據(jù)集介紹

user_data.csv是一份用戶行為數(shù)據(jù),時(shí)間區(qū)間為2017-11-25到2017-12-03,總計(jì)29132493條記錄,大小為1.0G,包含5個(gè)字段。數(shù)據(jù)集的每一行表示一條用戶行為,由用戶ID、商品ID、商品類目ID、行為類型和時(shí)間戳組成,并以逗號分隔。關(guān)于數(shù)據(jù)集中每一列的詳細(xì)描述如下:
【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目
用戶行為類型共有四種,它們分別是:
【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目

二、數(shù)據(jù)處理

1. 數(shù)據(jù)導(dǎo)入

將數(shù)據(jù)加載到hive,然后通過hive對數(shù)據(jù)進(jìn)行處理。
(1)上傳new_data.csv文件至虛擬機(jī)
【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目
(2)創(chuàng)建user_db數(shù)據(jù)庫
create database user_db;
【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目
(3)創(chuàng)建user_data表

create table user_data(
user_id string,
item_id string,
category_id string,
behavior_type string,
create_time int)
row format delimited fields terminated by ','
lines terminated by '\n';

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目
(4)將new_data.csv文件中的數(shù)據(jù)導(dǎo)入到user_data表中

load data local inpath '/root/hive/user_data.csv' into table user_data;

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目

2. 數(shù)據(jù)清洗

數(shù)據(jù)處理主要包括:刪除重復(fù)值,時(shí)間戳格式化,刪除異常值。

  1. 創(chuàng)建user_data_new表,為其添加時(shí)間字符串字段
  2. 數(shù)據(jù)清洗,去掉完全重復(fù)的數(shù)據(jù)
  3. 數(shù)據(jù)清洗,時(shí)間戳格式化成datetime。要用到from_unixtime函數(shù)。
  4. 查看時(shí)間是否有異常值
  5. 數(shù)據(jù)清洗,去掉時(shí)間異常的數(shù)據(jù)
  6. 查看 behavior_type 是否有異常值
    (1)查看數(shù)據(jù)量
select count(1) from user_data;

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目
(2)數(shù)據(jù)去重

insert overwrite table user_data
select user_id,item_id,category_id,behavior_type,create_time
from user_data
group by user_id,item_id,category_id,behavior_type,create_time;

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目
【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目可以看到有11條重復(fù)數(shù)據(jù),已經(jīng)去除。
(3)創(chuàng)建user_data_new表,為其添加時(shí)間字符串字段

create table user_data_new(
user_id string,
item_id string,
category_id string,
behavior_type string,
datetime string
)row format delimited fields terminated by ','
lines terminated by '\n';

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目(4)時(shí)間格式轉(zhuǎn)換

insert overwrite table user_data_new
select user_id,item_id,category_id,behavior_type,from_unixtime(create_time,'yyyy-MM-dd HH:mm:ss')
from user_data;

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目
【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目

(5)查看時(shí)間異常值

select date(datetime) as day from user_data_new group by date(datetime) order by day;

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目
【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目
(6)去除時(shí)間異常值

insert overwrite table user_data_new
select user_id,item_id,category_id,behavior_type,datetime
from user_data_new
where cast(datetime as date) between '2017-11-25' and '2017-12-03';

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目
【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目(9)查看behavior_type是否有異常值

select behavior_type from user_data_new group by behavior_type;

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目

三、數(shù)據(jù)分析可視化

1. 用戶流量及購物情況

(1)總訪問量PV,總用戶量UV

select sum(case when behavior_type='pv' then 1 else 0 end) as pv,
count(distinct user_id) as uv
from user_data_new;

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目

(2)日均訪問量,日均用戶量

① 統(tǒng)計(jì)日均訪問量,日均用戶量,并加工到day_pv_uv表中

create table day_pv_uv as
select cast(datetime as date) as day,
sum(case when behavior_type='pv' then 1 else 0 end) as pv,
count(distinct user_id) as uv
from user_data_new
group by cast(datetime as date)
order by day;

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目
② 將得到的數(shù)據(jù)通過sqoop遷移至mysql

  • 在mysql中創(chuàng)建數(shù)據(jù)庫和表
    【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目
create table day_pv_uv (day date,pv int(20),uv int(20));

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目

  • sqoop數(shù)據(jù)遷移
bin/sqoop export \
--connect jdbc:mysql://hadoop01:3306/user_db \
--username root \
--password Guo_2001 \
--table day_pv_uv \
--fields-terminated-by '\001' \
--export-dir '/user/hive/warehouse/user_db.db/day_pv_uv' \
--num-mappers 1 

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目

  • 查看遷移后的數(shù)據(jù)
    【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目
    ③ 利用python讀取mysql數(shù)據(jù)并可視化
  • pymysql讀取數(shù)據(jù)
import pymysql
# 讀取mysql數(shù)據(jù)
daylist = []
pvlist = []
uvlist = []
conn = pymysql.connect(host='192.168.20.128',
               port=3306,
               user='root',
               password='Guo_2001',
               db='user_db',
               charset='utf8')
cursor = conn.cursor()
try:

    sql_name = """ SELECT day FROM day_pv_uv """
    cursor.execute(sql_name)
    days = cursor.fetchall()
    for i in range(0,len(days)):
        daylist.append(days[i][0])
    # print(daylist)
    sql_num = """ SELECT pv FROM day_pv_uv """
    cursor.execute(sql_num)
    pvs = cursor.fetchall()
    for i in range(0,len(pvs)):
        pvlist.append(pvs[i][0])
    # print(pvlist)
    sql_num = """ SELECT uv FROM day_pv_uv """
    cursor.execute(sql_num)
    uvs = cursor.fetchall()
    for i in range(0,len(uvs)):
        uvlist.append(uvs[i][0])
    # print(uvlist)
except:
    print("未查詢到數(shù)據(jù)!")
    conn.rollback()
finally:
    conn.close()
  • pyecharts可視化
import pyecharts.options as opts
from pyecharts.charts import Bar, Line

bar = (
    Bar(init_opts=opts.InitOpts(width="1100px", height="600px"))
       .set_global_opts(title_opts=opts.TitleOpts(title="每日訪問情況"))
        .add_xaxis(xaxis_data=daylist)
        .add_yaxis(
            series_name="pv",
            y_axis=pvlist,
            label_opts=opts.LabelOpts(is_show=False),
        )
        .add_yaxis(
            series_name="uv",
            y_axis=uvlist,
            label_opts=opts.LabelOpts(is_show=False),
        )
        .set_global_opts(
            tooltip_opts=opts.TooltipOpts(
                is_show=True, trigger="axis", axis_pointer_type="cross"
            ),
            xaxis_opts=opts.AxisOpts(
                name='date',
                name_location='middle',
                name_gap=30,
                name_textstyle_opts=opts.TextStyleOpts(
                    font_family='Times New Roman',
                    font_size=16,  # 標(biāo)簽字體大小
                )),
            yaxis_opts=opts.AxisOpts(
                type_="value",
                axislabel_opts=opts.LabelOpts(formatter="{value}"),
                axistick_opts=opts.AxisTickOpts(is_show=True),
                splitline_opts=opts.SplitLineOpts(is_show=True),
            )
        )
)

bar.render("折線圖-柱狀圖多維展示.html")

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目

(3)每個(gè)用戶的購物情況,加工到 user_behavior_count表中

create table user_behavior_count as
select user_id,
sum(case when behavior_type='pv' then 1 else 0 end) as pv,
sum(case when behavior_type='fav' then 1 else 0 end) as fav,
sum(case when behavior_type='cart' then 1 else 0 end) as cart,
sum(case when behavior_type='buy' then 1 else 0 end) as buy
from user_data_new
group by user_id;

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目

(4)統(tǒng)計(jì)復(fù)購率

復(fù)購率:產(chǎn)生兩次或兩次以上購買的用戶占購買用戶的比例

select sum(case when buy>1 then 1 else 0 end)/sum(case when buy>0 then 1 else 0 end)
from user_behavior_count;

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目
可以看到復(fù)購率為0.65,還是不錯(cuò)的。

2. 用戶行為轉(zhuǎn)化率

(1)統(tǒng)計(jì)各環(huán)節(jié)轉(zhuǎn)化率

點(diǎn)擊/(加購物車+收藏)/購買,各環(huán)節(jié)轉(zhuǎn)化率

select a.pv,
a.fav,
a.cart,
a.fav + a.cart as `fav+cart`,
a.buy,
round((a.fav + a.cart) / a.pv, 4) as pv2favcart,
round(a.buy / (a.fav + a.cart), 4) as favcart2buy,
round(a.buy / a.pv, 4) as pv2buy
from(
select sum(pv) as pv,
sum(fav) as fav,
sum(cart) as cart,
sum(buy) as buy
from user_behavior_count
) as a;

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目

(2)用戶行為轉(zhuǎn)化漏斗可視化

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目
從漏斗圖中可以看到,收藏和加購物車的用戶行為是最多的,而購買最少,也符合實(shí)際。

3. 用戶行為習(xí)慣

(1)一天的活躍時(shí)段分布

① 統(tǒng)計(jì)每天24小時(shí)內(nèi)的行為數(shù)據(jù),并加工到hour_behavior表中

create table hour_behavior as
select hour(datetime) as hour,
sum(case when behavior_type = 'pv' then 1 else 0 end) as pv,
sum(case when behavior_type = 'fav' then 1 else 0 end) as fav,
sum(case when behavior_type = 'cart' then 1 else 0 end) as cart,
sum(case when behavior_type = 'buy' then 1 else 0 end) as buy
from user_data_new
group by hour(datetime)
order by hour;

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目
② 將得到的數(shù)據(jù)通過sqoop遷移至mysql

  • 在mysql中創(chuàng)建表
create table hour_behavior (
hour int(20),
pv int(20),
fav int(20),
cart int(20),
buy int(20)
);

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目

  • sqoop數(shù)據(jù)遷移
bin/sqoop export \
--connect jdbc:mysql://hadoop01:3306/user_db \
--username root \
--password Guo_2001 \
--table hour_behavior \
--fields-terminated-by '\001' \
--export-dir '/user/hive/warehouse/user_db.db/hour_behavior' \
--num-mappers 1 

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目

  • 查看遷移后的數(shù)據(jù)
    【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目
    ③ 利用python讀取mysql數(shù)據(jù)并可視化
  • pymysql讀取數(shù)據(jù)
import pymysql
# 讀取mysql數(shù)據(jù)
hourlist = []
pvlist = []
favlist = []
cartlist = []
buylist = []
conn = pymysql.connect(host='192.168.20.128',
               port=3306,
               user='root',
               password='Guo_2001',
               db='user_db',
               charset='utf8')
cursor = conn.cursor()
try:

    sql_name = """ SELECT hour FROM hour_behavior """
    cursor.execute(sql_name)
    hours = cursor.fetchall()
    for i in range(0,len(hours)):
        hourlist.append(hours[i][0])
    sql_num = """ SELECT pv FROM hour_behavior """
    cursor.execute(sql_num)
    pvs = cursor.fetchall()
    for i in range(0,len(pvs)):
        pvlist.append(pvs[i][0])
    sql_num = """ SELECT fav FROM hour_behavior """
    cursor.execute(sql_num)
    favs = cursor.fetchall()
    for i in range(0,len(favs)):
        favlist.append(favs[i][0])
    sql_num = """ SELECT cart FROM hour_behavior """
    cursor.execute(sql_num)
    carts = cursor.fetchall()
    for i in range(0,len(carts)):
        cartlist.append(carts[i][0])
    sql_num = """ SELECT buy FROM hour_behavior """
    cursor.execute(sql_num)
    buys = cursor.fetchall()
    for i in range(0,len(buys)):
        buylist.append(buys[i][0])
except:
    print("未查詢到數(shù)據(jù)!")
    conn.rollback()
finally:
    conn.close()
  • pyecharts可視化
from pyecharts.charts import Line
# 堆疊柱狀圖繪制
line=Line()
line.add_xaxis(hourlist)
line.add_yaxis('點(diǎn)贊數(shù)',pvlist,stack="stack1",label_opts=opts.LabelOpts(is_show=False))
line.add_yaxis('收藏?cái)?shù)',favlist,stack="stack1",label_opts=opts.LabelOpts(is_show=False))
line.add_yaxis('加購物車數(shù)',cartlist,stack="stack1",label_opts=opts.LabelOpts(is_show=False))
line.add_yaxis('購買數(shù)',buylist,stack="stack1",label_opts=opts.LabelOpts(is_show=False))
line.set_global_opts(title_opts=opts.TitleOpts(title="用戶一天24小時(shí)的活躍時(shí)段分布"))
line.render_notebook()

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目
從圖中可以看到一天24小時(shí)中,13和14時(shí)用戶處于最活躍的狀態(tài),而19-21時(shí)用戶的活躍次數(shù)并不高,當(dāng)然此時(shí)也處于睡覺時(shí)間,符合實(shí)際情況。

(2)一周用戶的活躍分布

① 統(tǒng)計(jì)一周七天內(nèi)的行為數(shù)據(jù),并加工到week_behavior表中

create table week_behavior as
select pmod(datediff(datetime, '1920-01-01') - 3, 7) as weekday,
sum(case when behavior_type = 'pv' then 1 else 0 end) as pv,
sum(case when behavior_type = 'fav' then 1 else 0 end) as fav,
sum(case when behavior_type = 'cart' then 1 else 0 end) as cart,
sum(case when behavior_type = 'buy' then 1 else 0 end) as buy
from user_data_new
where date(datetime) between '2017-11-27' and '2017-12-03'
group by pmod(datediff(datetime, '1920-01-01') - 3, 7)
order by weekday;

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目
【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目
② 將得到的數(shù)據(jù)通過sqoop遷移至mysql

  • 在mysql中創(chuàng)建表
create table week_behavior (
weekday int(20),
pv int(20),
fav int(20),
cart int(20),
buy int(20)
);

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目

  • sqoop數(shù)據(jù)遷移
bin/sqoop export \
--connect jdbc:mysql://hadoop01:3306/user_db \
--username root \
--password Guo_2001 \
--table week_behavior \
--fields-terminated-by '\001' \
--export-dir '/user/hive/warehouse/user_db.db/week_behavior' \
--num-mappers 1 

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目

  • 查看遷移后的數(shù)據(jù)
    【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目
    ③ 利用python讀取mysql數(shù)據(jù)并可視化
  • pymysql讀取數(shù)據(jù)
import pymysql
# 讀取mysql數(shù)據(jù)
weeklist = []
pvlist = []
favlist = []
cartlist = []
buylist = []
conn = pymysql.connect(host='192.168.20.128',
               port=3306,
               user='root',
               password='Guo_2001',
               db='user_db',
               charset='utf8')
cursor = conn.cursor()
try:

    sql_name = """ SELECT weekday FROM week_behavior """
    cursor.execute(sql_name)
    weeks = cursor.fetchall()
    for i in range(0,len(weeks)):
        weeklist.append(weeks[i][0])
    sql_num = """ SELECT pv FROM week_behavior """
    cursor.execute(sql_num)
    pvs = cursor.fetchall()
    for i in range(0,len(pvs)):
        pvlist.append(pvs[i][0])
    sql_num = """ SELECT fav FROM week_behavior """
    cursor.execute(sql_num)
    favs = cursor.fetchall()
    for i in range(0,len(favs)):
        favlist.append(favs[i][0])
    sql_num = """ SELECT cart FROM week_behavior """
    cursor.execute(sql_num)
    carts = cursor.fetchall()
    for i in range(0,len(carts)):
        cartlist.append(carts[i][0])
    sql_num = """ SELECT buy FROM week_behavior """
    cursor.execute(sql_num)
    buys = cursor.fetchall()
    for i in range(0,len(buys)):
        buylist.append(buys[i][0])
except:
    print("未查詢到數(shù)據(jù)!")
    conn.rollback()
finally:
    conn.close()
  • pyecharts可視化
from pyecharts.charts import Line
# 堆疊這些線圖繪制
line=Line()
line.add_xaxis(weeklist)
line.add_yaxis('點(diǎn)贊數(shù)',pvlist,stack="stack1",label_opts=opts.LabelOpts(is_show=False))
line.add_yaxis('收藏?cái)?shù)',favlist,stack="stack1",label_opts=opts.LabelOpts(is_show=False))
line.add_yaxis('加購物車數(shù)',cartlist,stack="stack1",label_opts=opts.LabelOpts(is_show=False))
line.add_yaxis('購買數(shù)',buylist,stack="stack1",label_opts=opts.LabelOpts(is_show=False))
line.set_global_opts(title_opts=opts.TitleOpts(title="一周用戶的活躍分布"))
line.render_notebook()

【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目
從圖中可以看到,在一周中,周日是用戶最活躍的一天,休息日不管是從點(diǎn)贊量、收藏量、加購物車量還是購買量來看都是處于最高的位置。文章來源地址http://www.zghlxwxcb.cn/news/detail-470325.html

到了這里,關(guān)于【Hive+MySQL+Python】淘寶用戶購物行為數(shù)據(jù)分析項(xiàng)目的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 大數(shù)據(jù)實(shí)戰(zhàn) --- 淘寶用戶行為數(shù)據(jù)分析

    大數(shù)據(jù)實(shí)戰(zhàn) --- 淘寶用戶行為數(shù)據(jù)分析

    目錄 開發(fā)環(huán)境? 數(shù)據(jù)描述 功能需求 數(shù)據(jù)準(zhǔn)備 數(shù)據(jù)清洗 用戶行為分析 找出有價(jià)值的用戶 Hadoop+Hive+Spark+HBase 啟動(dòng)Hadoop :start-all.sh 啟動(dòng)zookeeper :zkServer.sh start 啟動(dòng)Hive : nohup hiveserver2 1/dev/null 21 beeline -u jdbc:hive2://192.168.152.192:10000 啟動(dòng)Hbase : start-hbase.sh hbase shell 啟動(dòng)Spark :s

    2023年04月22日
    瀏覽(34)
  • 大數(shù)據(jù)畢設(shè)分享 flink大數(shù)據(jù)淘寶用戶行為數(shù)據(jù)實(shí)時(shí)分析與可視化

    大數(shù)據(jù)畢設(shè)分享 flink大數(shù)據(jù)淘寶用戶行為數(shù)據(jù)實(shí)時(shí)分析與可視化

    ?? 這兩年開始畢業(yè)設(shè)計(jì)和畢業(yè)答辯的要求和難度不斷提升,傳統(tǒng)的畢設(shè)題目缺少創(chuàng)新和亮點(diǎn),往往達(dá)不到畢業(yè)答辯的要求,這兩年不斷有學(xué)弟學(xué)妹告訴學(xué)長自己做的項(xiàng)目系統(tǒng)達(dá)不到老師的要求。 為了大家能夠順利以及最少的精力通過畢設(shè),學(xué)長分享優(yōu)質(zhì)畢業(yè)設(shè)計(jì)項(xiàng)目,今天

    2024年01月21日
    瀏覽(51)
  • MySQL實(shí)戰(zhàn)項(xiàng)目:淘寶母嬰購物數(shù)據(jù)可視化分析

    MySQL實(shí)戰(zhàn)項(xiàng)目:淘寶母嬰購物數(shù)據(jù)可視化分析

    文章目錄 前言 一、數(shù)據(jù)獲取 1.母嬰信息表:tianchi_mum_baby.csv 2.購物行為表: tianchi_mum_baby_trade_history.csv 二、數(shù)據(jù)預(yù)處理: ?1.修改數(shù)據(jù)類型 2.檢查重復(fù)數(shù)據(jù): 3.檢查空格 4.去異常 三.數(shù)據(jù)分析 1.流量分析 2.類別分析 3.性別分析 總結(jié) 母嬰用品是淘寶的熱門購物類目,隨著國家鼓

    2024年02月04日
    瀏覽(43)
  • 基于Python的淘寶行為數(shù)據(jù)可視化分析

    基于Python的淘寶行為數(shù)據(jù)可視化分析

    完成如下商業(yè)分析任務(wù),通過數(shù)據(jù)分析和可視化展示,充分挖掘數(shù)據(jù)的價(jià)值,讓數(shù)據(jù)更好地為業(yè)務(wù)服務(wù): 流量分析 :PV/UV是多少,通過分析PV/UV能發(fā)現(xiàn)什么規(guī)律? 漏斗分析 :用戶“瀏覽-收藏-加購-購買”的轉(zhuǎn)化率是怎樣的? 用戶價(jià)值分析 :對電商平臺什么樣的用戶是有價(jià)值

    2024年02月10日
    瀏覽(34)
  • SQL SERVER ANALYSIS SERVICES決策樹、聚類、關(guān)聯(lián)規(guī)則挖掘分析電商購物網(wǎng)站的用戶行為數(shù)據(jù)...

    SQL SERVER ANALYSIS SERVICES決策樹、聚類、關(guān)聯(lián)規(guī)則挖掘分析電商購物網(wǎng)站的用戶行為數(shù)據(jù)...

    假如你有一個(gè)購物類的網(wǎng)站,那么你如何給你的客戶來推薦產(chǎn)品呢? ( 點(diǎn)擊文末“閱讀原文”獲取完整文檔、 數(shù)據(jù) ) 相關(guān)視頻 這個(gè)功能在很多電商類網(wǎng)站都有,那么,通過SQL Server Analysis Services的數(shù)據(jù)挖掘功能,你也可以輕松的來構(gòu)建類似的功能。 將分為三個(gè)部分來演示

    2024年02月16日
    瀏覽(43)
  • 【項(xiàng)目實(shí)戰(zhàn)】基于Hadoop大數(shù)據(jù)電商平臺用戶行為分析與可視化系統(tǒng)Hive、Spark計(jì)算機(jī)程序開發(fā)

    【項(xiàng)目實(shí)戰(zhàn)】基于Hadoop大數(shù)據(jù)電商平臺用戶行為分析與可視化系統(tǒng)Hive、Spark計(jì)算機(jī)程序開發(fā)

    注意:該項(xiàng)目只展示部分功能,如需了解,評論區(qū)咨詢即可。 在當(dāng)今數(shù)字化時(shí)代,電商行業(yè)成為全球商業(yè)生態(tài)系統(tǒng)的關(guān)鍵組成部分,電商平臺已經(jīng)深入各行各業(yè),影響了人們的購物方式和消費(fèi)習(xí)慣。隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,電商平臺產(chǎn)生了大量的用戶數(shù)據(jù),包括點(diǎn)擊、購

    2024年02月04日
    瀏覽(111)
  • 大數(shù)據(jù)畢設(shè)項(xiàng)目 - 大數(shù)據(jù)電商用戶行為分析 -python 大數(shù)據(jù)

    大數(shù)據(jù)畢設(shè)項(xiàng)目 - 大數(shù)據(jù)電商用戶行為分析 -python 大數(shù)據(jù)

    ?? 這兩年開始畢業(yè)設(shè)計(jì)和畢業(yè)答辯的要求和難度不斷提升,傳統(tǒng)的畢設(shè)題目缺少創(chuàng)新和亮點(diǎn),往往達(dá)不到畢業(yè)答辯的要求,這兩年不斷有學(xué)弟學(xué)妹告訴學(xué)長自己做的項(xiàng)目系統(tǒng)達(dá)不到老師的要求。 為了大家能夠順利以及最少的精力通過畢設(shè),學(xué)長分享優(yōu)質(zhì)畢業(yè)設(shè)計(jì)項(xiàng)目,今天

    2024年03月17日
    瀏覽(29)
  • 基于Python電商用戶行為的數(shù)據(jù)分析、機(jī)器學(xué)習(xí)、可視化研究

    基于Python電商用戶行為的數(shù)據(jù)分析、機(jī)器學(xué)習(xí)、可視化研究

    有需要本項(xiàng)目的源碼以及全套文檔和相關(guān)資源,可以私信博主!?。?在數(shù)字化和互聯(lián)網(wǎng)技術(shù)飛速發(fā)展的推動(dòng)下,消費(fèi)者的購買能力和消費(fèi)觀念呈現(xiàn)不斷升級和變遷的趨勢。用戶消費(fèi)數(shù)據(jù)的爆炸式增長,為我們提供了尋找潛在價(jià)值信息的機(jī)會(huì)。 本研究使用了阿里巴巴提供的淘

    2024年02月04日
    瀏覽(22)
  • 基于python淘寶商品數(shù)據(jù)爬蟲分析可視化系統(tǒng) 網(wǎng)絡(luò)爬蟲+Flask框架+MySQL數(shù)據(jù)庫 大數(shù)據(jù) 畢業(yè)設(shè)計(jì)

    基于python淘寶商品數(shù)據(jù)爬蟲分析可視化系統(tǒng) 網(wǎng)絡(luò)爬蟲+Flask框架+MySQL數(shù)據(jù)庫 大數(shù)據(jù) 畢業(yè)設(shè)計(jì)

    python語言、Flask框架、淘寶商品數(shù)據(jù)、selenium網(wǎng)絡(luò)爬蟲、MySQL數(shù)據(jù)庫、數(shù)據(jù)分析、Echarts可視化大數(shù)據(jù)畢業(yè)設(shè)計(jì)、爬取 Selenium網(wǎng)絡(luò)爬蟲淘寶商品數(shù)據(jù)可視化系統(tǒng)是一個(gè)基于Python和Selenium的Web爬蟲應(yīng)用程序,可以實(shí)現(xiàn)對淘寶上特定商品的價(jià)格、銷量、評價(jià)等數(shù)據(jù)進(jìn)行自動(dòng)化抓

    2024年02月16日
    瀏覽(36)
  • 【Spark+Hadoop+Hive+MySQL+Presto+SpringBoot+Echarts】基于大數(shù)據(jù)技術(shù)的用戶日志數(shù)據(jù)分析及可視化平臺搭建項(xiàng)目

    【Spark+Hadoop+Hive+MySQL+Presto+SpringBoot+Echarts】基于大數(shù)據(jù)技術(shù)的用戶日志數(shù)據(jù)分析及可視化平臺搭建項(xiàng)目

    點(diǎn)我獲取項(xiàng)目數(shù)據(jù)集及代碼 隨著我國科學(xué)技術(shù)水平的不斷發(fā)展,計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的廣泛應(yīng)用,我國已經(jīng)步入了大數(shù)據(jù)時(shí)代。在大數(shù)據(jù)背景下,各種繁雜的數(shù)據(jù)層出不窮,一時(shí)難以掌握其基本特征及一般規(guī)律,這也給企業(yè)的運(yùn)營數(shù)據(jù)分析工作增添了不小的難度。在大數(shù)據(jù)的背景

    2024年02月10日
    瀏覽(28)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包