国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<kbd id="amigg"><noframes id="amigg">

<fieldset id="amigg"><kbd id="amigg"></kbd></fieldset>

<fieldset id="amigg"><kbd id="amigg"></kbd></fieldset>

<sup id="amigg"><kbd id="amigg"></kbd></sup>

<fieldset id="amigg"><kbd id="amigg"></kbd></fieldset>

基于機(jī)器學(xué)習(xí)的庫(kù)存需求預(yù)測(cè) -- 機(jī)器學(xué)習(xí)項(xiàng)目基礎(chǔ)篇（12）

2年前作者：python收藏家分類：Toy博客閱讀(20)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了基于機(jī)器學(xué)習(xí)的庫(kù)存需求預(yù)測(cè) -- 機(jī)器學(xué)習(xí)項(xiàng)目基礎(chǔ)篇（12）。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

在本文中，我們將嘗試實(shí)現(xiàn)一個(gè)機(jī)器學(xué)習(xí)模型，該模型可以預(yù)測(cè)在不同商店銷售的不同產(chǎn)品的庫(kù)存量。

導(dǎo)入庫(kù)和數(shù)據(jù)集

Python庫(kù)使我們可以輕松地處理數(shù)據(jù)，并通過一行代碼執(zhí)行典型和復(fù)雜的任務(wù)。

Pandas -此庫(kù)有助于以2D陣列格式加載數(shù)據(jù)幀，并具有多種功能，可一次性執(zhí)行分析任務(wù)。
Numpy - Numpy數(shù)組非?？欤梢栽诤芏痰臅r(shí)間內(nèi)執(zhí)行大型計(jì)算。
Matplotlib/Seaborn -這個(gè)庫(kù)用于繪制可視化。
Sklearn -此模塊包含多個(gè)庫(kù)，這些庫(kù)具有預(yù)實(shí)現(xiàn)的功能，以執(zhí)行從數(shù)據(jù)預(yù)處理到模型開發(fā)和評(píng)估的任務(wù)。
XGBoost -這包含eXtreme Gradient Boosting機(jī)器學(xué)習(xí)算法，這是幫助我們實(shí)現(xiàn)高精度預(yù)測(cè)的算法之一。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sb
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder, StandardScaler
from sklearn import metrics
from sklearn.svm import SVC
from xgboost import XGBRegressor
from sklearn.linear_model import LinearRegression, Lasso, Ridge
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_absolute_error as mae
  
import warnings
warnings.filterwarnings('ignore')

現(xiàn)在，讓我們將數(shù)據(jù)集加載到panda的數(shù)據(jù)框中，并打印它的前五行。

df = pd.read_csv('StoreDemand.csv')
display(df.head())
display(df.tail())

基于機(jī)器學(xué)習(xí)的庫(kù)存需求預(yù)測(cè) -- 機(jī)器學(xué)習(xí)項(xiàng)目基礎(chǔ)篇（12）,數(shù)據(jù)科學(xué),機(jī)器學(xué)習(xí),python,機(jī)器學(xué)習(xí),數(shù)據(jù)科學(xué),python
如我們所見，我們有10家商店和50種產(chǎn)品的5年數(shù)據(jù)，可以計(jì)算得，

(365 * 4 + 366) * 10 * 50 = 913000

現(xiàn)在讓我們檢查一下我們計(jì)算的數(shù)據(jù)大小是否正確。

df.shape

輸出：

(913000, 4)

讓我們檢查數(shù)據(jù)集的每列包含哪種類型的數(shù)據(jù)。

df.info()

基于機(jī)器學(xué)習(xí)的庫(kù)存需求預(yù)測(cè) -- 機(jī)器學(xué)習(xí)項(xiàng)目基礎(chǔ)篇（12）,數(shù)據(jù)科學(xué),機(jī)器學(xué)習(xí),python,機(jī)器學(xué)習(xí),數(shù)據(jù)科學(xué),python
根據(jù)上面關(guān)于每列數(shù)據(jù)的信息，我們可以觀察到?jīng)]有空值。

df.describe()

基于機(jī)器學(xué)習(xí)的庫(kù)存需求預(yù)測(cè) -- 機(jī)器學(xué)習(xí)項(xiàng)目基礎(chǔ)篇（12）,數(shù)據(jù)科學(xué),機(jī)器學(xué)習(xí),python,機(jī)器學(xué)習(xí),數(shù)據(jù)科學(xué),python

特征工程

有時(shí)候，同一個(gè)特征中提供了多個(gè)特征，或者我們必須從現(xiàn)有的特征中派生一些特征。我們還將嘗試在數(shù)據(jù)集中包含一些額外的功能，以便我們可以從我們擁有的數(shù)據(jù)中獲得一些有趣的見解。此外，如果導(dǎo)出的特征是有意義的，那么它們將成為顯著提高模型準(zhǔn)確性的決定性因素。

parts = df["date"].str.split("-", n = 3, expand = True)
df["year"]= parts[0].astype('int')
df["month"]= parts[1].astype('int')
df["day"]= parts[2].astype('int')
df.head()

基于機(jī)器學(xué)習(xí)的庫(kù)存需求預(yù)測(cè) -- 機(jī)器學(xué)習(xí)項(xiàng)目基礎(chǔ)篇（12）,數(shù)據(jù)科學(xué),機(jī)器學(xué)習(xí),python,機(jī)器學(xué)習(xí),數(shù)據(jù)科學(xué),python
無論是周末還是工作日，都必須對(duì)滿足需求的要求產(chǎn)生一定的影響。

from datetime import datetime
import calendar
      
def weekend_or_weekday(year,month,day):
      
    d = datetime(year,month,day)
    if d.weekday()>4:
        return 1
    else:
        return 0
  
df['weekend'] = df.apply(lambda x:weekend_or_weekday(x['year'], x['month'], x['day']), axis=1)
df.head()

基于機(jī)器學(xué)習(xí)的庫(kù)存需求預(yù)測(cè) -- 機(jī)器學(xué)習(xí)項(xiàng)目基礎(chǔ)篇（12）,數(shù)據(jù)科學(xué),機(jī)器學(xué)習(xí),python,機(jī)器學(xué)習(xí),數(shù)據(jù)科學(xué),python
如果有一個(gè)列可以表明某一天是否有任何假期，那就太好了。

from datetime import date
import holidays
  
def is_holiday(x):
    
  india_holidays = holidays.country_holidays('IN')
  
  if india_holidays.get(x):
    return 1
  else:
    return 0
  
df['holidays'] = df['date'].apply(is_holiday)
df.head()

基于機(jī)器學(xué)習(xí)的庫(kù)存需求預(yù)測(cè) -- 機(jī)器學(xué)習(xí)項(xiàng)目基礎(chǔ)篇（12）,數(shù)據(jù)科學(xué),機(jī)器學(xué)習(xí),python,機(jī)器學(xué)習(xí),數(shù)據(jù)科學(xué),python
現(xiàn)在，讓我們添加一些周期特性。

df['m1'] = np.sin(df['month'] * (2 * np.pi / 12))
df['m2'] = np.cos(df['month'] * (2 * np.pi / 12))
df.head()

基于機(jī)器學(xué)習(xí)的庫(kù)存需求預(yù)測(cè) -- 機(jī)器學(xué)習(xí)項(xiàng)目基礎(chǔ)篇（12）,數(shù)據(jù)科學(xué),機(jī)器學(xué)習(xí),python,機(jī)器學(xué)習(xí),數(shù)據(jù)科學(xué),python
讓我們有一個(gè)列，其值指示它是一周中的哪一天。

def which_day(year, month, day):
      
    d = datetime(year,month,day)
    return d.weekday()
  
df['weekday'] = df.apply(lambda x: which_day(x['year'],
                                                      x['month'],
                                                      x['day']),
                                   axis=1)
df.head()

基于機(jī)器學(xué)習(xí)的庫(kù)存需求預(yù)測(cè) -- 機(jī)器學(xué)習(xí)項(xiàng)目基礎(chǔ)篇（12）,數(shù)據(jù)科學(xué),機(jī)器學(xué)習(xí),python,機(jī)器學(xué)習(xí),數(shù)據(jù)科學(xué),python
現(xiàn)在讓我們刪除對(duì)我們無用的列。

df.drop('date', axis=1, inplace=True)

可能還有一些其他相關(guān)的特征可以添加到這個(gè)數(shù)據(jù)集中，但是讓我們嘗試使用這些特征構(gòu)建一個(gè)構(gòu)建，并嘗試提取一些見解。

探索性數(shù)據(jù)分析

EDA是一種使用可視化技術(shù)分析數(shù)據(jù)的方法。它用于發(fā)現(xiàn)趨勢(shì)和模式，或在統(tǒng)計(jì)摘要和圖形表示的幫助下檢查假設(shè)。
我們使用一些假設(shè)向數(shù)據(jù)集添加了一些功能。現(xiàn)在讓我們檢查不同特征與目標(biāo)特征之間的關(guān)系。

df['store'].nunique(), df['item'].nunique()

輸出：

(10, 50)

從這里我們可以得出結(jié)論，有10個(gè)不同的商店，他們出售50種不同的產(chǎn)品。

features = ['store', 'year', 'month',\
            'weekday', 'weekend', 'holidays']
  
plt.subplots(figsize=(20, 10))
for i, col in enumerate(features):
    plt.subplot(2, 3, i + 1)
    df.groupby(col).mean()['sales'].plot.bar()
plt.show()

基于機(jī)器學(xué)習(xí)的庫(kù)存需求預(yù)測(cè) -- 機(jī)器學(xué)習(xí)項(xiàng)目基礎(chǔ)篇（12）,數(shù)據(jù)科學(xué),機(jī)器學(xué)習(xí),python,機(jī)器學(xué)習(xí),數(shù)據(jù)科學(xué),python
現(xiàn)在讓我們來看看隨著月末的臨近，庫(kù)存的變化情況.

plt.figure(figsize=(10,5))
df.groupby('day').mean()['sales'].plot()
plt.show()

基于機(jī)器學(xué)習(xí)的庫(kù)存需求預(yù)測(cè) -- 機(jī)器學(xué)習(xí)項(xiàng)目基礎(chǔ)篇（12）,數(shù)據(jù)科學(xué),機(jī)器學(xué)習(xí),python,機(jī)器學(xué)習(xí),數(shù)據(jù)科學(xué),python
讓我們畫出30天的表現(xiàn)。

plt.figure(figsize=(15, 10))
  
# Calculating Simple Moving Average 
# for a window period of 30 days
window_size = 30
data = df[df['year']==2013]
windows = data['sales'].rolling(window_size)
sma = windows.mean()
sma = sma[window_size - 1:]
  
data['sales'].plot()
sma.plot()
plt.legend()
plt.show()

基于機(jī)器學(xué)習(xí)的庫(kù)存需求預(yù)測(cè) -- 機(jī)器學(xué)習(xí)項(xiàng)目基礎(chǔ)篇（12）,數(shù)據(jù)科學(xué),機(jī)器學(xué)習(xí),python,機(jī)器學(xué)習(xí),數(shù)據(jù)科學(xué),python
由于sales列中的數(shù)據(jù)是連續(xù)的，讓我們檢查它的分布，并檢查該列中是否有一些離群值。

plt.subplots(figsize=(12, 5))
plt.subplot(1, 2, 1)
sb.distplot(df['sales'])
  
plt.subplot(1, 2, 2)
sb.boxplot(df['sales'])
plt.show()

基于機(jī)器學(xué)習(xí)的庫(kù)存需求預(yù)測(cè) -- 機(jī)器學(xué)習(xí)項(xiàng)目基礎(chǔ)篇（12）,數(shù)據(jù)科學(xué),機(jī)器學(xué)習(xí),python,機(jī)器學(xué)習(xí),數(shù)據(jù)科學(xué),python
高度相關(guān)的特征

plt.figure(figsize=(10, 10))
sb.heatmap(df.corr() > 0.8,
           annot=True,
           cbar=False)
plt.show()

基于機(jī)器學(xué)習(xí)的庫(kù)存需求預(yù)測(cè) -- 機(jī)器學(xué)習(xí)項(xiàng)目基礎(chǔ)篇（12）,數(shù)據(jù)科學(xué),機(jī)器學(xué)習(xí),python,機(jī)器學(xué)習(xí),數(shù)據(jù)科學(xué),python
正如我們之前所觀察到的，讓我們刪除數(shù)據(jù)中存在的離群值。

df = df[df['sales']<140]

模型訓(xùn)練

現(xiàn)在，我們將分離特征和目標(biāo)變量，并將它們分為訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)，我們將使用這些數(shù)據(jù)來選擇在驗(yàn)證數(shù)據(jù)上表現(xiàn)最好的模型。

features = df.drop(['sales', 'year'], axis=1)
target = df['sales'].values
  
  
X_train, X_val, Y_train, Y_val = train_test_split(features, target,
                                                  test_size = 0.05,
                                                  random_state=22)
X_train.shape, X_val.shape

輸出：

((861170, 9), (45325, 9))

在將數(shù)據(jù)輸入機(jī)器學(xué)習(xí)模型之前對(duì)其進(jìn)行標(biāo)準(zhǔn)化，有助于我們實(shí)現(xiàn)穩(wěn)定和快速的訓(xùn)練。

# Normalizing the features for stable and fast training.
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_val = scaler.transform(X_val)

我們將數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù)，并對(duì)數(shù)據(jù)進(jìn)行了歸一化。現(xiàn)在，讓我們訓(xùn)練一些最先進(jìn)的機(jī)器學(xué)習(xí)模型，并使用驗(yàn)證數(shù)據(jù)集從中選擇最佳模型。

models = [LinearRegression(), XGBRegressor(), Lasso(), Ridge()]
  
for i in range(4):
    models[i].fit(X_train, Y_train)
  
    print(f'{models[i]} : ')
  
    train_preds = models[i].predict(X_train)
    print('Training Error : ', mae(Y_train, train_preds))
  
    val_preds = models[i].predict(X_val)
    print('Validation Error : ', mae(Y_val, val_preds))

輸出：文章來源地址http://www.zghlxwxcb.cn/news/detail-639530.html

LinearRegression() : 
Training Error :  20.902897365994484
Validation Error :  20.97143554027027

[08:31:23] WARNING: /workspace/src/objective/regression_obj.cu:152: 
reg:linear is now deprecated in favor of reg:squarederror.
XGBRegressor() : 
Training Error :  11.751541013057603
Validation Error :  11.790298395298885

Lasso() : 
Training Error :  21.015028699769758
Validation Error :  21.071517213774968

Ridge() : 
Training Error :  20.90289749951532
Validation Error :  20.971435731904066

到了這里，關(guān)于基于機(jī)器學(xué)習(xí)的庫(kù)存需求預(yù)測(cè) -- 機(jī)器學(xué)習(xí)項(xiàng)目基礎(chǔ)篇（12）的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

2023 年 MathorCup 高校數(shù)學(xué)建模挑戰(zhàn)賽--賽道 B：電商零售商家需求預(yù)測(cè)及庫(kù)存優(yōu)化問題完整思路以及源代碼
電商平臺(tái)存在著上千個(gè)商家，他們會(huì)將商品貨物放在電商配套的倉(cāng)庫(kù)，電商平臺(tái)會(huì)對(duì)這些貨物進(jìn)行統(tǒng)一管理。通過科學(xué)的管理手段和智能決策，大數(shù)據(jù)智能驅(qū)動(dòng)的供應(yīng)鏈可以顯著降低庫(kù)存成本，同時(shí)保證商品的按時(shí)履約。一般來說，以上供應(yīng)鏈優(yōu)化問題會(huì)包含以下方面：
2024年02月07日
瀏覽(30)
2023 年 MathorCup 高校數(shù)學(xué)建模挑戰(zhàn)賽大數(shù)據(jù)競(jìng)賽（B題）|電商零售商家需求預(yù)測(cè)及庫(kù)存優(yōu)化問題|建模秘籍&文章代碼思路大全
鐺鐺！小秘籍來咯！小秘籍希望大家都能輕松建模呀，mathorcup比賽也會(huì)持續(xù)給大家放松思路滴~ 抓緊小秘籍，我們出發(fā)吧~ 來看看 MathorCup大數(shù)據(jù)競(jìng)賽的B題完整版內(nèi)容在文末領(lǐng)取噢~ 問題一：需求量預(yù)測(cè) 問題描述：根據(jù)歷史六個(gè)月的需求量數(shù)據(jù)，預(yù)測(cè)各商家在各倉(cāng)庫(kù)的商品在
2024年02月08日
瀏覽(27)
2023年第四屆MathorCup大數(shù)據(jù)挑戰(zhàn)賽（B題）|電商零售商家需求預(yù)測(cè)及庫(kù)存優(yōu)化問題|數(shù)學(xué)建模完整代碼+建模過程全解全析
讓我們來看看MathorCup的B題！這是一個(gè)電商零售商家需求預(yù)測(cè)及庫(kù)存優(yōu)化問題的描述。這個(gè)問題涉及到電商平臺(tái)上的上千個(gè)商家，它們將商品放在不同的倉(cāng)庫(kù)中，而電商平臺(tái)需要進(jìn)行供應(yīng)鏈管理，以降低庫(kù)存成本并保證按時(shí)交貨。主要問題包括需求預(yù)測(cè)和庫(kù)存優(yōu)化。問題一：
2024年02月08日
瀏覽(17)
基于灰色神經(jīng)網(wǎng)絡(luò)的訂單需求預(yù)測(cè)Matlab代碼
????????灰色系統(tǒng)理論是一種研究少數(shù)據(jù)、貧信息,不確定性問題的新方法,它以部分信息已知、部分信息未知的“小樣本”、“貧信息\\\"不確定系統(tǒng)為研究對(duì)象,通過對(duì)“部分”已知信息的生成、開發(fā),提取有價(jià)值的信息,實(shí)現(xiàn)對(duì)系統(tǒng)運(yùn)行行為、演化規(guī)律的正確描述和有效監(jiān)控。
2024年02月11日
瀏覽(16)
數(shù)學(xué)建模-基于LightGBM和BP神經(jīng)網(wǎng)絡(luò)的互聯(lián)網(wǎng)招聘需求分析與預(yù)測(cè)
整體求解過程概述(摘要) ?? 就業(yè)是民生之本，是發(fā)展之基，也是安國(guó)之策。2020 年新冠肺炎疫情的爆發(fā)，穩(wěn)就業(yè)成為應(yīng)對(duì)疫情、穩(wěn)定社會(huì)的重要保障之一。隨著數(shù)據(jù)新動(dòng)能的發(fā)展，互聯(lián)網(wǎng)招聘為招聘者和應(yīng)聘者提供不限于時(shí)空的全局視角，因此本文從該角度出發(fā)對(duì)招聘者和
2024年03月23日
瀏覽(40)
kaggle—酒店預(yù)訂需求預(yù)測(cè)分析
項(xiàng)目背景：該項(xiàng)目為酒店線上預(yù)訂業(yè)務(wù)的研究?jī)?nèi)容，從酒店運(yùn)營(yíng)的角度，分析酒店的房型供給、不同時(shí)間段的需求，核心消費(fèi)群體，影響退訂的因素，并建立分類算法模型對(duì)酒店訂單退訂進(jìn)行預(yù)測(cè)。數(shù)據(jù)來源：kaggle:Hotel booking demand，此項(xiàng)目數(shù)據(jù)為kaggle上的一個(gè)Hotel booking數(shù)據(jù)
2024年02月13日
瀏覽(56)
商業(yè)智能、數(shù)據(jù)分析和需求預(yù)測(cè)在現(xiàn)代零售管理中的關(guān)鍵運(yùn)用
文章來源：第七在線官方現(xiàn)代零售面臨著激烈的市場(chǎng)競(jìng)爭(zhēng)和日益增長(zhǎng)的消費(fèi)者期望值。無論是實(shí)體商鋪、電子商務(wù)還是其它渠道，零售商都必須時(shí)刻掌握各類進(jìn)銷存數(shù)據(jù)，并結(jié)合對(duì)流行趨勢(shì)和未來銷售的預(yù)期做出最有效的經(jīng)營(yíng)決策。這一切都對(duì)現(xiàn)代零售商在管理中如何高效
2024年02月01日
瀏覽(18)
【文章+代碼】2023媽媽杯大數(shù)據(jù)B題分享 mathorcup 電商零售商家需求預(yù)測(cè)
本次的媽媽杯大數(shù)據(jù)B題我們也將持續(xù)陪跑，目前已經(jīng)完成了大部分的代碼，和第一版文章。下面進(jìn)行文章摘要和其他部分的分享基于時(shí)間序列的電商零售商家預(yù)測(cè)模型摘要在電子商務(wù)平臺(tái)上，通常有數(shù)以千計(jì)的零售商家，它們將其商品存放在該電子商務(wù)平臺(tái)提供的倉(cāng)庫(kù)中
2024年02月05日
瀏覽(22)
2022-2028年全球與中國(guó)半導(dǎo)體組裝和測(cè)試服務(wù)（SATS）行業(yè)市場(chǎng)需求預(yù)測(cè)分析
本文研究全球與中國(guó)市場(chǎng)半導(dǎo)體組裝和測(cè)試服務(wù)（SATS）的發(fā)展現(xiàn)狀及未來發(fā)展趨勢(shì)，分別從生產(chǎn)和消費(fèi)的角度分析半導(dǎo)體組裝和測(cè)試服務(wù)（SATS）的主要生產(chǎn)地區(qū)、主要消費(fèi)地區(qū)以及主要的生產(chǎn)商。重點(diǎn)分析全球與中國(guó)市場(chǎng)的主要廠商產(chǎn)品特點(diǎn)、產(chǎn)品規(guī)格、不同規(guī)格產(chǎn)品的價(jià)
2023年04月11日
瀏覽(18)
OLS回歸模型-斯皮爾曼相關(guān)系數(shù)-數(shù)值模擬-多目標(biāo)規(guī)劃-養(yǎng)老服務(wù)床位需求預(yù)測(cè)與運(yùn)營(yíng)模式研究-之?dāng)?shù)學(xué)建模
數(shù)學(xué)建模 -OLS回歸模型斯皮爾曼相關(guān)系數(shù) 數(shù)值模擬多目標(biāo)規(guī)劃-養(yǎng)老服務(wù)床位需求預(yù)測(cè)與運(yùn)營(yíng)模式研究養(yǎng)老服務(wù)床位需求預(yù)測(cè)與運(yùn)營(yíng)模式研究摘要 ????????隨著時(shí)間的推移，我國(guó)人口老齡化逐漸增多，老齡化的社會(huì)問題越來越突出，從2009年到2018年，無論是老年人口數(shù)量
2024年02月09日
瀏覽(22)

<sup id="mqgqe"><kbd id="mqgqe"></kbd></sup>

<sup id="mqgqe"><noscript id="mqgqe"></noscript></sup>

<sup id="mqgqe"><kbd id="mqgqe"></kbd></sup>

<sup id="mqgqe"><noscript id="mqgqe"></noscript></sup>