国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Python基于機(jī)器學(xué)習(xí)實(shí)現(xiàn)的股票價(jià)格預(yù)測(cè)、股票預(yù)測(cè)源碼+數(shù)據(jù)集，機(jī)器學(xué)習(xí)大作業(yè)

2年前作者：云哲-吉吉2021分類(lèi)：Toy博客閱讀(31)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了Python基于機(jī)器學(xué)習(xí)實(shí)現(xiàn)的股票價(jià)格預(yù)測(cè)、股票預(yù)測(cè)源碼+數(shù)據(jù)集，機(jī)器學(xué)習(xí)大作業(yè)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

Feature與預(yù)測(cè)目標(biāo)的選取

選擇的feature:

開(kāi)盤(pán)價(jià)
最高成交價(jià)
最低成交價(jià)
成交量

選擇的預(yù)測(cè)目標(biāo):

收盤(pán)價(jià)

因?yàn)楣善眱r(jià)格的影響因素太多，通過(guò)k線數(shù)據(jù)預(yù)測(cè)未來(lái)的價(jià)格變化基本不可行，只有當(dāng)天之內(nèi)的數(shù)據(jù)還有一定的關(guān)聯(lián)，故feature與target都選擇的是當(dāng)天的數(shù)據(jù)。

加載數(shù)據(jù)

為了加快數(shù)據(jù)的處理速度，提前將mariadb數(shù)據(jù)庫(kù)中的數(shù)據(jù)查詢(xún)出來(lái)，保存成feather格式的數(shù)據(jù)，以提高加載數(shù)據(jù)的速度。關(guān)鍵代碼如下：

def main_code_to_feather():
    # Get Cursor, Fieldinfo And Total Rows
    cur = conn.cursor()
    labels = [fld[0] for fld in get_fieldinfo(cur)] # 獲取所有的字段信息
    codes = get_all_stock_code(cur) # 獲取所有的股票代碼
    code_inedx = 0
    for code in codes:
        print("Processing:", code_inedx, "/", len(codes))
        code_inedx += 1
        data = fetch_by_code(cur, code, None, None).fetchall() # 獲取對(duì)應(yīng)股票的數(shù)據(jù)
        df = pd.DataFrame(data=data, columns=labels) # 將數(shù)據(jù)放入pd的表
        df.drop(columns=["id"], inplace=True) # 數(shù)據(jù)庫(kù)中的id字段沒(méi)有意義，drop掉
        os.makedirs("data_by_code", exist_ok=True)
        save_path = os.path.join("data_by_code", code+".feather") # 將股票數(shù)據(jù)保存成feather格式的數(shù)據(jù)
        df.to_feather(save_path)

if __name__ == "__main__":
    main_code_to_feather()

經(jīng)過(guò)處理，不同股票的數(shù)據(jù)保存在了不同的文件中，列名還保持著數(shù)據(jù)庫(kù)中的字段名。我選擇了股票代碼為sh600010的這只股票作為數(shù)據(jù)分析的數(shù)據(jù)來(lái)源。

從文件中加載數(shù)據(jù)的代碼如下:

df = pd.read_feather("data_by_code/sh600010.feather")

處理數(shù)據(jù)

從股票數(shù)據(jù)中取出開(kāi)盤(pán)價(jià)、最高成交價(jià)、最低成交價(jià)和成交量作為feature，取出收盤(pán)價(jià)作為預(yù)測(cè)的目標(biāo)，最后取出日期作為繪圖的橫座標(biāo)數(shù)據(jù)。關(guān)鍵代碼如下：

x_tmp = []
y_tmp = []
date_tmp = []
for row in range(df.shape[0]):
    today = df.loc[row]
    # 當(dāng)天信息
    x_tmp.append(tuple([
        today["popen"] / 1e1,
        today["phigh"] / 1e1,
        today["plow"] / 1e1,
        today["vol"] / 1e4, # 防止loss溢出
    ]))
    # 收盤(pán)價(jià)格
    y_tmp.append(today["pclose"] / 1e1) # y/10防止loss溢出
    # 日期
    date_tmp.append(today["deal_date"])
x = tf.constant(x_tmp, dtype=tf.float32)
y = tf.constant(y_tmp, dtype=tf.float32)

這里將關(guān)鍵指標(biāo)都除以了一個(gè)固定的數(shù)，可以防止loss溢出導(dǎo)致模型無(wú)法優(yōu)化。

劃分訓(xùn)練集與測(cè)試集，取最后5%的數(shù)據(jù)作為測(cè)試集。代碼如下:

data_size = len(x_data)
test_size = int(data_size * 0.05)
x_train = x_data[:data_size - test_size]
y_train = y_data[:data_size - test_size]
x_test = x_data[data_size - test_size:]
y_test = y_data[data_size - test_size:]
date_test = date_data[data_size - test_size:]

選取模型并進(jìn)行訓(xùn)練

我選取的是線性模型，使用線性模型進(jìn)行訓(xùn)練，在訓(xùn)練時(shí)使用了tensorflow的keras庫(kù)來(lái)簡(jiǎn)化代碼的編寫(xiě):

model = keras.Sequential(
    [
        layers.Dense(1, name="layer1"), # 輸出size為1，即線性回歸模型
    ]
)
model.compile(
    optimizer = optimizers.SGD(learning_rate=0.01),
    loss = losses.MeanSquaredError(),
)
history = model.fit(x_train, y_train, batch_size=256, epochs=128, validation_split=0.2)

使用模型進(jìn)行預(yù)測(cè)

使用訓(xùn)練過(guò)的模型對(duì)測(cè)試數(shù)據(jù)集進(jìn)行預(yù)測(cè):

y_predict = model.predict(x_test)
y_pred = []
for i in range(len(y_test)):
    y_pred.append(y_predict[i][0])

繪制真實(shí)值與預(yù)測(cè)值的圖像

使用matplotlib繪制圖表，使用日期作為橫座標(biāo)，使用收盤(pán)價(jià)÷10作為縱座標(biāo)。

plt.figure(figsize=(16, 8))
plt.plot(date_test, y_test, label="real")
plt.plot(date_test, y_pred, label="predict")

對(duì)預(yù)測(cè)結(jié)果的分析

根據(jù)預(yù)測(cè)結(jié)果繪制的函數(shù)圖像如圖所示:

Python基于機(jī)器學(xué)習(xí)實(shí)現(xiàn)的股票價(jià)格預(yù)測(cè)、股票預(yù)測(cè)源碼+數(shù)據(jù)集，機(jī)器學(xué)習(xí)大作業(yè)

根據(jù)圖像可以看出，預(yù)測(cè)值和真實(shí)值差距較大。這是由于影響股票價(jià)格的因素很多，選取的幾個(gè)參數(shù)不能準(zhǔn)確預(yù)測(cè)。

但是同時(shí)也可以看出，預(yù)測(cè)出來(lái)的結(jié)果與真實(shí)值變化趨勢(shì)相近，說(shuō)明線性回歸模型在一定程度上能夠解釋收盤(pán)價(jià)與選取的feature之間的關(guān)系。

完整代碼下載地址：

Python基于機(jī)器學(xué)習(xí)實(shí)現(xiàn)的股票價(jià)格預(yù)測(cè)、股票預(yù)測(cè)源碼+數(shù)據(jù)集，機(jī)器學(xué)習(xí)大作業(yè)

?文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-418153.html

到了這里，關(guān)于Python基于機(jī)器學(xué)習(xí)實(shí)現(xiàn)的股票價(jià)格預(yù)測(cè)、股票預(yù)測(cè)源碼+數(shù)據(jù)集，機(jī)器學(xué)習(xí)大作業(yè)的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶(hù)投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

AI：155-基于深度學(xué)習(xí)的股票價(jià)格預(yù)測(cè)模型
本文收錄于專(zhuān)欄：精通AI實(shí)戰(zhàn)千例專(zhuān)欄合集從基礎(chǔ)到實(shí)踐，深入學(xué)習(xí)。無(wú)論你是初學(xué)者還是經(jīng)驗(yàn)豐富的老手，對(duì)于本專(zhuān)欄案例和項(xiàng)目實(shí)踐都有參考學(xué)習(xí)意義。每一個(gè)案例都附帶關(guān)鍵代碼，詳細(xì)講解供大家學(xué)習(xí)，希望可以幫到大家。正在不斷更新中~ 股票價(jià)格預(yù)測(cè)一直是金融領(lǐng)
2024年04月15日
瀏覽(16)
Python-基于長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)的SP500的股票價(jià)格預(yù)測(cè) 股價(jià)預(yù)測(cè) Python數(shù)據(jù)分析實(shí)戰(zhàn) 數(shù)據(jù)可視化時(shí)序數(shù)據(jù)預(yù)測(cè) 變種RNN 股票預(yù)測(cè)
Python-基于長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)的SP500的股票價(jià)格預(yù)測(cè) 股價(jià)預(yù)測(cè) Python數(shù)據(jù)分析實(shí)戰(zhàn) 數(shù)據(jù)可視化時(shí)序數(shù)據(jù)預(yù)測(cè) 變種RNN 股票預(yù)測(cè) 近些年，隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展，神經(jīng)網(wǎng)絡(luò)在預(yù)測(cè)方面的應(yīng)用愈加廣泛，尤其是長(zhǎng)短期記憶人工神經(jīng)網(wǎng)絡(luò)（Long Short-Term Memory，LSTM）在各領(lǐng)域、各
2024年02月03日
瀏覽(20)
股票價(jià)格預(yù)測(cè) | Python使用GRU預(yù)測(cè)股票價(jià)格
Python使用GRU預(yù)測(cè)股票價(jià)格
2024年04月17日
瀏覽(26)
畢業(yè)設(shè)計(jì)-基于機(jī)器學(xué)習(xí)的股票預(yù)測(cè)
目錄前言課題背景和意義實(shí)現(xiàn)技術(shù)思路一、傳統(tǒng)股票預(yù)測(cè)模型 ?二、新型股票預(yù)測(cè)方法實(shí)現(xiàn)效果圖樣例? 最后 ? ? ??大四是整個(gè)大學(xué)期間最忙碌的時(shí)光,一邊要忙著備考或?qū)嵙?xí)為畢業(yè)后面臨的就業(yè)升學(xué)做準(zhǔn)備,一邊要為畢業(yè)設(shè)計(jì)耗費(fèi)大量精力。近幾年各個(gè)學(xué)校要求的畢設(shè)項(xiàng)
2023年04月08日
瀏覽(95)
基于Flask+Bootstrap+機(jī)器學(xué)習(xí)的南昌市租房?jī)r(jià)格預(yù)測(cè)系統(tǒng)
???♂? 個(gè)人主頁(yè)：@艾派森的個(gè)人主頁(yè) ???作者簡(jiǎn)介：Python學(xué)習(xí)者 ?? 希望大家多多支持，我們一起進(jìn)步！?? 如果文章對(duì)你有幫助的話(huà)，歡迎評(píng)論 ??點(diǎn)贊???? 收藏 ??加關(guān)注+ 目錄一、項(xiàng)目介紹 1.1項(xiàng)目簡(jiǎn)介 1.2技術(shù)工具 1.3頁(yè)面概述? 二、項(xiàng)目步驟 2.1登錄模塊 2.2注冊(cè)
2024年02月02日
瀏覽(21)
機(jī)器學(xué)習(xí)：基于邏輯回歸（Logistic Regression）對(duì)股票客戶(hù)流失預(yù)測(cè)分析
作者：i阿極作者簡(jiǎn)介：Python領(lǐng)域新星作者、多項(xiàng)比賽獲獎(jiǎng)?wù)撸翰┲鱾€(gè)人首頁(yè) ??????如果覺(jué)得文章不錯(cuò)或能幫助到你學(xué)習(xí)，可以點(diǎn)贊??收藏??評(píng)論??+關(guān)注哦！?????? ??????如果有小伙伴需要數(shù)據(jù)集和學(xué)習(xí)交流，文章下方有交流學(xué)習(xí)區(qū)！一起學(xué)習(xí)進(jìn)步！?? 專(zhuān)欄案例：
2023年04月26日
瀏覽(27)
用K近鄰（KNN）機(jī)器學(xué)習(xí)算法進(jìn)行股票走勢(shì)預(yù)測(cè)-Python
K近鄰(KNN，K-Nearest Neighbors)是最簡(jiǎn)單的機(jī)器學(xué)習(xí)算法之一，可用于回歸和分類(lèi)。KNN是一種“惰性”學(xué)習(xí)算法，從技術(shù)上講，它不訓(xùn)練模型來(lái)進(jìn)行預(yù)測(cè)。K近鄰的邏輯是，假設(shè)有一個(gè)觀測(cè)值，這個(gè)觀測(cè)值被預(yù)測(cè)屬于離它k個(gè)最近觀測(cè)值中所占比例最大的那一個(gè)類(lèi)。KNN方法是直接嘗試
2024年02月04日
瀏覽(24)
如何用Python對(duì)股票數(shù)據(jù)進(jìn)行LSTM神經(jīng)網(wǎng)絡(luò)和XGboost機(jī)器學(xué)習(xí)預(yù)測(cè)分析（附源碼和詳細(xì)步驟），學(xué)會(huì)的小伙伴們說(shuō)不定就成為炒股專(zhuān)家一夜暴富了
最近調(diào)研了一下我做的項(xiàng)目受歡迎程度，大數(shù)據(jù)分析方向竟然排第一，尤其是這兩年受疫情影響，大家都非常擔(dān)心自家公司裁員或倒閉，都想著有沒(méi)有其他副業(yè)搞搞或者炒炒股、投資點(diǎn)理財(cái)產(chǎn)品，未雨綢繆，所以不少小伙伴要求我這邊分享下關(guān)于股票預(yù)測(cè)分析的技巧。基于股
2024年02月02日
瀏覽(21)
深度學(xué)習(xí)一點(diǎn)通：PyTorch Transformer 預(yù)測(cè)股票價(jià)格，虛擬數(shù)據(jù)，chatGPT同源模型
預(yù)測(cè)股票價(jià)格是一項(xiàng)具有挑戰(zhàn)性的任務(wù)，已引起研究人員和從業(yè)者的廣泛關(guān)注。隨著深度學(xué)習(xí)技術(shù)的出現(xiàn)，已經(jīng)提出了許多模型來(lái)解決這個(gè)問(wèn)題。其中一個(gè)模型是 Transformer，它在許多自然語(yǔ)言處理任務(wù)中取得了最先進(jìn)的結(jié)果。在這篇博文中，我們將向您介紹一個(gè)示例，該示例
2024年02月06日
瀏覽(19)
時(shí)序預(yù)測(cè) | MATLAB實(shí)現(xiàn)BO-LSTM貝葉斯優(yōu)化長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)股票價(jià)格預(yù)測(cè)
效果一覽基本介紹時(shí)序預(yù)測(cè) | MATLAB實(shí)現(xiàn)BO-LSTM貝葉斯優(yōu)化長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)股票價(jià)格預(yù)測(cè)
2024年02月12日
瀏覽(28)