国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

數(shù)學建模美賽(模型積累2)

這篇具有很好參考價值的文章主要介紹了數(shù)學建模美賽(模型積累2)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

一、聚類模型

SPSS聚類分析(含k-均值聚類,系統(tǒng)聚類和二階聚類)https://blog.csdn.net/m0_52124992/article/details/128916757

看這個,寫的很詳細(??????)??

DBSCAN聚類:基于密度的方法的特點是不依賴于距離,而是依賴于密度,從而克服基于距離的算法只能發(fā)現(xiàn)“球形”聚簇的缺點

二、爬蟲學習

(1)我選擇的是在pycharm上進行爬蟲

爬蟲入門教程:【Python+爬蟲】爆肝兩個月!拜托三連了!這絕對是全B站最用心(沒有之一)

(這個up講課很可愛,PPT做的也很精美,超級好?。?/p>

還有一個教程我也很喜歡:【Python爬蟲教程】

(2)方法積累

因為這里沒寫完就開始比賽了,現(xiàn)在這部分是比完賽補充的,

學完爬蟲之后一定要找?guī)讉€例子去練習,不只是多看幾個有有教程的案例,要自己找信息去爬,畢竟有一句關于爬蟲的名言就是萬物皆可爬嘛?(??????)??

在練習的過程中,注意區(qū)分是從網(wǎng)頁源代碼中找信息,還是通過抓包找信息,這涉及到獲取到的數(shù)據(jù)格式的不同。

1.直接爬取的網(wǎng)頁源代碼,“.text”之后獲取到“str”字符串類型的數(shù)據(jù),輸出可以看到是<html>的數(shù)據(jù)(不是一整行),這樣之后用正則去篩選所需要的信息是最簡單的。要注意正則得到的結(jié)果是一個列表,哪怕只有一組數(shù)據(jù)。

2.通過抓包獲取的數(shù)據(jù)包:

如果一眼看上去比較整齊(先在瀏覽器里預覽數(shù)據(jù)包內(nèi)容),這時候就不適合".text"轉(zhuǎn)換成字符串了,選擇",json()"可以得到更加整齊的數(shù)據(jù),字典或者由字典組成的列表(判斷是不是字典就看冒號前面的字符是不是單引號括起來的,如果是則是字典)。索引之后就是字符串類型了,如果需要可以繼續(xù)用正則篩選;

還有一種情況,如果".text"得到的類似網(wǎng)頁數(shù)據(jù),但是在一整行內(nèi),且內(nèi)容中充斥著 \n \t 等,這種數(shù)據(jù)用正則并不好處理,可以選擇用",json()"獲取到字典數(shù)據(jù),進一步索引得到字符串,然后再使用正則篩選數(shù)據(jù)。

3.我的實戰(zhàn)經(jīng)驗也并不多,只是在比賽過程中用到了這些,簡單總結(jié)了一下方法規(guī)律,希望能幫到大家。在實際應用中還是要根據(jù)需要爬取的數(shù)據(jù)類型靈活的選擇合適的方法。

(3)經(jīng)驗積累

在實際使用中,出現(xiàn)了幾個棘手的問題

1.在爬取外國網(wǎng)站時,網(wǎng)站加載速度慢,如果需要的數(shù)據(jù)量大,運行時間就會特別長,可以準備一下多線程,可以大幅度提高爬取的速度。因為考慮到多線程會影響數(shù)據(jù)順序,而且我需要的數(shù)據(jù)也并不是很多,所以我沒有使用,具體代碼上面教程里也有講到。

#需要導庫
from concurrent.futures import ThreadPoolExecutor

2.在循環(huán)爬取的過程中,可能會出現(xiàn)訪問失敗的情況,為了不影響整個進度,可以用try except語句解決

        try:
            #可能出問題的代碼段
            #要設置timeout值(單位是秒)
            response = requests.get(url=url1, headers=headers, timeout=200)
            print('請求成功?。?!')
        except requests.exceptions.ReadTimeout:
            print('請求超時,正在繼續(xù)下一個循環(huán)。')
            continue  # 跳過當前循環(huán),繼續(xù)下一個循環(huán)
        except requests.exceptions.RequestException:
            print('請求異常,正在繼續(xù)下一個循環(huán)。')
            continue  # 跳過當前循環(huán),繼續(xù)下一個循環(huán)

同時可以在循環(huán)中加入隨機延時,以模擬真正的用戶訪問

import time
import random

time.sleep(random.random()*3)

3.爬取到的數(shù)據(jù)想要存儲在Excel表格中,先把數(shù)據(jù)準備成二維列表數(shù)據(jù)

import pandas as pd

data = [['1', '21', '1954', '69', '1981', '0', '0', '2', '0', '43', '1974', '44', '1974'], 
        ['2', '13', '1974', '69', '1997', '0', '0', '2', '0', '67', '1955', 'T', '2011'], 
        ['3', '12', '1974', '69', '1997', '0', '0', '2', '0', '81', '2005', 'T', '2011'], 
        ['4', '14', '1970', '68', '2012', '0', '0', '2', '0', '74', '1995', '43', '1974']]

# 將數(shù)據(jù)轉(zhuǎn)換為pandas DataFrame對象
df = pd.DataFrame(data, columns=None)

# 將DataFrame對象保存為Excel文件
df.to_excel("output.xlsx", index=False)

OK!今天就到這吧,也算是簡單入門了爬蟲,明天抽時間把MATLAB里面遇到的問題整理一下(如果有整理價值的話),今年美賽就這樣了,靜候佳音吧!!

over!睡覺!文章來源地址http://www.zghlxwxcb.cn/news/detail-827685.html

到了這里,關于數(shù)學建模美賽(模型積累2)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • 2023年美賽數(shù)學建模F題思路模型分析(綠色GDP)

    2023年美賽數(shù)學建模F題思路模型分析(綠色GDP)

    國內(nèi)生產(chǎn)總值(GDP)可以說是衡量一個國家經(jīng)濟健康狀況的最著名和最常用的指標之一。它通常用于確定一個國家的購買力和獲得貸款的機會,為各國提出提高其GDP的政策和項目提供動力。GDP“衡量一個國家在給定時間段內(nèi)生產(chǎn)的最終商品和服務的貨幣價值;它計算一個國家

    2024年02月14日
    瀏覽(27)
  • 【數(shù)學建模美賽】【LaTeX】論文模板

    【數(shù)學建模美賽】【LaTeX】論文模板

    在數(shù)學建模競賽中,往往論文的版面與美觀占一定的分數(shù),而大多數(shù)都利用word排版,因為word排版簡單方便,但在最后轉(zhuǎn)pdf時會出現(xiàn)版面的錯亂情況,所以這會影響最終的成績。因此我們可以采用LaTeX進行論文的排版,使論文的版面更加自然。LaTeX排版需要一定的編程基礎,這

    2024年02月11日
    瀏覽(15)
  • 數(shù)學建模美賽到底要注意什么?

    論文本質(zhì)上是一種解答 頁數(shù)限制是剛性! 假設要具有合理性,同時簡化問題 ,比如:繞行星轉(zhuǎn)的時候?qū)⑿行强醋髑蝮w,如果下落且行星很大,則下落時行星表面可視為平面地面。 先算出結(jié)果,判斷是否能接受,接受的話再去保留原始假設。 假設的理由?。?!假設的合理性

    2024年02月03日
    瀏覽(28)
  • 2023美賽ABCDEF題思路獲取/2023美賽思路ABCDEF題/美賽數(shù)學建模思路

    美賽、數(shù)學建模、美國大學生數(shù)學建模、美賽思路、美國大學生數(shù)學建模思路、2023美賽、2023美國大學生數(shù)學建模競賽、2023美賽思路、2023美賽數(shù)據(jù)、2023美賽A題、2023美賽B題、2023美賽C題、2023美賽D題、2023美賽E題、2023美賽F題、 2023美賽數(shù)據(jù)、2023美賽論文、2023美賽解析、2023美

    2024年02月13日
    瀏覽(16)
  • 數(shù)學建模美賽資料(賽題+獲獎論文更新)

    數(shù)學建模美賽資料(賽題+獲獎論文更新)

    數(shù)學建模美賽歷年真題可以幫助我們了解比賽的出題思路,對建模比賽有一個大致的了解。 在備賽過程中,通過往年真題,我們可以了解考試的范圍和重點,做到心中有數(shù),可以有的放矢。 通過真題,我們可以感受到各個模型的應用范圍和問題的難度,使我們在備賽過程中

    2024年01月19日
    瀏覽(15)
  • 美賽BOOM數(shù)學建模BOOM1-4多目標規(guī)劃

    美賽BOOM數(shù)學建模BOOM1-4多目標規(guī)劃

    既要XXX,又要XXX ? 回顧:(非)線性規(guī)劃都是一個目標函數(shù),例如工業(yè)生產(chǎn)產(chǎn)品,追求最大化利潤等等。 ? 例如:某工廠生產(chǎn)產(chǎn)品Ⅰ和產(chǎn)品Ⅱ,有關數(shù)據(jù)如下,若只追求最大化利潤,得到模型: 現(xiàn)在設有 3個目標 : ? 1.盡量使產(chǎn)品Ⅰ的產(chǎn)量不超過產(chǎn)品Ⅱ的產(chǎn)量; ? 2.盡可能

    2024年02月16日
    瀏覽(21)
  • 數(shù)學建模美賽O獎、國賽國一隊伍經(jīng)驗分享

    數(shù)學建模美賽O獎、國賽國一隊伍經(jīng)驗分享

    前言:本團隊成員來自某985院校,均成功保研,有多次數(shù)學建模參賽經(jīng)驗,對數(shù)模有一定自己的理解和體會。本人有幸匯集了三支分別獲2023美賽O獎、F獎、M獎、2022美賽F獎、國賽國一、國二的隊伍經(jīng)驗,現(xiàn)整理成文章,供大家參考,內(nèi)容將持續(xù)更新。 本博主參加數(shù)學建模賽事

    2024年02月08日
    瀏覽(20)
  • 【數(shù)學建模美賽M獎速成系列】數(shù)據(jù)可視化(二)

    【數(shù)學建模美賽M獎速成系列】數(shù)據(jù)可視化(二)

    上一篇文章為大家分享了 山脊圖和氣泡圖 的繪圖方法與代碼,這里學姐為繼續(xù)為大家分享 百分比堆疊線條圖和火山圖 ,包含 matlab和python的完整代碼 ,需要完整代碼的同學看文章最后,另外,如果沒有美賽經(jīng)驗想要獲獎,歡迎咨詢哦~ 百分比堆疊線條圖是一種數(shù)據(jù)可視化工

    2024年01月19日
    瀏覽(21)
  • 【數(shù)學建模美賽M獎速成系列】數(shù)據(jù)可視化方法(一)

    【數(shù)學建模美賽M獎速成系列】數(shù)據(jù)可視化方法(一)

    最近開始更新一個新的系列科研繪圖,在同一個競賽下,大家都近乎相同的解題思路下。之所以能出現(xiàn)一等二等三等獎的區(qū)別很大部分都在于結(jié)果的可視化,為了能更好地幫助大家進行可視化,近期將專門推出一個可視化板塊,推出各種好看實用的可視化圖形。 也稱為Joy P

    2024年01月16日
    瀏覽(21)
  • 2023年美國大學生數(shù)學建模競賽美賽B題思路分享

    2023年美國大學生數(shù)學建模競賽美賽B題思路分享

    2023美賽思路2023美國大學生數(shù)學建模競賽思路 2023美賽ABCDEF題思路 給大家分享一下數(shù)模美賽中的那些論文摘要寫作中的格式規(guī)范。 美賽開始后會第一時間分享美賽思路: 本文參考來源:美賽資料網(wǎng) 2023年美賽僅剩3天時間了,各位小伙伴們都準備的如何了呢?備戰(zhàn)這么久為了避

    2024年02月07日
    瀏覽(25)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包