国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）

2年前作者：向陽(yáng)花花花花分類：Toy博客閱讀(25)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

本文介紹在數(shù)據(jù)分析中如何使用 pandas 進(jìn)行數(shù)據(jù)清洗，是 pandas 學(xué)習(xí)階段的 重點(diǎn)，沒(méi)有之一。

一、重復(fù)值檢測(cè)

pandas中用于重復(fù)值檢測(cè)的是 duplicated() 函數(shù)，可以用于檢測(cè)行或列是否前后重復(fù)，返回值是 bool 類型。True 表示重復(fù)，F(xiàn)alse 表示不重復(fù)。

函數(shù)參數(shù)：

keep：默認(rèn)情況下 keep = first ，表示第一行不重復(fù)，后面的行參照第一行，取值還有 last（認(rèn)為最后一行不重復(fù)），False（標(biāo)記所有重復(fù)行）。
subset：只檢測(cè)某些列是否重復(fù)，值是一個(gè)列表。

首先導(dǎo)入必要的包，并定義一個(gè)用于構(gòu)建 dataframe 對(duì)象的函數(shù)：

import numpy as np
import pandas as pd

# 定義生成 dataframe 對(duì)象的函數(shù)
def make_df(indexs,columns):
    data = [[str(j)+str(i) for j in columns] for i in indexs]
    df = pd.DataFrame(data=data,index=indexs,columns=columns)
    return df
df = make_df(list('123'),list('ABC'))
df

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

下面演示 duplicated() 函數(shù)以及參數(shù)的使用：

# 讓第一行和第二行一樣
df.loc['1'] = df.loc['2']
df

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

df.duplicated()

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python
等價(jià)寫(xiě)法：

df.duplicated(keep='first')

以最后一行為不重復(fù)參照：

df.duplicated(keep='last')

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python
標(biāo)記所有重復(fù)行：

df.duplicated(keep=False)

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python
只檢查 B、C 列：

df.duplicated(subset=['B','C'])

二、元素替換

1?? 元素替換replace

replace 函數(shù)用于替換單個(gè)的元素。

首先構(gòu)建 dataframe 對(duì)象：（本文后面用到的 dataframe 對(duì)象都是這個(gè)，只是數(shù)據(jù)是隨機(jī)產(chǎn)生的，和我的肯定不同，但是不重要）

index = ['張三','張三豐','李白','杜甫']
columns = ['Python','Java','H5','UI']
data = np.random.randint(0,100,(4,4))
df = pd.DataFrame(data=data,index=index,columns=columns)
df

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python
將1、11分別改為60，61：

df.replace({1:60,11:61})

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

2?? 數(shù)據(jù)映射map

map 一般用于 Series 結(jié)構(gòu)，不能用于 dataframe ，因此，我們?cè)谑褂?map 來(lái)處理 dataframe 對(duì)象時(shí)，應(yīng)該取一個(gè) Series （列）。

如果對(duì) dataframe 對(duì)象使用 map 函數(shù)（不是下面的第一種情況）：

df.map(lambda x:'及格' if x >= 60 else '不及格')

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python
如果對(duì) Series 對(duì)象使用 map 函數(shù)（下面的2、3種情況）：

df['Python'].map(lambda x:'及格' if x >= 60 else '不及格')

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

1.直接使用 map

現(xiàn)在將上面的4、18分別改為44，81：

df.map({4:44,18:81})

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

2.使用 lambda 表達(dá)式

現(xiàn)在使用 lambda 表達(dá)式篩選 Python 成績(jī)，分為及格和不及格。

df['Python'].map(lambda x:'及格' if x >= 60 else '不及格')

3.使用普通函數(shù)

使用普通函數(shù)，即為 map 函數(shù)傳遞一個(gè)函數(shù)名：

# 使用普通函數(shù)
def fn(x):
    if x >= 60:
        return '及格'
    return '不及格'
df['UI'].map(fn)

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

三、修改索引

1?? 修改索引名rename

使用 pd.rename() 函數(shù)可以修改索引，默認(rèn)是修改行索引，傳遞字典。

使用 rename 函數(shù)修改行索引：

df.rename({'張三':'ZhangSan'})

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

如果要修改列索引，要使用 axis = 1 指定：

df.rename({'Python':'派森'},axis=1)

或者使用 columns 參數(shù)：

df.rename(columns={'Java':'爪哇'})

結(jié)果如下：
【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

修改行索引還是修改列索引，可以通過(guò) axis 控制，也可以使用 index 、 columns 參數(shù)控制。

2?? 設(shè)置索引和重置索引

pandas中 set_index() 函數(shù)用于將 keys 參數(shù)中指定的列索引變?yōu)樾兴饕?/p>

接下來(lái)使用 set_index() 修改列索引 Python 為行索引：

df.set_index(keys=['Python'])

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

函數(shù)參數(shù)：

keys：列表類型，用于指定要更改的列。
drop：bool 類型，默認(rèn)為T(mén)rue，表示列改為行索引后，刪除原來(lái)的列。
append：bool 列行，默認(rèn)為False，表示不追加，刪除原來(lái)的行索引。

重置行索引使用 reset_index 函數(shù)，重置列索引使用的是 df.columns 重新賦值。

分別重置行索引和列索引：
【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

df.columns = ['1','2','3','4'] 
df

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

四、數(shù)據(jù)處理

apply、applymap、transform 都是用于數(shù)據(jù)處理的函數(shù)，其中 applymap 只適用于處理 dataframe ，apply 和 transform 適用于處理 Series 和 DataFrame 。

1?? apply與applymap

apply 應(yīng)用于Series：

df['Python'].apply(lambda x: True if x > 60 else False)

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

apply 應(yīng)用于DataFrame（求每一列的平均值）：

df.apply(lambda x:x.mean())

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python
也可以傳遞一個(gè)函數(shù)，并控制計(jì)算行或列：

def fn(x):
    return (x.mean(),x.count())
df.apply(fn,axis=1)

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python
applymap 處理 dataframe ：

# 處理Series報(bào)錯(cuò)
df['Python'].applymap(lambda x:x*10)

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

# 處理dataframe不報(bào)錯(cuò)
df.applymap(lambda x:x*10)

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

2?? transform

transform 處理 Series（計(jì)算Python列的平方根）：

df['Python'].transform(np.sort)

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

transform 處理 DataFrame（平均值大于6就除以6）：

def fn(x):
    if x.mean() > 6:
        return x / 6
    return x
df.transform(fn)

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

五、異常值處理

這部分的內(nèi)容，主要介紹8個(gè)常用函數(shù)的用法，為了防止圖片過(guò)多，部分實(shí)際運(yùn)行結(jié)果已省略。

describe()

describe函數(shù)用于查看 dataframe 對(duì)象的列數(shù)，平均值，標(biāo)準(zhǔn)差，最小值、最大值、平均值等。

# 構(gòu)建dataframe對(duì)象
data = np.random.randint(0,10,(5,3))
df = pd.DataFrame(columns=['NumPy','Pandas','Pytorch'],data=data)
df

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

df.describe()

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python
查看更細(xì)致的百分位數(shù)，并且轉(zhuǎn)置：

df.describe([0.01,0.33,0.99]).T

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

info()、std()

info 函數(shù)用于查看數(shù)據(jù)類型、行列索引、每一列數(shù)據(jù)非空情況、類型、內(nèi)存使用情況等。
std() 函數(shù)用于求每一列的標(biāo)準(zhǔn)差。

df.info()
df.std()

drop()

drop 函數(shù)用于刪除索引?？梢酝ㄟ^(guò) axis 或者 index / columns 控制刪除行索引還是列索引。

df2.drop(0) # 默認(rèn)刪除行
df2.drop(index=0) # 等價(jià)寫(xiě)法
df2.drop('NumPy',axis=1) # 刪除列
df2.drop(columns='NumPy') # 等價(jià)寫(xiě)法
df2.drop(columns=['NumPy','Pandas']) # 刪除多列
df2.drop(columns='NumPy',inplace=True) # 修改原數(shù)據(jù)

unique()

unique 函數(shù)用于去重，只能應(yīng)用于 Series 對(duì)象，不能用于 DataFrame 對(duì)象。

df['Pytorch'].unique()

query()

query 函數(shù)用于查詢特定的行。

df.query('Pandas == 6') # 查詢pandas = 6的行
df.query('Pytorch > 2') # 查詢Pytorch > 2的行
df.query('Pandas == 6 and Pytorch > 2' ) # 使用 and 符
n = 3
df.query('Pytorch > @n') # 使用變量

sort_values()

sort_values 函數(shù)作用是根據(jù)值對(duì)行或列進(jìn)行排序。

df.sort_values('Pandas') # 默認(rèn)列排序
df.sort_values('Pandas',ascending=False) # 降序
df.sort_values(0,axis=1) # 行排序

sort_index()

sort_index 函數(shù)用于對(duì)索引排序，數(shù)字按大小，非數(shù)字按 ASCII 碼。

df.sort_index() # 默認(rèn)對(duì)行索引排序（axis = 0），并且是升序（ascending = True）
df.sort_index(ascending=False) # 降序
df.sort_index(axis = 1,ascending=False) # 對(duì)列索引排序，并且降序

六、抽樣聚合函數(shù)

1?? 抽樣

pandas 中有兩種抽樣，分別是有放回抽樣（可能重復(fù)）和無(wú)放回抽樣（不會(huì)重復(fù)），使用 take 函數(shù)抽取，下面使用代碼表示。

首先查看 dataframe 對(duì)象：
【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

無(wú)放回抽樣

df.take([0,2,3,1,4]) # 交換行

運(yùn)行結(jié)果分別是：
【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

df.take([0,2,1],axis=1) # 交換列

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

df.take(np.random.permutation([0,1,2,3,4])) # 隨機(jī)交換

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

有放回抽樣

df.take(np.random.randint(0,4,size=5))

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

2?? 數(shù)學(xué)函數(shù)

這里羅列出了一些常用的數(shù)學(xué)函數(shù)，不再以代碼演示。

函數(shù)名	功能
count	非空值數(shù)量
max / min	最大 / 小值
median / mean	中位數(shù) / 平均數(shù)
sum	和
value_counts	元素出現(xiàn)次數(shù)
cumsum	累加
cumprod	累乘
std	標(biāo)準(zhǔn)差
var	方差
cov	協(xié)方差
corr	相關(guān)系數(shù)

七、分組聚合

分組操作通過(guò) groupby() 方法實(shí)現(xiàn)，得到的是一個(gè) DataFrameGroupBy 對(duì)象，該對(duì)象與 DataFrame 類似，操作和 DataFrame 一樣即可。

下面結(jié)合例題講解 groupby 方法。

有如下 dataframe 對(duì)象：

df = pd.DataFrame(
    data={
        'item':['蘿卜','白菜','辣椒','冬瓜','白菜','辣椒','蘿卜','蘿卜'],
        'color':['白色','青色','紅色','白色','白色','青色','紅色','青色'],
        'weight':[1,0,3,4,5,2,12,3],
        'price':[0.99,1.5,2,5,4,2,9,2]
    }
)
df

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

1.求出顏色為白色的價(jià)格總和

# 要得到顏色為白色的所有行，首先要按照顏色進(jìn)行分組，通過(guò) by 參數(shù)指定
df.groupby(by='color')
# 接下來(lái)取出價(jià)格列（Series類型）
df.groupby(by='color')['price']
# 進(jìn)行求和
df.groupby(by='color')['price'].sum()
# 最后取出白色
df.groupby(by='color')['price'].sum()['白色']

2.分別求出蘿卜的總重量和平均價(jià)格

# （1）
# 首先按照item分類
df.groupby('item')
# 然后取出重量
df.groupby('item')['weight']
# 求和
df.groupby('item')['weight'].sum()
# 再取出蘿卜
df.groupby('item')['weight'].sum()['蘿卜']
#（2）
# 類似的，得到平均價(jià)格
df.groupby('item')['price'].mean()['蘿卜']

3.使用 merge 合并總重量和平均價(jià)格

因?yàn)樯鲜鋈〕?weight 和 price 后是 Series 對(duì)象，我們要稍作改變?yōu)?DataFrame 對(duì)象，才能使用 merge 進(jìn)行合并。

df1 = df.groupby('item')[['weight']].sum()
df2 = df.groupby('item')[['price']].mean()
display(df1,df2)

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

# 因?yàn)閮蓚€(gè) df 對(duì)象沒(méi)有相同列，合并時(shí)要使用 left / right_index
df1.merge(df2,left_index=True,right_index=True)

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

?? 文末福利

本期送出《Python機(jī)器學(xué)習(xí)：基于PyTorch和Scikit-Learn》。
【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python

本書(shū)是一本全面介紹在PyTorch環(huán)境下學(xué)習(xí)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的綜合指南，可以作為初學(xué)者的入門(mén)教程，也可以作為讀者開(kāi)發(fā)機(jī)器學(xué)習(xí)項(xiàng)目時(shí)的參考書(shū)。

本書(shū)講解清晰、示例生動(dòng)，深入介紹了機(jī)器學(xué)習(xí)方法的基礎(chǔ)知識(shí)，不僅提供了構(gòu)建機(jī)器學(xué)習(xí)模型的說(shuō)明，而且提供了構(gòu)建機(jī)器學(xué)習(xí)模型和解決實(shí)際問(wèn)題的基本準(zhǔn)則。本書(shū)添加了基于PyTorch的深度學(xué)習(xí)內(nèi)容，介紹了新版Scikit-Learn。本書(shū)涵蓋了多種用于文本和圖像分類的機(jī)器學(xué)習(xí)與深度學(xué)習(xí)方法，介紹了用于生成新數(shù)據(jù)的生成對(duì)抗網(wǎng)絡(luò)（GAN）和用于訓(xùn)練智能體的強(qiáng)化學(xué)習(xí)。最后，本書(shū)還介紹了深度學(xué)習(xí)的新動(dòng)態(tài)，包括圖神經(jīng)網(wǎng)絡(luò)和用于自然語(yǔ)言處理（NLP）的大型transformer。無(wú)論是機(jī)器學(xué)習(xí)入門(mén)新手，還是計(jì)劃跟蹤機(jī)器學(xué)習(xí)進(jìn)展的研發(fā)人員，都可以將本書(shū)作為使用Python進(jìn)行機(jī)器學(xué)習(xí)的不二之選。

學(xué)完本書(shū)，你將能夠：

探索機(jī)器從數(shù)據(jù)中“學(xué)習(xí)”的框架、模型和方法。
使用Scikit-Learn實(shí)現(xiàn)機(jī)器學(xué)習(xí)，使用PyTorch實(shí)現(xiàn)深度學(xué)習(xí)。
訓(xùn)練機(jī)器學(xué)習(xí)分類器分類圖像、文本等數(shù)據(jù)。
構(gòu)建和訓(xùn)練神經(jīng)網(wǎng)絡(luò)、transformer及圖神經(jīng)網(wǎng)絡(luò)。
探索評(píng)估和優(yōu)化模型的最佳方法。
使用回歸分析預(yù)測(cè)連續(xù)目標(biāo)結(jié)果。
使用情感分析深入地挖掘文本和社交媒體數(shù)據(jù)。

?? 點(diǎn)這里去往：購(gòu)買(mǎi)鏈接

?? 本次送書(shū)1~5本【閱讀量越多，送的越多】

?? 活動(dòng)時(shí)間：截止到2023-08-8 10:00

?? 參與方式： 關(guān)注博主+三連（點(diǎn)贊、收藏、評(píng)論）（切記要點(diǎn)贊+收藏，否則抽獎(jiǎng)無(wú)效）

?? 抽獎(jiǎng)方式：評(píng)論區(qū)隨機(jī)抽取小伙伴免費(fèi)送出?。?mark hidden color="red">文章來(lái)源：http://www.zghlxwxcb.cn/news/detail-623573.html

【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）,Python數(shù)據(jù)分析,pandas,機(jī)器學(xué)習(xí),python 文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-623573.html

到了這里，關(guān)于【玩轉(zhuǎn)pandas系列】數(shù)據(jù)清洗（文末送書(shū)）的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

【python】一文了解Python爬蟲(chóng) | 文末送書(shū)
目錄引言 1. 爬蟲(chóng)基礎(chǔ)知識(shí) 1.1 什么是爬蟲(chóng) 1.2 HTTP協(xié)議 1.2.1 HTTP請(qǐng)求方法 1.GET請(qǐng)求 1.2.2 請(qǐng)求頭常見(jiàn)字段 1.2.3 響應(yīng)狀態(tài)碼 1.3 HTML解析 1.3.1 Beautiful Soup ?????? 解析庫(kù) 1.3.2 XPath ????????xpath解析原理:? ?????????xpath 表達(dá)式 2. 爬蟲(chóng)進(jìn)階技巧 2.1 防止被反爬蟲(chóng) 2.1.1 User-Agent偽
2024年02月13日
瀏覽(30)
AI時(shí)代Python金融大數(shù)據(jù)分析實(shí)戰(zhàn)：ChatGPT讓金融大數(shù)據(jù)分析插上翅膀【文末送書(shū)-38】
在當(dāng)今數(shù)字化和信息化的時(shí)代，金融行業(yè)正處于巨大的變革之中。隨著人工智能（AI）和大數(shù)據(jù)技術(shù)的迅猛發(fā)展，金融機(jī)構(gòu)對(duì)于數(shù)據(jù)的處理和分析變得愈發(fā)重要。Python作為一種強(qiáng)大的編程語(yǔ)言，以其簡(jiǎn)潔、靈活、易學(xué)的特點(diǎn)，成為了金融數(shù)據(jù)分析的首選工具之一。而結(jié)合AI技術(shù)
2024年03月16日
瀏覽(25)
【文末送書(shū)】Python OpenCV從入門(mén)到精通
OpenCV（Open Source Computer Vision Library）是一個(gè)開(kāi)源的計(jì)算機(jī)視覺(jué)庫(kù)，提供了豐富的圖像處理和計(jì)算機(jī)視覺(jué)算法。它由一組用C++編寫(xiě)的函數(shù)和工具組成，同時(shí)也支持多種編程語(yǔ)言，如Python、Java等。 OpenCV的主要特點(diǎn)包括：跨平臺(tái)性：OpenCV可以在多個(gè)操作系統(tǒng)上運(yùn)行，包括Windows、
2024年02月05日
瀏覽(21)
【Python基礎(chǔ)】- for/while循環(huán)語(yǔ)句（文末送書(shū)）
? ???♂? 個(gè)人主頁(yè)：@艾派森的個(gè)人主頁(yè) ???作者簡(jiǎn)介：Python學(xué)習(xí)者 ?? 希望大家多多支持，我們一起進(jìn)步！?? 如果文章對(duì)你有幫助的話，歡迎評(píng)論 ??點(diǎn)贊???? 收藏 ??加關(guān)注+ 目錄 Python循環(huán)語(yǔ)句 while循環(huán) 無(wú)限循環(huán) while 循環(huán)使用 else 語(yǔ)句 for 循環(huán) range對(duì)象列表推導(dǎo)
2024年02月08日
瀏覽(34)
Python是什么？有什么用？怎么入門(mén)？（文末送書(shū)）
? ???♂? 個(gè)人主頁(yè)：@艾派森的個(gè)人主頁(yè) ???作者簡(jiǎn)介：Python學(xué)習(xí)者 ?? 希望大家多多支持，我們一起進(jìn)步！?? 如果文章對(duì)你有幫助的話，歡迎評(píng)論 ??點(diǎn)贊???? 收藏 ??加關(guān)注+ ????????Python是當(dāng)今世界最流行的程序語(yǔ)言之一。由荷蘭人，吉多·范羅蘇姆（Guido v
2023年04月15日
瀏覽(41)
【Python】機(jī)器學(xué)習(xí)-K-近鄰（KNN）算法【文末送書(shū)】
???????? 目錄一 . K-近鄰算法（KNN）概述? 二、KNN算法實(shí)現(xiàn) 三、 MATLAB實(shí)現(xiàn) 四、實(shí)戰(zhàn) ????????K-近鄰算法（KNN）是一種基本的分類算法，它通過(guò)計(jì)算數(shù)據(jù)點(diǎn)之間的距離來(lái)進(jìn)行分類。在KNN算法中，當(dāng)我們需要對(duì)一個(gè)未知數(shù)據(jù)點(diǎn)進(jìn)行分類時(shí)，它會(huì)與訓(xùn)練集中的各個(gè)數(shù)據(jù)點(diǎn)進(jìn)
2024年02月08日
瀏覽(22)
淺談 Python 網(wǎng)絡(luò)爬蟲(chóng)的那些事（文末送書(shū)7.0）
在大數(shù)據(jù)、人工智能應(yīng)用越來(lái)越普遍的今天，Python 可以說(shuō)是當(dāng)下世界上熱門(mén)、應(yīng)用廣泛的編程語(yǔ)言之一，在人工智能、爬蟲(chóng)、數(shù)據(jù)分析、游戲、自動(dòng)化運(yùn)維等各個(gè)方面，無(wú)處不見(jiàn)其身影。隨著大數(shù)據(jù)時(shí)代的來(lái)臨，數(shù)據(jù)的收集與統(tǒng)計(jì)占據(jù)了重要地位，而數(shù)據(jù)的收集工作在很大程
2024年02月08日
瀏覽(23)
【文末送書(shū)】AI時(shí)代數(shù)據(jù)的重要性
歡迎關(guān)注博主 Mindtechnist 或加入【智能科技社區(qū)】一起學(xué)習(xí)和分享Linux、C、C++、Python、Matlab，機(jī)器人運(yùn)動(dòng)控制、多機(jī)器人協(xié)作，智能優(yōu)化算法，濾波估計(jì)、多傳感器信息融合，機(jī)器學(xué)習(xí)，人工智能等相關(guān)領(lǐng)域的知識(shí)和技術(shù)。關(guān)注公粽號(hào) 《機(jī)器和智能》回復(fù) “python項(xiàng)目
2024年02月06日
瀏覽(20)
【Python基礎(chǔ)】- 自定義函數(shù)和匿名函數(shù)（文末送書(shū)3本）
? ???♂? 個(gè)人主頁(yè)：@艾派森的個(gè)人主頁(yè) ???作者簡(jiǎn)介：Python學(xué)習(xí)者 ?? 希望大家多多支持，我們一起進(jìn)步！?? 如果文章對(duì)你有幫助的話，歡迎評(píng)論 ??點(diǎn)贊???? 收藏 ??加關(guān)注+ 函數(shù)是組織好的，可重復(fù)使用的，用來(lái)實(shí)現(xiàn)單一，或相關(guān)聯(lián)功能的代碼段。 ? 函數(shù)能提高
2024年02月15日
瀏覽(24)
數(shù)據(jù)分析案例-圖書(shū)書(shū)籍?dāng)?shù)據(jù)可視化分析（文末送書(shū)）
? ???♂? 個(gè)人主頁(yè)：@艾派森的個(gè)人主頁(yè) ???作者簡(jiǎn)介：Python學(xué)習(xí)者 ?? 希望大家多多支持，我們一起進(jìn)步！?? 如果文章對(duì)你有幫助的話，歡迎評(píng)論 ??點(diǎn)贊???? 收藏 ??加關(guān)注+ 目錄 1.項(xiàng)目背景 2.數(shù)據(jù)集介紹 3.技術(shù)工具 4.導(dǎo)入數(shù)據(jù) 5.數(shù)據(jù)可視化文末推薦與福利 ? ??
2024年01月19日
瀏覽(19)