国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<u id="mftmn"><ins id="mftmn"></ins></u>

【Python數(shù)據(jù)處理】-Pandas筆記

2年前作者：逸峰輕云分類：Toy博客閱讀(18)違法舉報

這篇具有很好參考價值的文章主要介紹了【Python數(shù)據(jù)處理】-Pandas筆記。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

【Python數(shù)據(jù)處理】-Pandas筆記,python,pandas,筆記

Python數(shù)據(jù)處理-Pandas筆記

?? 基本概念

Pandas是一個強大的Python數(shù)據(jù)處理庫，它提供了高效的數(shù)據(jù)結構和數(shù)據(jù)分析工具，使數(shù)據(jù)處理變得簡單而快速。本篇筆記將介紹Pandas中最常用的數(shù)據(jù)結構——Series和DataFrame，以及數(shù)據(jù)處理的各種操作和技巧。

?? Series

（一）創(chuàng)建Series

Series是Pandas中的一維數(shù)組，類似于帶有標簽的NumPy數(shù)組。創(chuàng)建Series可以通過多種方式進行，以下是幾種常用的方法：

? 使用列表創(chuàng)建Series

import pandas as pd

data = [10, 20, 30, 40, 50]
s = pd.Series(data)
print(s)

輸出：

0    10
1    20
2    30
3    40
4    50
dtype: int64

? 使用NumPy數(shù)組創(chuàng)建Series

import pandas as pd
import numpy as np

data = np.array([10, 20, 30, 40, 50])
s = pd.Series(data)
print(s)

輸出：

0    10
1    20
2    30
3    40
4    50
dtype: int32

? 使用字典創(chuàng)建Series

import pandas as pd

data = {'a': 10, 'b': 20, 'c': 30, 'd': 40, 'e': 50}
s = pd.Series(data)
print(s)

輸出：

a    10
b    20
c    30
d    40
e    50
dtype: int64

（二）Series的簡單操作

Series對象提供了許多方便的方法和屬性來操作數(shù)據(jù)。以下是一些常用的操作：

???訪問數(shù)據(jù)

通過索引訪問數(shù)據(jù)

import pandas as pd

data = [10, 20, 30, 40, 50]
s1 = pd.Series(data)
print(s1)
# 通過索引訪問數(shù)據(jù)
print(s1[0])  # 輸出 10
print(s1[2])  # 輸出 30

運行結果：

通過標簽訪問數(shù)據(jù)

import pandas as pd
data = [10, 20, 30, 40, 50]
s2 = pd.Series(data,index = ['a','b','c','d','e'])
print(s2)

# 通過索引訪問數(shù)據(jù)
print(s2['a'])  # 輸出 10
print(s2['c'])  # 輸出 30

運行結果：

??? 切片操作

import pandas as pd

data = [10, 20, 30, 40, 50]
s = pd.Series(data)

# 切片操作
print(s[1:4])  # 輸出 [20, 30, 40]

運行結果

import pandas as pd

data = [10, 20, 30, 40, 50]
s = pd.Series(data,index = ['a','b','c','d','e'])# 修改

# 切片操作
print(s['b':'d'])  # 輸出 [20, 30, 40]

運行結果

??? 矢量化操作

import pandas as pd

data = [10, 20, 30, 40, 50]
s = pd.Series(data)

# 矢量化操作
print(s * 2)

輸出：

0     20
1     40
2     60
3     80
4    100
dtype: int64

??DataFrame

??? 創(chuàng)建方式

DataFrame是Pandas中的二維數(shù)據(jù)結構，可以看作是由多個Series組成的表格。創(chuàng)建DataFrame的方法有很多種，下面介紹幾種常見的方式：

? 使用列表創(chuàng)建DataFrame

import pandas as pd

data = [['Alice', 25], ['Bob', 30], ['Charlie', 35]]
df = pd.DataFrame(data, columns=['Name', 'Age'])
print(df)

輸出：

      Name  Age
0    Alice   25
1      Bob   30
2  Charlie   35

?使用字典創(chuàng)建DataFrame

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = pd.DataFrame(data)
print(df)

輸出：

      Name  Age
0    Alice   25
1      Bob   30
2  Charlie   35

?使用NumPy數(shù)組創(chuàng)建DataFrame

import pandas as pd
import numpy as np

data = np.array([['Alice', 25], ['Bob', 30], ['Charlie', 35]])
df = pd.DataFrame(data, columns=['Name', 'Age'])
print(df)

輸出：

      Name Age
0    Alice  25
1      Bob  30
2  Charlie  35

?? 數(shù)據(jù)選取

數(shù)據(jù)選取是對DataFrame中的數(shù)據(jù)進行訪問和操作的關鍵步驟。下面介紹一些常用的數(shù)據(jù)選取方法。

??? [[]]

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = pd.DataFrame(data)

# 選取多列數(shù)據(jù)
print(df[['Name', 'Age']])

輸出：

      Name  Age
0    Alice   25
1      Bob   30
2  Charlie   35

??? copy()

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = pd.DataFrame(data)

# 復制DataFrame
df_copy = df.copy()

??? 列操作

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = pd.DataFrame(data)

# 添加新列
df['Gender'] = ['Female', 'Male', 'Male']

# 刪除列
df = df.drop('Gender', axis=1)

??? 行操作

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = pd.DataFrame(data)

# 選取行數(shù)據(jù)
print(df.loc[0])  # 輸出第一行數(shù)據(jù)
print(df.loc[1:2])  # 輸出第二行到第三行的數(shù)據(jù)

??? 行-列

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = pd.DataFrame(data)

# 選取指定行列的數(shù)據(jù)
print(df.loc[0, 'Name'])  # 輸出第一行的Name列數(shù)據(jù)
print(df.loc[1:2, 'Name'])  # 輸出第二行到第三行的Name列數(shù)據(jù)

??? 數(shù)據(jù)篩選

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = pd.DataFrame(data)

# 根據(jù)條件篩選數(shù)據(jù)
filtered_df = df[df['Age'] > 30]
print(filtered_df)

?? 加載數(shù)據(jù)

在實際的數(shù)據(jù)處理中，我們常常需要從外部文件中加載數(shù)據(jù)到DataFrame中進行分析和處理。Pandas提供了多種方法來加載不同格式的數(shù)據(jù)，下面介紹常用的幾種方式。

?? Txt

import pandas as pd

# 從txt文件加載數(shù)據(jù)
df = pd.read_csv('data.txt', sep='\t')
print(df)

?? Csv

import pandas as pd

# 從csv文件加載數(shù)據(jù)
df = pd.read_csv('data.csv')
print(df)

?? Excel

import pandas as pd

# 從Excel文件加載數(shù)據(jù)
df = pd.read_excel('data.xlsx')
print(df)

????? 排序與合并

數(shù)據(jù)排序和合并是數(shù)據(jù)處理中常用的操作之一。下面介紹幾種常見的排序和合并方法。

? Series排序

import pandas as pd

data = [10, 5, 8, 3, 12]
s = pd.Series(data)

# Series排序
sorted_s = s.sort_values()
print(sorted_s)

? DataFrame排序

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = pd.DataFrame(data)

# DataFrame按某一列排序
sorted_df = df.sort_values('Age')
print(sorted_df)

? Rank

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 30]}
df = pd.DataFrame(data)

# 計算DataFrame的排名
ranked_df = df.rank()
print(ranked_df)

? merge（按列匹配合并）

import pandas as pd

data1 = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
data2 = {'Name': ['Alice', 'David', 'Charlie'], 'Salary': [5000, 6000, 7000]}
df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)

# 按列匹配合并兩個DataFrame
merged_df = pd.merge(df1, df2, on='Name')
print(merged_df)

? concat（數(shù)據(jù)的拼接）

import pandas as pd

data1 = {'Name': ['Alice', 'Bob'], 'Age': [25, 30]}
data2 = {'Name': ['Charlie', 'David'], 'Age': [35, 40]}
df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)

# 拼接兩個DataFrame
concatenated_df = pd.concat([df1, df2])
print(concatenated_df)

?? 數(shù)據(jù)匯總

在數(shù)據(jù)處理過程中，我們經(jīng)常需要對數(shù)據(jù)進行匯總和統(tǒng)計。下面介紹幾種常用的數(shù)據(jù)匯總方法。

?? 特殊值（info, describe）

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = pd.DataFrame(data)

# 查看DataFrame的基本信息
print(df.info())

# 查看DataFrame的統(tǒng)計信息
print(df.describe())

?? 分組統(tǒng)計

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie', 'Alice', 'Bob', 'Charlie'],
        'Age': [25, 30, 35, 40, 45, 50],
        'Salary': [5000, 6000, 7000, 8000, 9000, 10000]}
df = pd.DataFrame(data)

# 按Name列進行分組統(tǒng)計
grouped_df = df.groupby('Name').mean()
print(grouped_df)

? 時間序列

Pandas提供了強大的時間序列處理功能，方便對時間相關的數(shù)據(jù)進行分析和處理。下面介紹一些時間序列的常用操作。

??? 初始化時間序列

import pandas as pd

# 初始化時間序列
dates = pd.date_range(start='2021-01-01', periods=10, freq='D')
print(dates)

??? 時間索引

import pandas as pd

# 創(chuàng)建帶有時間索引的DataFrame
dates = pd.date_range(start='2021-01-01', periods=10, freq='D')
data = {'Value': [10, 20, 30, 40, 50, 60, 70, 80, 90, 100]}
df = pd.DataFrame(data, index=dates)
print(df)

??? 重采樣

import pandas as pd

# 創(chuàng)建帶有時間索引的DataFrame
dates = pd.date_range(start='2021-01-01', periods=10, freq='D')
data = {'Value': [10, 20, 30, 40, 50, 60, 70, 80, 90, 100]}
df = pd.DataFrame(data, index=dates)

# 對時間序列進行重采樣
resampled_df = df.resample('W').sum()
print(resampled_df)

?? 參考資料

Pandas官方文檔
Pandas User Guide

??希望本篇文章對你有所幫助。

??如果你有任何問題或疑惑，請隨時向提問。

??感謝閱讀！文章來源地址http://www.zghlxwxcb.cn/news/detail-520037.html

到了這里，關于【Python數(shù)據(jù)處理】-Pandas筆記的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。如若轉載，請注明出處：如若內(nèi)容造成侵權/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領支付寶紅包贊助服務器費用

【100天精通Python】Day56：Python 數(shù)據(jù)分析_Pandas數(shù)據(jù)清洗和處理
目錄數(shù)據(jù)清洗和處理 1.處理缺失值 1.1 刪除缺失值： 1.2? 填充缺失值： 1.3 插值： 2 數(shù)據(jù)類型轉換 2.1 數(shù)據(jù)類型轉換 2.2 日期和時間的轉換： 2.3 分類數(shù)據(jù)的轉換： 2.4 自定義數(shù)據(jù)類型的轉換： 3 數(shù)據(jù)去重 4 數(shù)據(jù)合并和連接數(shù)據(jù)清洗和處理 ????????在數(shù)據(jù)清洗和處理方面，
2024年02月09日
瀏覽(38)
利用Python進行數(shù)據(jù)清洗與預處理：Pandas的高級用法【第147篇—Pandas的高級用法】
前些天發(fā)現(xiàn)了一個巨牛的人工智能學習網(wǎng)站，通俗易懂，風趣幽默，忍不住分享一下給大家?！军c擊進入巨牛的人工智能學習網(wǎng)站】。在數(shù)據(jù)科學和機器學習領域，數(shù)據(jù)清洗和預處理是至關重要的步驟。Pandas庫作為Python中最受歡迎的數(shù)據(jù)處理工具之一，提供了強大的功能來處
2024年04月09日
瀏覽(35)
Pandas文本數(shù)據(jù)處理大全：類型判斷、空白字符處理、拆分與連接【第67篇—python：文本數(shù)據(jù)】
Pandas是Python中一種強大的數(shù)據(jù)分析庫，廣泛用于數(shù)據(jù)清洗、處理和分析。在實際的數(shù)據(jù)處理中，文本數(shù)據(jù)常常是不可避免的一部分。本篇博客將介紹Pandas中處理文本數(shù)據(jù)的一些常用技巧，包括類型判斷、去除空白字符、拆分和連接。在處理文本數(shù)據(jù)時，首先要了解數(shù)據(jù)的類型
2024年02月19日
瀏覽(21)
Python數(shù)據(jù)分析與應用 |第4章使用pandas進行數(shù)據(jù)預處理（實訓）
編號性別高血壓是否結婚工作類型居住類型體重指數(shù) 吸煙史中風 9046 男否是私人城市 36.6 以前吸煙是 51676 女否是私營企業(yè) 農(nóng)村 N/A 從不吸煙是 31112 男否是私人農(nóng)村 32.5 從不吸煙是 60182 女否是私人城市 34.4 抽煙是 1665 女是是私營企業(yè) 農(nóng)村 24 從不吸煙是
2024年04月23日
瀏覽(24)
Python用pandas進行大數(shù)據(jù)Excel兩文件比對去重300w大數(shù)據(jù)處理
Python用pandas進行大數(shù)據(jù)Excel兩文件比對去重通俗理解有兩個excel文件分別為A和B 我要從B中去掉A中含有的數(shù)據(jù)，數(shù)據(jù)量大約在300w左右因為數(shù)據(jù)量較大，無論是wps還是office自帶的去重都無法正常使用這樣就需要用到腳本了 ?歡迎大家指導交流，共同學習，共同進步！
2024年02月15日
瀏覽(89)
python一點通：數(shù)據(jù)處理頂流Pandas 2.0有什么新功能？
Pandas 2.0及其后續(xù)版本的發(fā)布引入了各種功能和增強，標志著在使用Pandas進行數(shù)據(jù)操作和分析方面的顯著演進。這里是對一些新功能的深入解析：可選依賴的安裝: 在Pandas 2.0中，通過pip安裝pandas時，可以通過指定extras來安裝一組可選的依賴項，例如：pip install “pandas[performan
2024年02月08日
瀏覽(17)
100天精通Python（數(shù)據(jù)分析篇）——第75天：Pandas數(shù)據(jù)預處理之數(shù)據(jù)標準化
2024年01月19日
瀏覽(33)
100天精通Python（數(shù)據(jù)分析篇）——第73天：Pandas文本數(shù)據(jù)處理方法之查找、替換、拼接、正則、虛擬變量
2024年01月17日
瀏覽(26)
第五篇【傳奇開心果系列】Python的自動化辦公庫技術點案例示例：深度解讀Pandas在教育數(shù)據(jù)和研究數(shù)據(jù)處理領域的應用
Pandas是一款功能強大且廣泛應用于處理和分析教育數(shù)據(jù)、研究數(shù)據(jù)的Python庫。教育機構和學術研究者可以借助Pandas進行數(shù)據(jù)清洗、分析和可視化，從而支持教學評估、研究成果分析等工作。這個工具提供了豐富的功能，包括數(shù)據(jù)操作、統(tǒng)計分析、時間序列處理等，同時支持多
2024年03月12日
瀏覽(90)
數(shù)據(jù)分析 — Pandas 數(shù)據(jù)處理
Pandas （Python Data Analysis Library）是一個基于 NumPy 的數(shù)據(jù)分析工具，專為解決數(shù)據(jù)分析任務而創(chuàng)建。它匯集了大量庫和一些標準的數(shù)據(jù)模型，可以更高效地操作大型數(shù)據(jù)集。數(shù)據(jù)結構： Pandas 提供了兩種主要的數(shù)據(jù)結構，即 Series 和 DataFrame ，用于處理一維和二維數(shù)據(jù)。標簽
2024年02月22日
瀏覽(25)

<small id="vdjhz"></small>