国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【Pandas】pandas用法解析(一)

這篇具有很好參考價值的文章主要介紹了【Pandas】pandas用法解析(一)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

目錄

一、生成數(shù)據(jù)表

1.導(dǎo)入pandas庫

2.導(dǎo)入CSV或者xlsx文件

3.用pandas創(chuàng)建數(shù)據(jù)表

二、數(shù)據(jù)表信息查看

1.維度查看

2.數(shù)據(jù)表基本信息(維度、列名稱、數(shù)據(jù)格式、所占空間等)

3.每一列數(shù)據(jù)的格式

4.某一列格式

5.空值判斷

6.查看某一列空值

7.查看某一列的唯一值

8.查看數(shù)據(jù)表的值

9.查看列名稱

10.查看前5行數(shù)據(jù)、后5行數(shù)據(jù)

三、數(shù)據(jù)表清洗

1.用數(shù)字0填充空值

2.使用列prince的均值對NA進(jìn)行填充

3.清除city字段的字符空格

4.大小寫轉(zhuǎn)換

5.更改數(shù)據(jù)格式

6.更改列名稱

7.刪除后出現(xiàn)的重復(fù)值

8.刪除先出現(xiàn)的重復(fù)值

9、數(shù)據(jù)替換

四、數(shù)據(jù)預(yù)處理

1.數(shù)據(jù)表合并

2.設(shè)置索引列

3.按照特定列的值排序

4.按照索引列排序

5.如果prince列的值>3000,group列顯示high,否則顯示low.

?6.對復(fù)合多個條件的數(shù)據(jù)進(jìn)行分組標(biāo)記

7.對category字段的值依次進(jìn)行分列,并創(chuàng)建數(shù)據(jù)表,索引值為df_inner的索引列,列名稱為category和size?

?8.將完成分裂后的數(shù)據(jù)表和原df_inner數(shù)據(jù)表進(jìn)行匹配


五、數(shù)據(jù)提取

六、數(shù)據(jù)篩選

七、數(shù)據(jù)匯總

八、數(shù)據(jù)統(tǒng)計

九、數(shù)據(jù)輸出


一、生成數(shù)據(jù)表

1.導(dǎo)入pandas庫

import pandas as pd

2.導(dǎo)入CSV或者xlsx文件

df = pd.DataFrame(pd.read_csv('filename.csv'))
df = pd.DataFrame(pd.read_excel('filename.xlsx'))

3.用pandas創(chuàng)建數(shù)據(jù)表

import numpy as np

df = pd.DataFrame({"id":[1001,1002,1003,1004,1005,1006], 
                    "date":pd.date_range('20130102', periods=6),
                    "city":['Beijing ', 'SH', ' guangzhou ', 'Shenzhen', 'shanghai', 'BEIJING '],
                    "age":[23,44,54,32,34,32],
                    "category":['100-A','100-B','110-A','110-C','210-A','130-F'],
                    "price":[1200,np.nan,2133,5433,np.nan,4432]},
                     columns =['id','date','city','category','age','price'])

【Pandas】pandas用法解析(一)

二、數(shù)據(jù)表信息查看

1.維度查看

df.shape

df.shape
Out[36]: (6, 6)

2.數(shù)據(jù)表基本信息(維度、列名稱、數(shù)據(jù)格式、所占空間等)

df.info()

【Pandas】pandas用法解析(一)

3.每一列數(shù)據(jù)的格式

df.dtypes

【Pandas】pandas用法解析(一)

4.某一列格式

df['date'].dtype

df['price'].dtype

【Pandas】pandas用法解析(一)

5.空值判斷

df.isnull()?

【Pandas】pandas用法解析(一)

6.查看某一列空值

【Pandas】pandas用法解析(一)

7.查看某一列的唯一值

【Pandas】pandas用法解析(一)

8.查看數(shù)據(jù)表的值

df.values

9.查看列名稱

df.columns

10.查看前5行數(shù)據(jù)、后5行數(shù)據(jù)

df.head() #默認(rèn)前5行數(shù)據(jù)
df.tail() #默認(rèn)后5行數(shù)據(jù)

三、數(shù)據(jù)表清洗

1.用數(shù)字0填充空值

df.fillna(value=0)

【Pandas】pandas用法解析(一)

2.使用列price的均值對NA進(jìn)行填充

df['price'].fillna(df['price'].mean())

【Pandas】pandas用法解析(一)

3.清除city字段的字符空格

df['city']=df['city'].map(str.strip)

【Pandas】pandas用法解析(一)

4.大小寫轉(zhuǎn)換

df['city']=df['city'].str.lower()

【Pandas】pandas用法解析(一)

5.更改數(shù)據(jù)格式

【Pandas】pandas用法解析(一)

df['price'].astype('int')

【Pandas】pandas用法解析(一)

6.更改列名稱

df.rename(columns={'category': 'category-size'})?

【Pandas】pandas用法解析(一)

7.刪除后出現(xiàn)的重復(fù)值

df['city'].drop_duplicates()

8.刪除先出現(xiàn)的重復(fù)值

df['city'].drop_duplicates(keep='last')

9、數(shù)據(jù)替換

df['city'].replace('sh', 'shanghai')

四、數(shù)據(jù)預(yù)處理

df1=pd.DataFrame({"id":[1001,1002,1003,1004,1005,1006,1007,1008],
? ? ? ? ? ? ? ? ? "gender":['male','female','male','female','male','female','male','female'],
? ? ? ? ? ? ? ? ? "pay":['Y','N','Y','Y','N','Y','N','Y',],
? ? ? ? ? ? ? ? ? "m-point":[10,12,20,40,40,40,30,20]})

【Pandas】pandas用法解析(一)

1.數(shù)據(jù)表合并

(1)merge

df_inner=pd.merge(df,df1,how='inner') ?# 匹配合并,交集
df_left=pd.merge(df,df1,how='left')?

【Pandas】pandas用法解析(一)
df_right=pd.merge(df,df1,how='right')
df_outer=pd.merge(df,df1,how='outer') ?#并集

【Pandas】pandas用法解析(一)

(2)append

result = df1.append(df2)

【Pandas】pandas用法解析(一)

df_result = df3.append(df4)

df3 = pd.DataFrame({'A':['A0','A1','A2','A3'],
                    'B':['B0','B1','B2','B3'],
                    'C':['C0','C1','C2','C3']})
df4 = pd.DataFrame({'A':['A4','A5','A6','A7'],
                    'B':['B4','B5','B6','B7'],
                    'C':['C4','C5','C6','C7']})

df_result = df3.append(df4)

【Pandas】pandas用法解析(一)

?(3)join

result = left.join(right, on='key')

【Pandas】pandas用法解析(一)

(4)concat?

df5 = pd.DataFrame({'A':['A4','A5','A6','A7'],
                    'B':['B4','B5','B6','B7'],
                    'C':['C4','C5','C6','C7']})

result = pd.concat([df3,df4,df5])

【Pandas】pandas用法解析(一)

2.設(shè)置索引列

result.set_index('A')

【Pandas】pandas用法解析(一)

3.按照特定列的值排序

df_inner.sort_values(by=['age'])

【Pandas】pandas用法解析(一)

4.按照索引列排序

?df=result.set_index('A')

【Pandas】pandas用法解析(一)

df.sort_index()

【Pandas】pandas用法解析(一)

5.如果prince列的值>3000,group列顯示high,否則顯示low.

df_inner['group'] = np.where(df_inner['price'] > 3000,'high','low')

6.對復(fù)合多個條件的數(shù)據(jù)進(jìn)行分組標(biāo)記

?df.loc[(df['city'] == 'beijing') & (df['price'] >= 4000), 'sign']=1

7.對category字段的值依次進(jìn)行分列,并創(chuàng)建數(shù)據(jù)表,索引值為df_inner的索引列,列名稱為category和size?

【Pandas】pandas用法解析(一)

pd.DataFrame((x.split('-') for x in df_inner['category']),index=df_inner.index,columns=['category','size'])

8.將完成分裂后的數(shù)據(jù)表和原df_inner數(shù)據(jù)表進(jìn)行匹配

?df_inner=pd.merge(df_inner,df_split,right_index=True, left_index=True)

【Pandas】pandas用法解析(一)

【Pandas】pandas用法解析(一)

五、數(shù)據(jù)提取

六、數(shù)據(jù)篩選

七、數(shù)據(jù)匯總

八、數(shù)據(jù)統(tǒng)計

九、數(shù)據(jù)輸出

————————————————
參考鏈接:https://blog.csdn.net/yiyele/article/details/80605909文章來源地址http://www.zghlxwxcb.cn/news/detail-488592.html

到了這里,關(guān)于【Pandas】pandas用法解析(一)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進(jìn)行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • EFcore CodeFirst生成數(shù)據(jù)表

    EFcore CodeFirst生成數(shù)據(jù)表

    項目中創(chuàng)建類,然后通過模型實體類,生成數(shù)據(jù)庫中的表。下圖為工程結(jié)構(gòu),同時本機上已經(jīng)安裝了Mysql數(shù)據(jù)庫,創(chuàng)建了hxdata數(shù)據(jù)庫。也可以通過數(shù)據(jù)庫表遷移生成實體類。 ?1.創(chuàng)建數(shù)據(jù)模型類 2.從NuGet安裝包 Microsoft.EntityFrameworkCore.Tools Pomelo.EntityFrameworkCore.MySql 3.創(chuàng)建數(shù)據(jù)庫上下

    2024年02月05日
    瀏覽(24)
  • 用Python做數(shù)據(jù)分析之生成數(shù)據(jù)表

    第一部分是生成數(shù)據(jù)表,常見的生成方法有兩種,第一種是導(dǎo)入外部數(shù)據(jù),第二種是直接寫入數(shù)據(jù)。 Excel 中的文件菜單中提供了**外部數(shù)據(jù)的功能,支持?jǐn)?shù)據(jù)庫和文本文件和頁面的多種數(shù)據(jù)源導(dǎo)入。 獲取外部數(shù)據(jù) python支持從多種類型的數(shù)據(jù)導(dǎo)入。在開始使用 python 進(jìn)行數(shù)據(jù)導(dǎo)

    2024年01月17日
    瀏覽(31)
  • 通過一個實際例子說明Django中的數(shù)據(jù)庫操作方法OneToOneField()的用法【數(shù)據(jù)表“一對一”關(guān)系】

    當(dāng)我們在Django中定義一個模型時,可以使用 OneToOneField 來建立一個一對一的關(guān)系。這種關(guān)系表示兩個模型之間的一種特殊關(guān)聯(lián),其中一個模型的實例只能與另一個模型的實例關(guān)聯(lián)。 讓我們以一個簡單的示例來說明 OneToOneField 的用法。假設(shè)我們正在構(gòu)建一個簡單的博客應(yīng)用,其

    2024年02月13日
    瀏覽(22)
  • 通過一個實際例子說明Django中的數(shù)據(jù)庫操作方法法ForeignKey()的用法【數(shù)據(jù)表“一對多”關(guān)系】

    通過一個實際例子說明Django中的數(shù)據(jù)庫操作方法法ForeignKey()的用法【數(shù)據(jù)表“一對多”關(guān)系】

    當(dāng)使用Django進(jìn)行數(shù)據(jù)庫操作時,F(xiàn)oreignKey(外鍵)是一種非常有用的字段類型。它允許在數(shù)據(jù)庫表之間創(chuàng)建關(guān)聯(lián)關(guān)系,類似于其他數(shù)據(jù)庫系統(tǒng)中的外鍵概念。通過ForeignKey字段,我們可以建立一個模型與另一個模型的一對多關(guān)系。 以下是一個實際例子,使用ForeignKey字段在Djang

    2024年02月12日
    瀏覽(20)
  • 使用mybatisX逆向生成數(shù)據(jù)表實體類(pojo,dao),mapper,service

    使用mybatisX逆向生成數(shù)據(jù)表實體類(pojo,dao),mapper,service

    先看使用mybatisX后生成的文件。 1.先在idea安裝mybatisX插件,在file-setting-plugins,搜索mybatisX插件,重新啟動idea即可。 2.在idea編輯器右側(cè)點擊Database,點擊“+”鏈接你的數(shù)據(jù)庫類型,這里我選mysql。 ? ? 輸入root,密碼:xxxx 輸入url:jdbc:mysql://localhost:3306/emos?useUnicode=truecharacterEnc

    2024年02月03日
    瀏覽(19)
  • EasyCode代碼生成插件-模板分享(基于數(shù)據(jù)表生成MyBatisPlus格式的dao,service,controller和vue組件)

    EasyCode代碼生成插件-模板分享(基于數(shù)據(jù)表生成MyBatisPlus格式的dao,service,controller和vue組件)

    目錄 概述 使用演示 模板代碼? ? 實體類pojo? ?表現(xiàn)層controller 業(yè)務(wù)層service接口 ?業(yè)務(wù)層serviceImpl實現(xiàn)類 持久層dao Vue組件? ? 本片博客用于分享EasyCode的自定義模板(模板在篇末),用于簡化開發(fā),免去重復(fù)性的工作。 作用: 1.根據(jù)數(shù)據(jù)庫表,后端生成基于MyBatisPlus結(jié)構(gòu)下的

    2024年02月10日
    瀏覽(29)
  • 利用Python進(jìn)行數(shù)據(jù)清洗與預(yù)處理:Pandas的高級用法【第147篇—Pandas的高級用法】

    利用Python進(jìn)行數(shù)據(jù)清洗與預(yù)處理:Pandas的高級用法【第147篇—Pandas的高級用法】

    前些天發(fā)現(xiàn)了一個巨牛的人工智能學(xué)習(xí)網(wǎng)站,通俗易懂,風(fēng)趣幽默,忍不住分享一下給大家?!军c擊進(jìn)入巨牛的人工智能學(xué)習(xí)網(wǎng)站】。 在數(shù)據(jù)科學(xué)和機器學(xué)習(xí)領(lǐng)域,數(shù)據(jù)清洗和預(yù)處理是至關(guān)重要的步驟。Pandas庫作為Python中最受歡迎的數(shù)據(jù)處理工具之一,提供了強大的功能來處

    2024年04月09日
    瀏覽(37)
  • Python 教學(xué) | Pandas 數(shù)據(jù)合并(含目錄文件合并案例)

    Python 教學(xué) | Pandas 數(shù)據(jù)合并(含目錄文件合并案例)

    目錄 Part? 1前言 Part2? Pandas 數(shù)據(jù)合并函數(shù) 1? df.append() 實現(xiàn)數(shù)據(jù)追加 (1)向表中追加相同結(jié)構(gòu)的表 (2)向表中追加不同結(jié)構(gòu)的表 (3)向數(shù)據(jù)中添加一行 2? pd.concat() 實現(xiàn)數(shù)據(jù)連接 (1)多個相同結(jié)構(gòu)數(shù)據(jù)縱向合并 (2)多個結(jié)構(gòu)不同的數(shù)據(jù)縱向合并 (3)多個數(shù)據(jù)橫向合并

    2024年01月17日
    瀏覽(27)
  • Python-pandas:數(shù)據(jù)合并merge函數(shù)用法詳解

    Python-pandas:數(shù)據(jù)合并merge函數(shù)用法詳解

    介紹一下數(shù)據(jù)分析中很常用的一個函數(shù)——merge,它能夠進(jìn)行高效的數(shù)據(jù)合并操作。先看一下語法格式及其初步解釋: 生成的兩個DataFrame對象如下: 1、參數(shù)left,right: 將df_d作為左側(cè)的frame,df_e作為右側(cè)的frame,則參數(shù)left=df_d,right=df_e; 2、參數(shù)how: 當(dāng)參數(shù)how=\\\'left\\\':僅使用左

    2024年02月15日
    瀏覽(24)
  • NumPy和Pandas庫的基本用法,用于數(shù)據(jù)處理和分析

    當(dāng)涉及到數(shù)據(jù)處理和分析時,NumPy和Pandas是兩個非常常用的Python庫。下面是它們的基本用法: NumPy(Numerical Python): 導(dǎo)入NumPy庫:在代碼中使用import numpy as np導(dǎo)入NumPy庫。 創(chuàng)建NumPy數(shù)組:使用np.array()函數(shù)可以創(chuàng)建一個NumPy數(shù)組。例如,arr = np.array([1, 2, 3, 4, 5])創(chuàng)建一個包含整數(shù)

    2024年02月11日
    瀏覽(39)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包