国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

數(shù)據(jù)分析 | Pandas 200道練習(xí)題,每日10道題,學(xué)完必成大神(4)

這篇具有很好參考價(jià)值的文章主要介紹了數(shù)據(jù)分析 | Pandas 200道練習(xí)題,每日10道題,學(xué)完必成大神(4)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

前期準(zhǔn)備

本章的十道題與前面的試題相連接,數(shù)據(jù)集用的同一個(gè)數(shù)據(jù)集一些操作也是基于上一個(gè)練習(xí)的

本次導(dǎo)包多導(dǎo)入了一個(gè)繪圖的包,在這里我們只是簡(jiǎn)單的應(yīng)用,后面會(huì)有詳細(xì)的講解用法

import pandas as pd
import numpy as np
from matplotlib import pyplot as plt 

數(shù)據(jù)集沒有的可以私信我,也可以直接去我的資源里面找

df = pd.read_excel('data1.xlsx')
def fun(x):
    a,b = x.split('-')
    a = int(a.strip('k'))*1000
    b = int(b.strip('k'))*1000
    return int((a+b)/2)
df['salary'] = df['salary'].apply(fun)
bins = [0,5000,20000,50000]
group_names = ['底','中','高']
df['categories'] = pd.cut(df['salary'],bins,labels=group_names)
df

數(shù)據(jù)分析 | Pandas 200道練習(xí)題,每日10道題,學(xué)完必成大神(4)

1. 計(jì)算salary列的中位數(shù)

中位數(shù)(Median)又稱中值,統(tǒng)計(jì)學(xué)中的專有名詞,是按順序排列的一組數(shù)據(jù)中居于中間位置的數(shù),代表一個(gè)樣本、種群或概率分布中的一個(gè)數(shù)值,其可將數(shù)值集合劃分為相等的上下兩部分。對(duì)于有限的數(shù)集,可以通過把所有觀察值高低排序后找出正中間的一個(gè)作為中位數(shù)。如果觀察值有偶數(shù)個(gè),通常取最中間的兩個(gè)數(shù)值的平均數(shù)作為中位數(shù)。

# 方式1
np.median(df['salary'])
# 方式2
df['salary'].median()

數(shù)據(jù)分析 | Pandas 200道練習(xí)題,每日10道題,學(xué)完必成大神(4)

2. 繪制薪資水平頻率直方圖

這個(gè)默認(rèn)是分為10組,分別統(tǒng)計(jì)每組出現(xiàn)的次數(shù)

df.salary.plot(kind='hist')
# 改變分組數(shù)
df.salary.plot(kind='hist',bins=20)

數(shù)據(jù)分析 | Pandas 200道練習(xí)題,每日10道題,學(xué)完必成大神(4)

3. 繪制薪資水平密度曲線

類似于頻率直方圖,只不過分組更小了,繪圖方式采用的是曲線

df.salary.plot(kind='kde',xlim=(0,70000))

數(shù)據(jù)分析 | Pandas 200道練習(xí)題,每日10道題,學(xué)完必成大神(4)

4. 刪除最后一列categories

刪除指定列

# 方式一 會(huì)直接刪除原數(shù)據(jù)
del df['categories']  

# 方式二 默認(rèn)不會(huì)刪除原數(shù)據(jù), 只有當(dāng)inplace=True 才刪除原數(shù)據(jù)
df.drop(columns=['categories'],inplace=True)  # 方式二

5. 將df的第一列與第二列合并為新的一列

因?yàn)檫@里的createTime列是時(shí)間序列,所以不能直接的合并,需要我們先將數(shù)據(jù)類型改變?yōu)?code>str

# 將df的第一列與第二列合并為新的一列
# 需要將時(shí)間類型的數(shù)據(jù)裝換成字符類型,使用的是`astype`類型
df['test'] = df['createTime'].astype('str')+ df['education']
df.head()

數(shù)據(jù)分析 | Pandas 200道練習(xí)題,每日10道題,學(xué)完必成大神(4)

6. 將education列與salary列合并為新的一列

這個(gè)同第五題類似,都是合并兩個(gè)列,都需要改數(shù)據(jù)類型
數(shù)據(jù)分析 | Pandas 200道練習(xí)題,每日10道題,學(xué)完必成大神(4)

7. 計(jì)算salary列最大值與最小值之差

找出最大值和最小值做差

# 方式1
df['salary'].max()-df['salary'].min()
# 方式2 使用numpy中的方法
np.ptp(df['salary'])

數(shù)據(jù)分析 | Pandas 200道練習(xí)題,每日10道題,學(xué)完必成大神(4)

8. 將第一行和最后一行拼接到一個(gè)DataFrame中

主要就是取對(duì)應(yīng)行的操作和將不同的行合并起來

pd.concat([df[:1],df[-1:]])

數(shù)據(jù)分析 | Pandas 200道練習(xí)題,每日10道題,學(xué)完必成大神(4)
另一種方式
取出數(shù)據(jù)然后將數(shù)據(jù)生成一個(gè)新的DataFrame

pd.DataFrame([df.iloc[0],df.iloc[-1]])

9. 將第8行數(shù)據(jù)添加到末尾

主要包括兩個(gè)步驟,取出數(shù)據(jù),添加數(shù)據(jù)

#  取出數(shù)據(jù)有兩種信息
df[7:8]  # 使用切片操作
df.iloc[7]  # 使用.iloc取值

# 將第8行數(shù)據(jù)添加到末尾
df.append(df.iloc[7])

10. 查看每列的數(shù)據(jù)類型

dtypes 是屬性,不用加括號(hào)

df.dtypes

# 也可以使用,但是展示的信息就比較多了
df.info()

本章我們學(xué)習(xí)了和合并列,添加新的行,刪除指定列以及使用matplot
lib繪制一些簡(jiǎn)單的圖形等功能,這些功能都是以后常用的,我在講解的時(shí)候也拓展了不同的解題方式,希望大家發(fā)展思路,多多嘗試。

期待大家的三連
數(shù)據(jù)分析 | Pandas 200道練習(xí)題,每日10道題,學(xué)完必成大神(4)文章來源地址http://www.zghlxwxcb.cn/news/detail-447588.html

到了這里,關(guān)于數(shù)據(jù)分析 | Pandas 200道練習(xí)題,每日10道題,學(xué)完必成大神(4)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 數(shù)據(jù)分析 | Pandas 200道練習(xí)題,每日10道題,學(xué)完必成大神(5)

    數(shù)據(jù)分析 | Pandas 200道練習(xí)題,每日10道題,學(xué)完必成大神(5)

    本章的10道題仍然是基于前章的文件,主要學(xué)習(xí)了有設(shè)置索引、合并兩個(gè)DataFrame對(duì)象、更改數(shù)據(jù)類型,不同列之間的運(yùn)算,統(tǒng)計(jì)一列不同值得個(gè)數(shù)以及不同值分別出現(xiàn)得次數(shù),還有如何靈活的運(yùn)用布爾值運(yùn)算。 數(shù)據(jù)集沒有的可以私信我,也可以直接去我的資源里面找 set_inde

    2023年04月09日
    瀏覽(22)
  • 數(shù)據(jù)分析 | Pandas 200道練習(xí)題,每日10道題,學(xué)完必成大神(8)

    數(shù)據(jù)分析 | Pandas 200道練習(xí)題,每日10道題,學(xué)完必成大神(8)

    本篇文章主要是一些窗口函數(shù)的使用,以及一些股票分析中常用的一些方法,日均線的了解與繪制,重采樣,布林線指標(biāo)。本篇文章涉及到的統(tǒng)計(jì)學(xué)知識(shí)較多,比較難以理解,對(duì)于統(tǒng)計(jì)學(xué)的知識(shí)作為一名數(shù)據(jù)分析師是必須要掌握的 接下來的操作是基于上次的數(shù)據(jù)進(jìn)行操作,主

    2024年02月13日
    瀏覽(20)
  • 國際旅游網(wǎng)絡(luò)的大數(shù)據(jù)分析(數(shù)學(xué)建模練習(xí)題)

    國際旅游網(wǎng)絡(luò)的大數(shù)據(jù)分析(數(shù)學(xué)建模練習(xí)題)

    伴隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)分析已經(jīng)深入到現(xiàn)代社會(huì)生活中的各個(gè)方面。 無論是國家政府部門、企事業(yè)單位還是個(gè)人,數(shù)據(jù)分析工作都是進(jìn)行決策之前的 重要環(huán)節(jié)。 山東省應(yīng)用統(tǒng)計(jì)學(xué)會(huì)是在省民政廳注冊(cè)的學(xué)術(shù)類社會(huì)組織,于 1989 年成立。 學(xué)會(huì)是全省目前從事統(tǒng)計(jì)調(diào)查

    2024年02月11日
    瀏覽(25)
  • Pandas十大練習(xí)題,掌握常用方法

    Pandas十大練習(xí)題,掌握常用方法

    代碼均在Jupter Notebook上完成 數(shù)據(jù)集可從此獲?。?鏈接: https://pan.baidu.com/s/1YGwh3pqxW4OlrQXt-5wgFg?pwd=3znx 提取碼: 3znx 簡(jiǎn)介 數(shù)據(jù)集 1.分析Chipotle快餐數(shù)據(jù) chipotle.tsv 2.分析2012歐洲杯數(shù)據(jù) Euro2012_stats.csv 3.分析酒類消費(fèi)數(shù)據(jù) drinks.csv 4.分析1960 - 2014 美國犯罪數(shù)據(jù) US_Crime_Rates_1960_2014.csv 5.分

    2024年01月16日
    瀏覽(21)
  • 【Python練習(xí)】數(shù)據(jù)分析庫Pandas

    1. 了解Serie

    2024年02月09日
    瀏覽(39)
  • 日志審計(jì)與分析練習(xí)題

    1.? ( 單選題) 【單選題】以下關(guān)于日志的描述不正確的是( ) A. 日志是在事故發(fā)生后查明“發(fā)生了什么”的一個(gè)很好的“取證”信息來源,但無法為審計(jì)進(jìn)行跟蹤 B. 日志是由各種不同的實(shí)體產(chǎn)生的“安全記錄”的集合 C. 通常為計(jì)算機(jī)系統(tǒng)、設(shè)備、軟件等在某種情況下記錄的信息

    2024年02月08日
    瀏覽(33)
  • 【算法設(shè)計(jì)與分析】動(dòng)態(tài)規(guī)劃-練習(xí)題

    【算法設(shè)計(jì)與分析】動(dòng)態(tài)規(guī)劃-練習(xí)題

    輸入一個(gè)整數(shù)數(shù)組 S[n] ,計(jì)算其最長(zhǎng)遞增子序列的長(zhǎng)度,及其最長(zhǎng)遞增子序列。 定義 k ( 1 ≤ k ≤ n ) k (1 ≤ k ≤ n) k ( 1 ≤ k ≤ n ) ,L[k]表示以 S[k] 結(jié)尾的遞增子序列的最大長(zhǎng)度。子問題即為 L[k]。 對(duì)于每一個(gè)k,我們都遍歷前面0~k-1的所有的數(shù),找出最大的L[i],且 S [ k ] L [

    2024年02月03日
    瀏覽(28)
  • C語言:指針【進(jìn)階】習(xí)題練習(xí)及分析講解

    C語言:指針【進(jìn)階】習(xí)題練習(xí)及分析講解

    前言: 前面我們剛剛學(xué)完了C語言:指針詳解【進(jìn)階】的知識(shí),這部分的知識(shí)還是要重在理解加實(shí)踐,今天我這里就分享一些有關(guān)C語言指針方面的練習(xí)供大家更深入的理解指針的知識(shí)。 我們初期的指針學(xué)習(xí)大部分都是與數(shù)組的知識(shí)綁定在一起的,所以今天的練習(xí)也是大多與數(shù)

    2024年02月02日
    瀏覽(24)
  • MySQL:數(shù)據(jù)庫練習(xí)題-1

    表一:employees 表二:salary 表三:departments 練習(xí)題及答案: ---1、查詢empioyees表的員工部門號(hào)和性別,要求消除重復(fù)行 ---2、計(jì)算每個(gè)雇員的實(shí)際收入(實(shí)際收入=收入-支出) ---3、查詢employees表中的姓名和性別,要求性別值為1時(shí)顯示為“男”,為0時(shí)顯示為“女” ---4、查詢每

    2024年02月04日
    瀏覽(21)
  • 【數(shù)據(jù)結(jié)構(gòu)】“單鏈表”的練習(xí)題

    【數(shù)據(jù)結(jié)構(gòu)】“單鏈表”的練習(xí)題

    ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ???? ?? ?? ?? 個(gè)人主頁 :阿然成長(zhǎng)日記 ??點(diǎn)擊可跳轉(zhuǎn) ?? 個(gè)人專欄: ??數(shù)據(jù)結(jié)構(gòu)與算法??C語言進(jìn)階 ?? 不能則學(xué),不知?jiǎng)t問,恥于問人,決無長(zhǎng)進(jìn) ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? 題目要求: 給你單鏈

    2024年02月14日
    瀏覽(22)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包