国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

常用字符串處理方法匯總--Pandas

這篇具有很好參考價(jià)值的文章主要介紹了常用字符串處理方法匯總--Pandas。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

字符串處理只能在Series上進(jìn)行,不可以在DataFrame上操作,只能對(duì)字符串進(jìn)行處理,不能對(duì)整數(shù)、日期進(jìn)行處理

1. 元素統(tǒng)計(jì)

1.1 str.count()

1.1.1 函數(shù)功能

統(tǒng)計(jì)Series中每個(gè)元素中包含pat的次數(shù)

1.1.2 函數(shù)語(yǔ)法

Series.str.count(pat, flags=0)

1.1.3 函數(shù)參數(shù)

參數(shù) 含義
pat 表達(dá)式
order = pd.read_excel('C:\\Users\\changyanhua\\Desktop\\order.xlsx')
print(order)
print(order['訂單編號(hào)'].str.count(pat='0'))

常用字符串處理方法匯總--Pandas,Pandas,pandas,python

1.2 str.len()

1.2.1 函數(shù)功能

統(tǒng)計(jì)Series中每個(gè)元素的長(zhǎng)度

1.2.2 函數(shù)語(yǔ)法

Series.str.len()
print(order['支付方式'].str.len())

常用字符串處理方法匯總--Pandas,Pandas,pandas,python

2. 字符串內(nèi)容判斷

2.1 str.contains()

2.1.1 函數(shù)功能

檢測(cè)Series或Index的每個(gè)元素中是否包含指定內(nèi)容,返回結(jié)果為布爾值構(gòu)成的Series或Index

2.1.2 函數(shù)語(yǔ)法

Series.str.contains(pat, case=True, flags=0, na=None, regex=True)

2.1.3 函數(shù)參數(shù)

參數(shù) 含義
pat 要查找的內(nèi)容
case 布爾值,是否區(qū)分大小寫,默認(rèn)True:區(qū)分
flags 整數(shù),默認(rèn)值為0
na 標(biāo)量,可選參數(shù),對(duì)缺失值進(jìn)行填充
regex 布爾值,默認(rèn)值為True:以正則表達(dá)式看待pat中的內(nèi)容,否則以普通字符串看待
order = pd.read_excel('C:\\Users\\changyanhua\\Desktop\\order.xlsx')
print(order)
print(order['所屬行業(yè)'].str.contains('計(jì)算機(jī)'))

常用字符串處理方法匯總--Pandas,Pandas,pandas,python

對(duì)缺失值以“unknown"填充

print(order['所屬行業(yè)'].str.contains('計(jì)算機(jī)',na='unknown'))

常用字符串處理方法匯總--Pandas,Pandas,pandas,python

2.2 str.endswith()

2.2.1 函數(shù)功能

檢測(cè)Series中的每個(gè)元素或索引是否以指定內(nèi)容結(jié)尾,返回值為布爾值組成的Series或者Index

2.2.2 函數(shù)語(yǔ)法

Series.str.endswith(pat, na=None)

2.2.3 函數(shù)參數(shù)

參數(shù) 含義
pat 查找內(nèi)容,可以是字符串或者字符串組成的元組,不接收正則表達(dá)式
na 缺失值返回內(nèi)容,默認(rèn)NaN
print(order['公司規(guī)模'].str.endswith('500人'))

常用字符串處理方法匯總--Pandas,Pandas,pandas,python
包含空字符串時(shí),認(rèn)為空字符串中不包含指定內(nèi)容,設(shè)置na=False

order.loc[4,'公司規(guī)模']=np.nan
print(order)
print(order['公司規(guī)模'].str.endswith('500人',na=False))

常用字符串處理方法匯總--Pandas,Pandas,pandas,python

2.3 startswith()

2.3.1 函數(shù)功能

檢測(cè)Series中的每個(gè)元素或索引是否以指定內(nèi)容開(kāi)始,返回值為布爾值組成的Series或者Index

2.3.2 函數(shù)語(yǔ)法

Series.str.startswith(pat, na=None)

2.3.3 函數(shù)參數(shù)

參數(shù) 含義
pat 查找內(nèi)容,可以是字符串或者字符串組成的元組,不接收正則表達(dá)式
na 缺失值返回內(nèi)容,默認(rèn)NaN

2.4 str.match()

2.3.1 函數(shù)功能

檢測(cè)Series中的每個(gè)元素或索引是否以指定內(nèi)容開(kāi)始,返回值為布爾值組成的Series或者Index

2.3.2 函數(shù)語(yǔ)法

Series.str.match(pat, na=None)

2.3.3 函數(shù)參數(shù)

參數(shù) 含義
pat 要查找的內(nèi)容,格式為正則表達(dá)式
case 布爾值,是否區(qū)分大小寫,默認(rèn)True:區(qū)分
flags 整數(shù),默認(rèn)值為0
na 標(biāo)量,可選參數(shù),對(duì)缺失值進(jìn)行填充

str.startwith()與str.match()都可以檢測(cè)Serie或者Series的Index是否以指定內(nèi)容開(kāi)始,凡是str.match()支持正則表達(dá)式,適用范圍更廣。

3.字符串替換

3.1 str.replace()

3.1.1 函數(shù)功能

替換指定內(nèi)容

3.1.2 函數(shù)語(yǔ)法

Series.str.replace(pat, repl, n=- 1, case=None, flags=0, regex=False)

3.1.3 函數(shù)參數(shù)

參數(shù) 含義
pat 要查找的內(nèi)容,字符串或正則表達(dá)式
repl 要替換為的字符串或可迭代對(duì)象
n 整數(shù),進(jìn)行替換操作的數(shù)量,默認(rèn)為-1:替換所有
case 布爾值,是否區(qū)分大小寫,默認(rèn)True:區(qū)分
flags 整數(shù),默認(rèn)值為0
regex 布爾值,傳入的pat是否是正則表達(dá)式,默認(rèn)取值為False:不是正則表達(dá)式
order = pd.read_excel('C:\\Users\\changyanhua\\Desktop\\order.xlsx')
print(order.head())
print(order['獲取日期'].str.replace('-', ''))
# 將\d+視為正則表達(dá)式而不是普通字符
print(order['職位id'].astype(str).str.replace('\d+', '職位', regex='True'))

常用字符串處理方法匯總--Pandas,Pandas,pandas,python
常用字符串處理方法匯總--Pandas,Pandas,pandas,python
常用字符串處理方法匯總--Pandas,Pandas,pandas,python

4. 字符串拼接

4.1 str.join()

4.1.1 函數(shù)功能

將Series或Index中的每個(gè)元素通過(guò)指定符號(hào)連接起來(lái),當(dāng)元素中有非字符串對(duì)象時(shí),最終結(jié)果將為NaN

4.1.2 函數(shù)語(yǔ)法

Series.str.join(sep)[source]

4.1.3 函數(shù)參數(shù)

參數(shù) 含義
sep 連接符號(hào)
order = pd.read_excel('C:\\Users\\changyanhua\\Desktop\\order.xlsx')

print(order.head())
print(order['學(xué)歷要求'].str.join('*'))

常用字符串處理方法匯總--Pandas,Pandas,pandas,python

4.2 str.cat()

4.2.1 函數(shù)功能

用指定的分隔符連接Series或者Index中的元素。當(dāng)指定others,將Series或者Index與others中的元素連接;否則將Series或者Index中的元素連接為一個(gè)字符串。

4.2.2 函數(shù)語(yǔ)法

Series.str.cat(others=None, sep=None, na_rep=None, join='left')

4.2.3 函數(shù)參數(shù)

參數(shù) 含義
others 取值為Series、Index、DataFrane、np.array或者list-like
sep 字符串,默認(rèn)為:‘’:空字符串
na_rep 字符串或者None,默認(rèn)為None,對(duì)缺失值的處理:當(dāng)na_rep為None且當(dāng)others沒(méi)有時(shí),連接結(jié)果將會(huì)忽略缺失值;如果na_rep為None,但是others有值,結(jié)果中將保留缺失值
join 決定Series或Index與others之間的連接方式,默認(rèn)為left:左連接

others為None,將Series中的元素連接為一個(gè)字符串

order = pd.read_excel('C:\\Users\\changyanhua\\Desktop\\order.xlsx')

print(order.head())
print(order['學(xué)歷要求'].str.cat(sep='*'))

常用字符串處理方法匯總--Pandas,Pandas,pandas,python

others存在,將Series與others中的值對(duì)應(yīng)連接

print(order['學(xué)歷要求'].str.cat(others=order['公司規(guī)模'], sep='*'))

常用字符串處理方法匯總--Pandas,Pandas,pandas,python
有others參數(shù)

print(order['學(xué)歷要求'].str.cat(others=['學(xué)生']*len(order),sep='*'))

order:
常用字符串處理方法匯總--Pandas,Pandas,pandas,python

常用字符串處理方法匯總--Pandas,Pandas,pandas,python

5. 字符串查找:返回索引

5.1 str.find()

5.1 函數(shù)功能

查找指定字符串,返回第一次出現(xiàn)的索引,沒(méi)有找到則返回-1

5.2 函數(shù)語(yǔ)法

Series.str.find(sub, start=0, end=None)

5.3 函數(shù)參數(shù)

參數(shù) 含義
sub 要查找的字符串
start 開(kāi)始查找的位置
end 結(jié)束查找的位置
order = pd.read_excel('C:\\Users\\changyanhua\\Desktop\\order.xlsx')

print(order)
print([order['職位名稱'].str.find('開(kāi)發(fā)')])

常用字符串處理方法匯總--Pandas,Pandas,pandas,python
常用字符串處理方法匯總--Pandas,Pandas,pandas,python

print([order['職位名稱'].str.find('開(kāi)發(fā)',start=5)])

常用字符串處理方法匯總--Pandas,Pandas,pandas,python

5.2 str.findall()

5.2.1 函數(shù)功能

返回子字符串的列表

5.2.2 函數(shù)語(yǔ)法

Series.str.findall(pat, flags=0)

5.2.3 函數(shù)參數(shù)

參數(shù) 含義
pat 要匹配的字符串或正則表達(dá)式
flags 正則表達(dá)式標(biāo)志
print([order['職位名稱'].str.findall('開(kāi)發(fā)工程師')])

常用字符串處理方法匯總--Pandas,Pandas,pandas,python

6. 指定字符串刪除

6.1 str.strip()

6.1.1 函數(shù)功能

刪除Series中每個(gè)字符串兩邊的空格(\t)和換行符(\n),也可以指定刪除的字符串

6.1.2 函數(shù)語(yǔ)法

Series.str.strip(to_strip=None)

6.1.3 函數(shù)參數(shù)

參數(shù) 含義
to_strip 指定要去掉的字符串集合,集合中的所有字符串組成的集合都將被去除
order = pd.read_excel('C:\\Users\\changyanhua\\Desktop\\stp.xlsx')

print(order)
print([order['dishes_name'].str.strip()])

常用字符串處理方法匯總--Pandas,Pandas,pandas,python
常用字符串處理方法匯總--Pandas,Pandas,pandas,python
類似的還有str.lstrip():刪除左邊的指定字符;str.rstrip():刪除右邊的指定字符文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-531163.html

到了這里,關(guān)于常用字符串處理方法匯總--Pandas的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • Pandas實(shí)戰(zhàn)100例 | 案例 16: 字符串操作 - 分割和轉(zhuǎn)換

    案例 16: 字符串操作 - 分割和轉(zhuǎn)換 知識(shí)點(diǎn)講解 Pandas 提供了豐富的字符串操作功能,這些功能很大程度上類似于 Python 原生的字符串方法。你可以對(duì) DataFrame 或 Series 中的字符串進(jìn)行分割、轉(zhuǎn)換、替換等操作。這些操作在處理文本數(shù)據(jù)時(shí)非常有用。 字符串分割 : 使用 split 方法分

    2024年02月02日
    瀏覽(77)
  • Pandas中的字符串和時(shí)間轉(zhuǎn)換與格式化

    Pandas 提供了若干個(gè)函數(shù)來(lái)格式化時(shí)間。 其中,最常用的是 to_datetime() 函數(shù)。 可以使用 to_datetime() 函數(shù)將一個(gè)字符串解析為時(shí)間,并指定字符串的格式。例如: 輸出: 還可以使用 strftime() 函數(shù)將時(shí)間格式化為字符串。例如: 輸出: 如果想要格式化某一列中的時(shí)間,可以使用

    2024年02月04日
    瀏覽(25)
  • 55_Pandas.DataFrame 轉(zhuǎn)換為 JSON 字符串/文件并保存 (to_json)

    使用pandas.DataFrame的方法to_json(),可以將pandas.DataFrame轉(zhuǎn)為JSON格式字符串(str類型)或者輸出(保存)為JSON格式文件。 在此,對(duì)以下內(nèi)容進(jìn)行說(shuō)明。有關(guān)其他參數(shù),請(qǐng)參閱上面的官方文檔。 pandas.DataFrame.to_json() 的基本用法 轉(zhuǎn)換為JSON格式字符串 輸出(保存)為JSON格式文件 文

    2024年02月15日
    瀏覽(23)
  • 【Java練習(xí)題匯總】《第一行代碼JAVA》Java常用類庫(kù)篇,匯總Java練習(xí)題——Optional類、包裝類、可變字符串支持類、Runtime類、System類、數(shù)學(xué)運(yùn)算類、日期時(shí)間處理...

    【Java練習(xí)題匯總】《第一行代碼JAVA》Java常用類庫(kù)篇,匯總Java練習(xí)題——Optional類、包裝類、可變字符串支持類、Runtime類、System類、數(shù)學(xué)運(yùn)算類、日期時(shí)間處理...

    一、填空題 在 java.lang 包中提供了兩個(gè)字符串類,分別是________ 和________ 。這兩個(gè)類都是________ 接口的子類,字符串類提供的求字符串長(zhǎng)度的方法是________________ 。 Java 提供的兩個(gè)大數(shù)操作類是________ 和________ 。 對(duì)象克隆方法是________ 類提供的,方法名稱是________________ ,對(duì)

    2024年02月16日
    瀏覽(37)
  • 【數(shù)據(jù)處理】Pandas讀取CSV文件示例及常用方法(入門)

    【數(shù)據(jù)處理】Pandas讀取CSV文件示例及常用方法(入門)

    查看讀取前10行數(shù)據(jù) 2067 向前填充 指定列的插值填充 使用某數(shù)據(jù)填充指定列的空值 示例: 類似切片 array([‘SE’, ‘cv’, ‘NW’, ‘NE’], dtype=object) 類似數(shù)據(jù)庫(kù)查詢中的groupby查詢 先添加新的一列按月將數(shù)據(jù)劃分 聚合,對(duì)指定的列按月劃分求平均值等 min 最小值 max 最大值 sum

    2024年02月06日
    瀏覽(1673)
  • JavaScript字符串常用方法

    ●我們操作字符串,也有一堆的方法來(lái)幫助我們操作 ●字符串和數(shù)組有一個(gè)一樣的地方,也是按照索引來(lái)排列的 ●注意:所有字符串常用方法, 都不會(huì)改變?cè)甲址? 都是以返回值的形式出現(xiàn)結(jié)果 ●作用:charAt() 是找到字符串中指定索引位置的內(nèi)容返回 ●語(yǔ)法:字符串.

    2024年02月17日
    瀏覽(21)
  • 10 種常用的字符串方法

    字符串拼接 判斷字符串中是否包含指定值,返回布爾值 判斷字符串中是否包含指定值,返回符合的第一個(gè)值的下標(biāo),沒(méi)有返回-1 從右到左 判斷字符串中是否包含指定值,返回符合的第一個(gè)值的下標(biāo),沒(méi)有返回-1 將字符串復(fù)制幾份 替換字符串內(nèi)元素,可以直接傳值,也可以傳

    2024年02月09日
    瀏覽(21)
  • spark-sql處理json字符串的常用函數(shù)

    整理了spark-sql處理json字符串的幾個(gè)函數(shù): 1?get_json_object 解析不含數(shù)組的 json ? 2 from_json? 解析json 3 schema_of_json?提供生成json格式的方法 4 explode? ?把JSONArray轉(zhuǎn)為多行 get_json_object(string json_string, string path) :適合最外層為{}的json解析。 ?第一個(gè)參數(shù)是json對(duì)象變量,也就是含j

    2023年04月08日
    瀏覽(16)
  • String字符串,F(xiàn)astJson常用操作方法

    String字符串,F(xiàn)astJson常用操作方法

    1、創(chuàng)建配置環(huán)境 注意 測(cè)試的時(shí)候需要更改一下idea的設(shè)置 2、FastJson簡(jiǎn)介 3、 序列化 測(cè)試 JSON.toJSONString(序列化java對(duì)象) 4、 反序列化 5、枚舉介紹 6、JSONField注解的使用 1、注解 2、作用于字段上面 3、格式化日期時(shí)間 4、指定字段不序列化 5、指定字段順序 6、自定義序列化內(nèi)容

    2024年02月21日
    瀏覽(23)
  • 字符串輸入的2種常用方法詳解

    字符串輸入的2種常用方法詳解

    這種方法可以輸入字符串, 但是只能輸入一個(gè)詞,遇到空格就結(jié)束了。 ,空格之后的字符,會(huì)留在緩沖區(qū),等待下次讀入。 如果我們要使用scanf函數(shù)來(lái)輸入的話,有沒(méi)有辦法呢? 答案:有的。 除了轉(zhuǎn)換修飾符 s 以外,也可以 使用“掃描集”(scanset)修飾符來(lái)讀取字符串

    2024年02月04日
    瀏覽(19)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包