国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

常用字符串處理方法匯總--Pandas

2年前作者：牽?；ㄖ魅?/span>分類：Toy博客閱讀(24)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了常用字符串處理方法匯總--Pandas。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

字符串處理只能在Series上進(jìn)行，不可以在DataFrame上操作，只能對(duì)字符串進(jìn)行處理，不能對(duì)整數(shù)、日期進(jìn)行處理

1. 元素統(tǒng)計(jì)

1.1 str.count()

1.1.1 函數(shù)功能

統(tǒng)計(jì)Series中每個(gè)元素中包含pat的次數(shù)

1.1.2 函數(shù)語(yǔ)法

Series.str.count(pat, flags=0)

1.1.3 函數(shù)參數(shù)

參數(shù)	含義
pat	表達(dá)式

order = pd.read_excel('C:\\Users\\changyanhua\\Desktop\\order.xlsx')
print(order)
print(order['訂單編號(hào)'].str.count(pat='0'))

常用字符串處理方法匯總--Pandas,Pandas,pandas,python

1.2 str.len()

1.2.1 函數(shù)功能

統(tǒng)計(jì)Series中每個(gè)元素的長(zhǎng)度

1.2.2 函數(shù)語(yǔ)法

Series.str.len()

print(order['支付方式'].str.len())

常用字符串處理方法匯總--Pandas,Pandas,pandas,python

2. 字符串內(nèi)容判斷

2.1 str.contains()

2.1.1 函數(shù)功能

檢測(cè)Series或Index的每個(gè)元素中是否包含指定內(nèi)容，返回結(jié)果為布爾值構(gòu)成的Series或Index

2.1.2 函數(shù)語(yǔ)法

Series.str.contains(pat, case=True, flags=0, na=None, regex=True)

2.1.3 函數(shù)參數(shù)

參數(shù)	含義
pat	要查找的內(nèi)容
case	布爾值，是否區(qū)分大小寫，默認(rèn)True:區(qū)分
flags	整數(shù)，默認(rèn)值為0
na	標(biāo)量，可選參數(shù)，對(duì)缺失值進(jìn)行填充
regex	布爾值，默認(rèn)值為True：以正則表達(dá)式看待pat中的內(nèi)容，否則以普通字符串看待

order = pd.read_excel('C:\\Users\\changyanhua\\Desktop\\order.xlsx')
print(order)
print(order['所屬行業(yè)'].str.contains('計(jì)算機(jī)'))

常用字符串處理方法匯總--Pandas,Pandas,pandas,python

對(duì)缺失值以“unknown"填充

print(order['所屬行業(yè)'].str.contains('計(jì)算機(jī)',na='unknown'))

常用字符串處理方法匯總--Pandas,Pandas,pandas,python

2.2 str.endswith()

2.2.1 函數(shù)功能

檢測(cè)Series中的每個(gè)元素或索引是否以指定內(nèi)容結(jié)尾，返回值為布爾值組成的Series或者Index

2.2.2 函數(shù)語(yǔ)法

Series.str.endswith(pat, na=None)

2.2.3 函數(shù)參數(shù)

參數(shù)	含義
pat	查找內(nèi)容，可以是字符串或者字符串組成的元組，不接收正則表達(dá)式
na	缺失值返回內(nèi)容，默認(rèn)NaN

print(order['公司規(guī)模'].str.endswith('500人'))

常用字符串處理方法匯總--Pandas,Pandas,pandas,python
包含空字符串時(shí)，認(rèn)為空字符串中不包含指定內(nèi)容，設(shè)置na=False

order.loc[4,'公司規(guī)模']=np.nan
print(order)
print(order['公司規(guī)模'].str.endswith('500人',na=False))

常用字符串處理方法匯總--Pandas,Pandas,pandas,python

2.3 startswith()

2.3.1 函數(shù)功能

檢測(cè)Series中的每個(gè)元素或索引是否以指定內(nèi)容開(kāi)始，返回值為布爾值組成的Series或者Index

2.3.2 函數(shù)語(yǔ)法

Series.str.startswith(pat, na=None)

2.3.3 函數(shù)參數(shù)

參數(shù)	含義
pat	查找內(nèi)容，可以是字符串或者字符串組成的元組，不接收正則表達(dá)式
na	缺失值返回內(nèi)容，默認(rèn)NaN

2.4 str.match()

2.3.1 函數(shù)功能

檢測(cè)Series中的每個(gè)元素或索引是否以指定內(nèi)容開(kāi)始，返回值為布爾值組成的Series或者Index

2.3.2 函數(shù)語(yǔ)法

Series.str.match(pat, na=None)

2.3.3 函數(shù)參數(shù)

參數(shù)	含義
pat	要查找的內(nèi)容，格式為正則表達(dá)式
case	布爾值，是否區(qū)分大小寫，默認(rèn)True:區(qū)分
flags	整數(shù)，默認(rèn)值為0
na	標(biāo)量，可選參數(shù)，對(duì)缺失值進(jìn)行填充

str.startwith()與str.match()都可以檢測(cè)Serie或者Series的Index是否以指定內(nèi)容開(kāi)始，凡是str.match()支持正則表達(dá)式，適用范圍更廣。

3.字符串替換

3.1 str.replace()

3.1.1 函數(shù)功能

替換指定內(nèi)容

3.1.2 函數(shù)語(yǔ)法

Series.str.replace(pat, repl, n=- 1, case=None, flags=0, regex=False)

3.1.3 函數(shù)參數(shù)

參數(shù)	含義
pat	要查找的內(nèi)容，字符串或正則表達(dá)式
repl	要替換為的字符串或可迭代對(duì)象
n	整數(shù)，進(jìn)行替換操作的數(shù)量，默認(rèn)為-1：替換所有
case	布爾值，是否區(qū)分大小寫，默認(rèn)True:區(qū)分
flags	整數(shù)，默認(rèn)值為0
regex	布爾值，傳入的pat是否是正則表達(dá)式，默認(rèn)取值為False：不是正則表達(dá)式

order = pd.read_excel('C:\\Users\\changyanhua\\Desktop\\order.xlsx')
print(order.head())
print(order['獲取日期'].str.replace('-', ''))
# 將\d+視為正則表達(dá)式而不是普通字符
print(order['職位id'].astype(str).str.replace('\d+', '職位', regex='True'))

常用字符串處理方法匯總--Pandas,Pandas,pandas,python

4. 字符串拼接

4.1 str.join()

4.1.1 函數(shù)功能

將Series或Index中的每個(gè)元素通過(guò)指定符號(hào)連接起來(lái)，當(dāng)元素中有非字符串對(duì)象時(shí)，最終結(jié)果將為NaN

4.1.2 函數(shù)語(yǔ)法

Series.str.join(sep)[source]

4.1.3 函數(shù)參數(shù)

參數(shù)	含義
sep	連接符號(hào)

order = pd.read_excel('C:\\Users\\changyanhua\\Desktop\\order.xlsx')

print(order.head())
print(order['學(xué)歷要求'].str.join('*'))

常用字符串處理方法匯總--Pandas,Pandas,pandas,python

4.2 str.cat()

4.2.1 函數(shù)功能

用指定的分隔符連接Series或者Index中的元素。當(dāng)指定others，將Series或者Index與others中的元素連接；否則將Series或者Index中的元素連接為一個(gè)字符串。

4.2.2 函數(shù)語(yǔ)法

Series.str.cat(others=None, sep=None, na_rep=None, join='left')

4.2.3 函數(shù)參數(shù)

參數(shù)	含義
others	取值為Series、Index、DataFrane、np.array或者list-like
sep	字符串，默認(rèn)為：‘’：空字符串
na_rep	字符串或者None，默認(rèn)為None，對(duì)缺失值的處理：當(dāng)na_rep為None且當(dāng)others沒(méi)有時(shí)，連接結(jié)果將會(huì)忽略缺失值；如果na_rep為None，但是others有值，結(jié)果中將保留缺失值
join	決定Series或Index與others之間的連接方式，默認(rèn)為left:左連接

others為None，將Series中的元素連接為一個(gè)字符串

order = pd.read_excel('C:\\Users\\changyanhua\\Desktop\\order.xlsx')

print(order.head())
print(order['學(xué)歷要求'].str.cat(sep='*'))

常用字符串處理方法匯總--Pandas,Pandas,pandas,python

others存在，將Series與others中的值對(duì)應(yīng)連接

print(order['學(xué)歷要求'].str.cat(others=order['公司規(guī)模'], sep='*'))

常用字符串處理方法匯總--Pandas,Pandas,pandas,python
有others參數(shù)

print(order['學(xué)歷要求'].str.cat(others=['學(xué)生']*len(order),sep='*'))

order：
常用字符串處理方法匯總--Pandas,Pandas,pandas,python

常用字符串處理方法匯總--Pandas,Pandas,pandas,python

5. 字符串查找：返回索引

5.1 str.find()

5.1 函數(shù)功能

查找指定字符串，返回第一次出現(xiàn)的索引，沒(méi)有找到則返回-1

5.2 函數(shù)語(yǔ)法

Series.str.find(sub, start=0, end=None)

5.3 函數(shù)參數(shù)

參數(shù)	含義
sub	要查找的字符串
start	開(kāi)始查找的位置
end	結(jié)束查找的位置

order = pd.read_excel('C:\\Users\\changyanhua\\Desktop\\order.xlsx')

print(order)
print([order['職位名稱'].str.find('開(kāi)發(fā)')])

常用字符串處理方法匯總--Pandas,Pandas,pandas,python

print([order['職位名稱'].str.find('開(kāi)發(fā)',start=5)])

常用字符串處理方法匯總--Pandas,Pandas,pandas,python

5.2 str.findall()

5.2.1 函數(shù)功能

返回子字符串的列表

5.2.2 函數(shù)語(yǔ)法

Series.str.findall(pat, flags=0)

5.2.3 函數(shù)參數(shù)

參數(shù)	含義
pat	要匹配的字符串或正則表達(dá)式
flags	正則表達(dá)式標(biāo)志

print([order['職位名稱'].str.findall('開(kāi)發(fā)工程師')])

常用字符串處理方法匯總--Pandas,Pandas,pandas,python

6. 指定字符串刪除

6.1 str.strip()

6.1.1 函數(shù)功能

刪除Series中每個(gè)字符串兩邊的空格（\t）和換行符(\n)，也可以指定刪除的字符串

6.1.2 函數(shù)語(yǔ)法

Series.str.strip(to_strip=None)

6.1.3 函數(shù)參數(shù)

參數(shù)	含義
to_strip	指定要去掉的字符串集合，集合中的所有字符串組成的集合都將被去除

order = pd.read_excel('C:\\Users\\changyanhua\\Desktop\\stp.xlsx')

print(order)
print([order['dishes_name'].str.strip()])

常用字符串處理方法匯總--Pandas,Pandas,pandas,python

類似的還有str.lstrip()：刪除左邊的指定字符；str.rstrip()：刪除右邊的指定字符文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-531163.html

到了這里，關(guān)于常用字符串處理方法匯總--Pandas的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

Pandas實(shí)戰(zhàn)100例 | 案例 16: 字符串操作 - 分割和轉(zhuǎn)換
案例 16: 字符串操作 - 分割和轉(zhuǎn)換知識(shí)點(diǎn)講解 Pandas 提供了豐富的字符串操作功能，這些功能很大程度上類似于 Python 原生的字符串方法。你可以對(duì) DataFrame 或 Series 中的字符串進(jìn)行分割、轉(zhuǎn)換、替換等操作。這些操作在處理文本數(shù)據(jù)時(shí)非常有用。字符串分割 : 使用 split 方法分
2024年02月02日
瀏覽(77)
Pandas中的字符串和時(shí)間轉(zhuǎn)換與格式化
Pandas 提供了若干個(gè)函數(shù)來(lái)格式化時(shí)間。其中，最常用的是 to_datetime() 函數(shù)。可以使用 to_datetime() 函數(shù)將一個(gè)字符串解析為時(shí)間，并指定字符串的格式。例如：輸出：還可以使用 strftime() 函數(shù)將時(shí)間格式化為字符串。例如：輸出：如果想要格式化某一列中的時(shí)間，可以使用
2024年02月04日
瀏覽(25)
55_Pandas.DataFrame 轉(zhuǎn)換為 JSON 字符串/文件并保存 (to_json)
使用pandas.DataFrame的方法to_json()，可以將pandas.DataFrame轉(zhuǎn)為JSON格式字符串（str類型）或者輸出（保存）為JSON格式文件。在此，對(duì)以下內(nèi)容進(jìn)行說(shuō)明。有關(guān)其他參數(shù)，請(qǐng)參閱上面的官方文檔。 pandas.DataFrame.to_json() 的基本用法轉(zhuǎn)換為JSON格式字符串輸出（保存）為JSON格式文件文
2024年02月15日
瀏覽(23)
【Java練習(xí)題匯總】《第一行代碼JAVA》Java常用類庫(kù)篇，匯總Java練習(xí)題——Optional類、包裝類、可變字符串支持類、Runtime類、System類、數(shù)學(xué)運(yùn)算類、日期時(shí)間處理...
一、填空題在 java.lang 包中提供了兩個(gè)字符串類，分別是________ 和________ 。這兩個(gè)類都是________ 接口的子類，字符串類提供的求字符串長(zhǎng)度的方法是________________ 。 Java 提供的兩個(gè)大數(shù)操作類是________ 和________ 。對(duì)象克隆方法是________ 類提供的，方法名稱是________________ ，對(duì)
2024年02月16日
瀏覽(37)
【數(shù)據(jù)處理】Pandas讀取CSV文件示例及常用方法（入門）
查看讀取前10行數(shù)據(jù) 2067 向前填充指定列的插值填充使用某數(shù)據(jù)填充指定列的空值示例: 類似切片 array([‘SE’, ‘cv’, ‘NW’, ‘NE’], dtype=object) 類似數(shù)據(jù)庫(kù)查詢中的groupby查詢先添加新的一列按月將數(shù)據(jù)劃分聚合，對(duì)指定的列按月劃分求平均值等 min 最小值 max 最大值 sum
2024年02月06日
瀏覽(1673)
JavaScript字符串常用方法
●我們操作字符串，也有一堆的方法來(lái)幫助我們操作 ●字符串和數(shù)組有一個(gè)一樣的地方，也是按照索引來(lái)排列的 ●注意：所有字符串常用方法, 都不會(huì)改變?cè)甲址? 都是以返回值的形式出現(xiàn)結(jié)果 ●作用：charAt() 是找到字符串中指定索引位置的內(nèi)容返回 ●語(yǔ)法：字符串.
2024年02月17日
瀏覽(21)
10 種常用的字符串方法
字符串拼接判斷字符串中是否包含指定值，返回布爾值判斷字符串中是否包含指定值，返回符合的第一個(gè)值的下標(biāo)，沒(méi)有返回-1 從右到左判斷字符串中是否包含指定值，返回符合的第一個(gè)值的下標(biāo)，沒(méi)有返回-1 將字符串復(fù)制幾份替換字符串內(nèi)元素，可以直接傳值，也可以傳
2024年02月09日
瀏覽(21)
spark-sql處理json字符串的常用函數(shù)
整理了spark-sql處理json字符串的幾個(gè)函數(shù)： 1?get_json_object 解析不含數(shù)組的 json ? 2 from_json? 解析json 3 schema_of_json?提供生成json格式的方法 4 explode? ?把JSONArray轉(zhuǎn)為多行 get_json_object(string json_string, string path) ：適合最外層為{}的json解析。 ?第一個(gè)參數(shù)是json對(duì)象變量，也就是含j
2023年04月08日
瀏覽(16)
String字符串，F(xiàn)astJson常用操作方法
1、創(chuàng)建配置環(huán)境注意測(cè)試的時(shí)候需要更改一下idea的設(shè)置 2、FastJson簡(jiǎn)介 3、序列化測(cè)試 JSON.toJSONString(序列化java對(duì)象) 4、反序列化 5、枚舉介紹 6、JSONField注解的使用 1、注解 2、作用于字段上面 3、格式化日期時(shí)間 4、指定字段不序列化 5、指定字段順序 6、自定義序列化內(nèi)容
2024年02月21日
瀏覽(23)
字符串輸入的2種常用方法詳解
這種方法可以輸入字符串，但是只能輸入一個(gè)詞，遇到空格就結(jié)束了。，空格之后的字符，會(huì)留在緩沖區(qū)，等待下次讀入。如果我們要使用scanf函數(shù)來(lái)輸入的話，有沒(méi)有辦法呢？答案：有的。除了轉(zhuǎn)換修飾符 s 以外，也可以使用“掃描集”（scanset）修飾符來(lái)讀取字符串
2024年02月04日
瀏覽(19)