国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

python,Pandas讀取csv文件gbk編碼和utf-8編碼都報(bào)錯(cuò)

這篇具有很好參考價(jià)值的文章主要介紹了python,Pandas讀取csv文件gbk編碼和utf-8編碼都報(bào)錯(cuò)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

一、問(wèn)題描述

用Pandas讀取csv文件,read_csv(),使用默認(rèn)的 encoding = ‘utf-8’ 和 encoding = ‘gbk’ 都報(bào)錯(cuò),如下圖。最終通過(guò)統(tǒng)一編碼方式解決了,操作很簡(jiǎn)單,但是問(wèn)題解決的探索過(guò)程并不是特別順利,所以記錄一下,給朋友們參考~
data = pd.read_csv('hotel_comment.csv',encoing='gbk') typeerror: read_csv(),筆記,python,pandas,人工智能
data = pd.read_csv('hotel_comment.csv',encoing='gbk') typeerror: read_csv(),筆記,python,pandas,人工智能

二、問(wèn)題解決

統(tǒng)一編碼方式,將csv文件的編碼格式改為utf-8。
具體操作:用記事本打開(kāi)csv文件,可以看到右下角顯示的編碼方式為ANSI,另存為文件,編碼選擇UTF-8。
data = pd.read_csv('hotel_comment.csv',encoing='gbk') typeerror: read_csv(),筆記,python,pandas,人工智能

data = pd.read_csv('hotel_comment.csv',encoing='gbk') typeerror: read_csv(),筆記,python,pandas,人工智能
成功讀取文件:
data = pd.read_csv('hotel_comment.csv',encoing='gbk') typeerror: read_csv(),筆記,python,pandas,人工智能

三、解決過(guò)程及分析總結(jié)

  1. 一開(kāi)始是通過(guò)修改默認(rèn)編碼方式為encoding = ‘gbk’ ,發(fā)現(xiàn)文件內(nèi)容的是混合了兩種編碼方式。
  2. 嘗試通過(guò)網(wǎng)頁(yè)搜索相關(guān)的問(wèn)題經(jīng)驗(yàn)貼,有相關(guān)的,但也并不能解決我的問(wèn)題。
  3. 借助文心一言,AI可以直接提供代碼,嘗試了幾種途徑都沒(méi)有成功,包括:使用chardet庫(kù)來(lái)檢測(cè)文件的編碼、將Pandas庫(kù)中的read_csv()參數(shù)chunksize設(shè)置為1逐行讀取、使用csv模塊和codecs模塊來(lái)逐行讀取CSV文件并條件判斷使用編碼方式為UTF-8或GBK。
  4. 轉(zhuǎn)變思路,直接將csv文件統(tǒng)一好格式,再讀取文件。記事本一鍵另存為,后面非常順利地用pd.read_csv()讀取成功。

總結(jié):文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-795337.html

  1. 遇到問(wèn)題不要慌,雖然有時(shí)候嘗試好幾次報(bào)錯(cuò)就會(huì)很煩。
  2. 借助大模型是個(gè)好辦法,代碼不一定能順利運(yùn)行,但可以給你提供一些思路,比如可以用哪些庫(kù)和函數(shù),而且發(fā)現(xiàn)AI寫(xiě)的代碼,編程思維還是體現(xiàn)得很不錯(cuò)的,尤其是函數(shù)的設(shè)計(jì)。
  3. 學(xué)會(huì)轉(zhuǎn)換思路(放松大腦),嘗試用盡可能簡(jiǎn)單的辦法解決問(wèn)題,比如這個(gè)問(wèn)題可以記事本直接另存為,統(tǒng)一文件編碼方式。

到了這里,關(guān)于python,Pandas讀取csv文件gbk編碼和utf-8編碼都報(bào)錯(cuò)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 一篇文章徹底搞懂Python字符編碼方式(中文編碼,UTF-8,unicode,gb,gbk,中文亂碼,爬蟲(chóng)中文亂碼)

    一篇文章徹底搞懂Python字符編碼方式(中文編碼,UTF-8,unicode,gb,gbk,中文亂碼,爬蟲(chóng)中文亂碼)

    目錄 前言 一、字符編碼方式的來(lái)龍去脈。 1.字符集的含義。 2.編碼方式演化過(guò)程 1.ASCII 2.GB2312、GBK 3.Unicode 4.UTF-8 二、Python的字符編碼及相關(guān)操作 1.window系統(tǒng)的字符編碼 2.Python的字符編碼 1.Python中str與bytes的區(qū)別和聯(lián)系 2.Python encode()方法【對(duì)str進(jìn)行編碼】 3.Python decode()方法【對(duì)

    2024年01月17日
    瀏覽(36)
  • Python 基于csv 讀取文本文件提示:‘gbk‘ codec can‘t decode byte 0xbf in position 2: illegal multibyte sequence

    Python 基于csv 讀取文本文件提示:‘gbk‘ codec can‘t decode byte 0xbf in position 2: illegal multibyte sequence 錯(cuò)誤大致意思:Unicode的解碼(Decode)出現(xiàn)錯(cuò)誤(Error)了,以gbk編碼的方式去解碼(該字符串變成Unicode),但是此處通過(guò)gbk的方式,卻無(wú)法解碼(can’t decode )?!癷llegal multibyt

    2024年02月05日
    瀏覽(125)
  • Python 讀取csv文件時(shí)報(bào)錯(cuò):UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd0 in position 0:invalid

    Python 讀取csv文件時(shí)報(bào)錯(cuò):UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd0 in position 0:invalid

    問(wèn)題描述:我在讀取csv文件時(shí) python報(bào)了如下錯(cuò)誤 或者報(bào)了以下錯(cuò)誤:UnicodeDecodeError: \\\'gbk\\\' codec can\\\'t decode byte 0xb1 in position 5: illegal multibyte sequence 目錄 問(wèn)題引出: 錯(cuò)誤示范如下: 解決方案如下: 我先創(chuàng)建的xlsx 或者 xls文件,然后再改成以csv為后綴的文件,最后在python里讀取失

    2024年02月16日
    瀏覽(93)
  • Java使用UTF-8或GBK編碼后還是亂碼的問(wèn)題

    大家在開(kāi)發(fā)中可能經(jīng)常遇到將String字符串轉(zhuǎn)為byte[]的場(chǎng)景,為了避免中文亂碼,一般指定字符集為GBK或UTF-8來(lái)進(jìn)行編碼以及解碼,但是如果使用不當(dāng),同樣會(huì)造成字符集亂碼問(wèn)題。 主要原因是進(jìn)行編碼以及解碼的字符集不一致導(dǎo)致 所以,在解決字符集亂碼問(wèn)題時(shí)一般情況下會(huì)

    2024年02月15日
    瀏覽(31)
  • 一文搞懂Python文件讀取報(bào)錯(cuò)UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte

    一文搞懂Python文件讀取報(bào)錯(cuò)UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte

    下面是一個(gè)非常簡(jiǎn)單的讀取并打印文件內(nèi)容的示例: 在test.txt文本文件中,只有一個(gè) `你` 字: test.txt 但是,我們?cè)谶\(yùn)行這段代碼時(shí),出現(xiàn)了如下的錯(cuò)誤: 報(bào)錯(cuò): 首先我們得知道這個(gè)錯(cuò)誤是什么意思。 報(bào)錯(cuò)翻譯過(guò)來(lái)就是: Unicode解碼錯(cuò)誤:“gbk”編解碼器無(wú)法解碼位置2的字

    2024年02月16日
    瀏覽(90)
  • 織夢(mèng)GBK/GB2312轉(zhuǎn)utf-8編碼操作步驟(全站修改方法)

    目前MIP對(duì)編碼是有嚴(yán)格要求,必須是UTF-8,那么對(duì)于大部分GBK或者GB2312的用戶只能先將網(wǎng)站整體進(jìn)行編碼轉(zhuǎn)換,才能進(jìn)行MIP改造,不然改造后的頁(yè)面是亂碼一大片。 為什么MIP只支持utf-8?目前部分手機(jī)自帶瀏覽器僅支持UTF-8,打開(kāi)GBK的網(wǎng)站會(huì)出現(xiàn)亂碼,所以為了手機(jī)的兼容性,

    2023年04月24日
    瀏覽(40)
  • 【數(shù)據(jù)處理】Pandas讀取CSV文件示例及常用方法(入門(mén))

    【數(shù)據(jù)處理】Pandas讀取CSV文件示例及常用方法(入門(mén))

    查看讀取前10行數(shù)據(jù) 2067 向前填充 指定列的插值填充 使用某數(shù)據(jù)填充指定列的空值 示例: 類(lèi)似切片 array([‘SE’, ‘cv’, ‘NW’, ‘NE’], dtype=object) 類(lèi)似數(shù)據(jù)庫(kù)查詢中的groupby查詢 先添加新的一列按月將數(shù)據(jù)劃分 聚合,對(duì)指定的列按月劃分求平均值等 min 最小值 max 最大值 sum

    2024年02月06日
    瀏覽(1673)
  • 如何使用pandas讀取csv文件中的某一列數(shù)據(jù)

    使用pandas讀取csv文件中的某一列數(shù)據(jù),可以這樣做: 先導(dǎo)入pandas模塊: import pandas as pd 使用 pd.read_csv 函數(shù)讀取csv文件: df = pd.read_csv(\\\"文件名.csv\\\") 使用 df[\\\"列名\\\"] 讀取某一列數(shù)據(jù): column = df[\\\"列名\\\"] 例如,如果你有一個(gè)csv文件叫做 example.csv ,并且有一列叫做 age ,你可以這樣

    2024年02月13日
    瀏覽(112)
  • UTF-8、GB2312、GBK、GB18030、ISO-8859-1(也稱Latin-1):兼容ASCII編碼

    ASCII碼是單字節(jié)的,首位為0,后面表示的值就是Unicode碼點(diǎn),范圍為0x00-0x7F,共表示128個(gè)字符。 UTF-8和ASCII兼容 :因?yàn)閷?duì)于單字節(jié)的符號(hào),UTF-8 編碼和 ASCII 碼是相同的, 所以 UTF-8 能兼容 ASCII 編碼。 GB2312和ASCII兼容 :對(duì)于ASCII范圍以內(nèi)的字符,GB2312編碼的機(jī)內(nèi)碼(不是區(qū)位碼)

    2024年02月16日
    瀏覽(18)
  • 解決pandas讀取csv、tsv文件出現(xiàn)錯(cuò)誤《ParserError: Error tokenizing data. C error: Expected 1 fields in line...》

    讀取文件方式改為 出錯(cuò),ParserError: Error tokenizing data. C error: Expected 1 fields in line… 將讀取方式改為 OK,問(wèn)題解決! read_csv()是Pandas庫(kù)中用于讀取CSV文件的函數(shù),其常用參數(shù)如下:

    2024年02月11日
    瀏覽(20)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包