一、問(wèn)題描述
用Pandas讀取csv文件,read_csv(),使用默認(rèn)的 encoding = ‘utf-8’ 和 encoding = ‘gbk’ 都報(bào)錯(cuò),如下圖。最終通過(guò)統(tǒng)一編碼方式解決了,操作很簡(jiǎn)單,但是問(wèn)題解決的探索過(guò)程并不是特別順利,所以記錄一下,給朋友們參考~
二、問(wèn)題解決
統(tǒng)一編碼方式,將csv文件的編碼格式改為utf-8。
具體操作:用記事本打開(kāi)csv文件,可以看到右下角顯示的編碼方式為ANSI,另存為文件,編碼選擇UTF-8。
成功讀取文件:文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-795337.html
三、解決過(guò)程及分析總結(jié)
- 一開(kāi)始是通過(guò)修改默認(rèn)編碼方式為encoding = ‘gbk’ ,發(fā)現(xiàn)文件內(nèi)容的是混合了兩種編碼方式。
- 嘗試通過(guò)網(wǎng)頁(yè)搜索相關(guān)的問(wèn)題經(jīng)驗(yàn)貼,有相關(guān)的,但也并不能解決我的問(wèn)題。
- 借助文心一言,AI可以直接提供代碼,嘗試了幾種途徑都沒(méi)有成功,包括:使用chardet庫(kù)來(lái)檢測(cè)文件的編碼、將Pandas庫(kù)中的read_csv()參數(shù)chunksize設(shè)置為1逐行讀取、使用csv模塊和codecs模塊來(lái)逐行讀取CSV文件并條件判斷使用編碼方式為UTF-8或GBK。
- 轉(zhuǎn)變思路,直接將csv文件統(tǒng)一好格式,再讀取文件。記事本一鍵另存為,后面非常順利地用pd.read_csv()讀取成功。
總結(jié):文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-795337.html
- 遇到問(wèn)題不要慌,雖然有時(shí)候嘗試好幾次報(bào)錯(cuò)就會(huì)很煩。
- 借助大模型是個(gè)好辦法,代碼不一定能順利運(yùn)行,但可以給你提供一些思路,比如可以用哪些庫(kù)和函數(shù),而且發(fā)現(xiàn)AI寫(xiě)的代碼,編程思維還是體現(xiàn)得很不錯(cuò)的,尤其是函數(shù)的設(shè)計(jì)。
- 學(xué)會(huì)轉(zhuǎn)換思路(放松大腦),嘗試用盡可能簡(jiǎn)單的辦法解決問(wèn)題,比如這個(gè)問(wèn)題可以記事本直接另存為,統(tǒng)一文件編碼方式。
到了這里,關(guān)于python,Pandas讀取csv文件gbk編碼和utf-8編碼都報(bào)錯(cuò)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!