国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

1.Python操作txt文本

這篇具有很好參考價值的文章主要介紹了1.Python操作txt文本。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報違法"按鈕提交疑問。

1.Python讀取一個txt文件的內(nèi)容并將其寫入到另一個txt文件

# -*- encoding:gb2312 -*-
import chardet

def read_write_txt(inputpath, outputpath):
    with open(
            inputpath,
            'rb',
    ) as file:     # rb: 以二進(jìn)制格式打開一個文件用于只讀。
        raw_data = file.read()   # 讀出內(nèi)容用到的是read函數(shù)。這個函數(shù)的工作原理是依靠一個指針來對內(nèi)容進(jìn)行訪問的。read方法會用一個指針將文本內(nèi)容從上到下掃面一遍并且將其輸出到內(nèi)存。掃描完后它的指針是停留在末尾處的。也就是說,如果我們想用read方法訪問同一個文件兩次,是不可行的。
        detected_encoding = chardet.detect(raw_data)['encoding']  # 返回文件的編碼格式。
    with open(inputpath, 'r', encoding=detected_encoding) as infile:
        with open(outputpath, 'w', encoding=detected_encoding) as outfile:
            # # 第一種:讀取所有行
            # data1 = infile.readlines()
            # print(data1)
            # # 輸出:['好好學(xué)習(xí)\n', '天天向上\n', '我是一只魚\n', '哈哈哈']

            # 第二種:每行分開讀取
            data2 = []
            for line in infile:
                data_line = line.strip("\n")  # 去除首尾換行符
                data2.append(data_line)
            print(data2)
            # 輸出:['好好學(xué)習(xí)', '天天向上', '我是一只魚', '哈哈哈']

            # 寫入方法
            for line in data2:
                # data = '' + '\t'.join(str(i) for i in line) + '\n'  # 用\t隔開
                data = '' + ''.join(str(i) for i in line) + '\n'  # 用空格隔開
                outfile.write(data)


if __name__ == "__main__":
    input_file = '1.txt'  # 待讀取的文件
    output_file = 'ansi.txt' # 寫入的文件
    read_write_txt(input_file, output_file)

待讀入文件1.txt

1.Python操作txt文本,python小腳本,python,自然語言處理

寫入后的文件ansi.txt

1.Python操作txt文本,python小腳本,python,自然語言處理

2.Python讀取一個未知編碼的文件并將其設(shè)置為指定編碼格式

要在Python中讀取一個未知編碼的文件并將其設(shè)置為另一種編碼格式,可以使用chardet模塊來檢測文件的編碼格式,然后使用Python內(nèi)置的編碼庫來進(jìn)行轉(zhuǎn)換。

使用該代碼前需要安裝chardet和codecs庫

pip install chardet
pip install codecs

首先,你可以使用chardet模塊來檢測文件的編碼格式。你可以使用以下代碼來完成這個步驟:

# -*- encoding:gb2312 -*-
import chardet
import codecs
def save_as_specified_encoding(input_file, output_file, output_encoding):  #input_file為未知編碼文件,output_file為編碼后的文件,output_encoding為編碼格式
    with open(
            input_file,
            'rb',
    ) as file:     # rb: 以二進(jìn)制格式打開一個文件用于只讀。
        raw_data = file.read()   # 讀出內(nèi)容用到的是read函數(shù)。這個函數(shù)的工作原理是依靠一個指針來對內(nèi)容進(jìn)行訪問的。read方法會用一個指針將文本內(nèi)容從上到下掃面一遍并且將其輸出到內(nèi)存。掃描完后它的指針是停留在末尾處的。也就是說,如果我們想用read方法訪問同一個文件兩次,是不可行的。
        detected_encoding = chardet.detect(raw_data)['encoding']  # 返回文件的編碼格式。

    with codecs.open(input_file,
                     'r',
                     encoding=detected_encoding,
                     errors='ignore') as input_file:
        content = input_file.read()
   # codecs.open(filename, mode='r', encoding=None, errors='strict', buffering=1)  使用給定的 mode 打開已編碼的文件并返回一個 StreamReaderWriter的實(shí)例,提供透明的編碼/解碼;與內(nèi)置函數(shù)open類似。

    with codecs.open(output_file,
                     'w',
                     encoding=output_encoding,
                     errors='ignore') as output_file:
        output_file.write(content) 

    if __name__ == "__main__":
    input_file = '1.txt'   # 未知編碼文件
    output_file = 'ansi.txt' # 編碼后的文件
    output_encoding = 'ansi' # 設(shè)置的編碼
    save_as_specified_encoding(input_file, output_file, output_encoding)

原始文件1.txt

1.Python操作txt文本,python小腳本,python,自然語言處理

編碼后的文件ansi.txt

1.Python操作txt文本,python小腳本,python,自然語言處理

3.Python實(shí)現(xiàn)txt文件中字符串的替換

# -*- encoding:gb2312 -*-
def replace_txt(inputpath, outputpath):

    # 打開原始文件和目標(biāo)文件
    with open(inputpath, 'r') as file:
        content = file.read()

    # 替換字符:和:
    new_content = content.replace(':', ' ')
    new_content = new_content.replace(':', ' ')
    # 將替換后的內(nèi)容寫入目標(biāo)文件
    with open(outputpath, 'w') as file:
        file.write(new_content)


if __name__ == "__main__":
    input_path = 'ansi.txt'    # 待處理的txt文件
    output_path = 'result.txt'    # 替換字符后的txt文件
    replace_txt(input_path, output_path)

ansi文件(原始文件)

1.Python操作txt文本,python小腳本,python,自然語言處理

result文件 (替換后的文件)

1.Python操作txt文本,python小腳本,python,自然語言處理文章來源地址http://www.zghlxwxcb.cn/news/detail-687840.html

到了這里,關(guān)于1.Python操作txt文本的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 自然語言處理入門:使用Python和NLTK進(jìn)行文本預(yù)處理

    文章標(biāo)題:自然語言處理入門:使用Python和NLTK進(jìn)行文本預(yù)處理 簡介 自然語言處理(NLP)是人工智能領(lǐng)域的一個重要分支,它致力于使計算機(jī)能夠理解、分析和生成人類語言。本文將介紹如何使用Python編程語言和NLTK(Natural Language Toolkit)庫進(jìn)行文本預(yù)處理,為后續(xù)的文本分析

    2024年02月19日
    瀏覽(23)
  • 如何用python做自然語言處理

    如何用python做自然語言處理

    如何用python做自然語言處理 使用Python進(jìn)行自然語言處理(NLP)是非常常見和強(qiáng)大的。以下是一些基本步驟: 安裝所需的庫: 首先,您需要安裝一些用于自然語言處理的Python庫,如NLTK(自然語言工具包)、spaCy、TextBlob、gensim等。您可以使用 pip 命令來安裝它們,例如: pip

    2024年02月14日
    瀏覽(90)
  • 自然語言文本分類模型代碼

    ????????以下是一個基于PyTorch的文本分類模型的示例代碼,用于將給定的文本分為多個預(yù)定義類別: ????????該模型將輸入的文本作為整數(shù)序列傳遞給嵌入層,然后通過多層LSTM層進(jìn)行處理,最終輸出每個類別的預(yù)測概率。 ????????在訓(xùn)練模型之前,需要將文本序列

    2024年02月14日
    瀏覽(26)
  • 自然語言處理—文本分類綜述/什么是文本分類

    自然語言處理—文本分類綜述/什么是文本分類

    最近在學(xué)習(xí)文本分類,讀了很多博主的文章,要么已經(jīng)嚴(yán)重過時(還在一個勁介紹SVM、貝葉斯),要么就是機(jī)器翻譯的別人的英文論文,幾乎看遍全文,竟然沒有一篇能看的綜述,花了一個月時間,參考了很多文獻(xiàn),特此寫下此文。 https://www.processon.com/mindmap/61888043e401fd453a21e

    2023年04月08日
    瀏覽(31)
  • 自然語言之文本預(yù)處理

    自然語言之文本預(yù)處理

    概念 分詞就是將連續(xù)的字序列按照一定的規(guī)范重新組合成詞序列的過程。在英文的行文中,單詞之間是以空格作為自然分界符的,而中文只是字、句和段能通過明顯的分界符來簡單劃界,唯獨(dú)詞沒有一個形式上的分界符。分詞過程就是找到這樣分界符的過程. 作用 詞作為語言

    2024年02月06日
    瀏覽(28)
  • Python自然語言處理:NLTK入門指南

    自然語言處理(Natural Language Processing,NLP)是指計算機(jī)處理人類語言的領(lǐng)域。它是一門多學(xué)科交叉的學(xué)科,將計算機(jī)科學(xué)、人工智能、語言學(xué)等諸多學(xué)科的理論和方法融合在一起,將人類語言轉(zhuǎn)化為計算機(jī)所能理解的形式,實(shí)現(xiàn)對人類語言的自動處理、理解和生成。NLP可以應(yīng)

    2024年02月10日
    瀏覽(86)
  • 自然語言處理-文本表示: Embedding技術(shù)

    目錄 I. 引言 A. 文本表示介紹 B. 引入Embedding技術(shù)的重要性和應(yīng)用領(lǐng)域 II. 傳統(tǒng)文本表示方法 A. One-Hot編碼 B. 詞袋模型 C. TF-IDF III. 什么是文本表示-Embedding A. 定義和概念 B. Embedding的目標(biāo)和作用 IV. 常見Embedding技術(shù) A. Word2Vec 1. CBOW模型 2. Skip-gram模型 3. 結(jié)構(gòu)與訓(xùn)練方法 B. GloVe 1. 全局

    2024年02月16日
    瀏覽(94)
  • 【自然語言處理】實(shí)驗(yàn)3,文本情感分析

    【自然語言處理】實(shí)驗(yàn)3,文本情感分析

    清華大學(xué)馭風(fēng)計劃課程鏈接? 學(xué)堂在線 - 精品在線課程學(xué)習(xí)平臺 (xuetangx.com) 代碼和報告均為本人自己實(shí)現(xiàn)(實(shí)驗(yàn)滿分),只展示主要任務(wù)實(shí)驗(yàn)結(jié)果,如果需要詳細(xì)的實(shí)驗(yàn)報告或者代碼可以私聊博主 有任何疑問或者問題,也歡迎私信博主,大家可以相互討論交流喲~~ 情感分析

    2024年02月19日
    瀏覽(23)
  • 掌握NLTK:Python自然語言處理庫中級教程

    在之前的初級教程中,我們已經(jīng)了解了NLTK(Natural Language Toolkit)的基本用法,如進(jìn)行文本分詞、詞性標(biāo)注和停用詞移除等。在本篇中級教程中,我們將進(jìn)一步探索NLTK的更多功能,包括詞干提取、詞形還原、n-gram模型以及詞云的繪制。 詞干提取是一種將詞語簡化為其基本形式

    2024年02月14日
    瀏覽(93)
  • 深入NLTK:Python自然語言處理庫高級教程

    在前面的初級和中級教程中,我們了解了NLTK庫中的基本和進(jìn)階功能,如詞干提取、詞形還原、n-gram模型和詞云的繪制等。在本篇高級教程中,我們將深入探索NLTK的更多高級功能,包括句法解析、命名實(shí)體識別、情感分析以及文本分類。 句法解析是自然語言處理中的一項重要

    2024年02月14日
    瀏覽(100)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包