国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

python辦公自動化(6)——讀取word文檔

這篇具有很好參考價值的文章主要介紹了python辦公自動化(6)——讀取word文檔。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

一、思路和基礎(chǔ)知識

因為我們要進行文件相關(guān)的操作,所以需要在一開始使用import導入Python內(nèi)置的os模塊。

我們需要先獲取該文件夾下所有的答題卡列表,再使用for循環(huán)遍歷文件夾中所有學生的答題卡,以便之后逐個讀取信息。
完成了第一個步驟,接下來,我們就需要在for循環(huán)里,依次獲取每位學生的班級、姓名、學號、選擇題分數(shù)和填空題分數(shù)。

面對總共三個班的學生,每位學生都有相對應(yīng)的五條信息,我們應(yīng)該如何在程序中存儲這些數(shù)據(jù)呢?我們可以在for循環(huán)內(nèi),使用字典來存儲每位學生的信息。在這個字典中,我們用5個鍵(key)值(value)對來分別存儲學生的班級、姓名、學號、填空題成績和選擇題成績。鍵的名稱和對應(yīng)數(shù)據(jù)如圖所示。

確定使用字典來存儲每個學生的數(shù)據(jù)后,我們可以在for循環(huán)外,使用一個列表來匯總存儲所有學生的字典數(shù)據(jù)。如圖所示:列表中的每個元素就是一個裝了學生信息的字典。

# 使用import導入os模塊
import os

# 將喬老師的答題卡文件夾路徑 /Users/qiao/answerKey 賦值給變量allKeyPath
allKeyPath = "/Users/qiao/answerKey"
# 使用os.listdir()函數(shù)獲取該路徑下所有的文件,并賦值給變量allItems
allItems = os.listdir(allKeyPath)

# 定義一個空列表allStudentsData存儲所有學生數(shù)據(jù)
allStudentsData = []

# 使用for循環(huán)逐個遍歷所有學生答題卡
for item in allItems:
    # 定義一個空字典studentData存儲單個學生數(shù)據(jù)
    studentData = {
   }
    
    # 使用os.path.splitext()函數(shù)獲取文件名的前半段,并賦值給變量fileName
    fileName = os.path.splitext(item)[0]
    # 使用split()函數(shù)以"-"分隔文件名,將第1部分班級信息賦值到學生數(shù)據(jù)字典的classInfo鍵里
    studentData["classInfo"] = fileName.split("-")[0]
    # 使用split()函數(shù)以"-"分隔文件名,將第2部分姓名信息賦值到學生數(shù)據(jù)字典的name鍵里
    studentData["name"] = fileName.split("-")[1]

    # 使用append()函數(shù)將studentData添加到總學生數(shù)據(jù)allStudentsData中
    allStudentsData.append(studentData)
    
# 使用print輸出變量allStudentsData
print(allStudentsData)

剛剛我們已經(jīng)完成了前兩步,現(xiàn)在我們來完成第三步:確定答題卡中要讀取的信息位置。

在開始確定答題卡中要讀取的信息位置前,我們需要先學習一下Word文檔的基本結(jié)構(gòu)。
一個Word文件就是一個Word文檔(Document)。Word文檔(Document)的基本組成單位是段落(Paragraph)。標題、目錄、正文、圖形、空行都是段落。每個段落之中的內(nèi)容可以具有不同的樣式(Style)。常見的樣式有:字體、字形、字號、字體顏色、下劃線、刪除線、上標和下標等。連續(xù)具有相同樣式的基本單元可稱為一個樣式塊(run)。 例如,圖中這一段話原本是同一個樣式塊。但在這個段落中加粗一個字,那么這個字就形成了一個樣式塊。并且這個加粗的字的左右兩邊都被切割成了新的樣式塊。這樣這句話就變成了三個樣式塊。 沒有任何內(nèi)容的空行段落里沒有樣式塊。段落里只要有內(nèi)容就至少包含一個樣式塊。
python辦公自動化(6)——讀取word文檔

除了段落外,Word文檔中還能嵌入表格(Table)。表格和段落在Word文檔中屬于并列級別。也就是說表格不屬于任何段落,我們不能夠通過遍歷段落來獲取表格。

和Excel表格的結(jié)構(gòu)很相似,Word文檔中的表格也是由單元格(Cell)組成。 單元格中的內(nèi)容可以包含段落和表格,相當于獨自構(gòu)成了一個完整的Word文檔。

和Excel表格的結(jié)構(gòu)很相似,Word文檔中的表格也是由單元格(Cell)組成。 單元格中的內(nèi)容可以包含段落和表格,相當于獨自構(gòu)成了一個完整的Word文檔。

二、安裝docx

要使用Python對Word文檔進行讀取,我們需要安裝一個用于讀取數(shù)據(jù)的工具python-docx。

python-docx是一個用于創(chuàng)建和更新Word文檔的開源模塊。需要注意的是,該模塊只可讀取、寫入.docx文件,不支持.doc文件。

安裝python-docx非常簡單,在終端中輸入代碼:pip install python-docx即可。

如果在自己電腦上安裝不上或安裝緩慢,可在命令后添加如下配置進行加速:
pip install python-docx -i https://pypi.tuna.tsinghua.edu.cn/simple/

三、讀取doc文檔

在安裝和導入python-docx之后,讀取指定路徑下的Word文檔需要使用函數(shù)?文章來源地址http://www.zghlxwxcb.cn/news/detail-403366.html

到了這里,關(guān)于python辦公自動化(6)——讀取word文檔的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔相關(guān)法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 怎么從休學證明中取出休學原因(python自動化辦公,涉及word和excel)

    本代碼偏向處理高校教務(wù)處的工作 休學或請假模板如下: 需求說明: 代碼如下: 重要知識點補充

    2024年02月07日
    瀏覽(23)
  • python從小白到大師-第一章Python應(yīng)用(八)應(yīng)用領(lǐng)域與常見包-自動化辦公word

    目錄 一.python-docx 二.pypiwin32 Python-docx是一個用于創(chuàng)建、修改和讀取Microsoft Word文件(.docx)的Python庫。它提供了一組豐富的功能,使開發(fā)人員能夠使用Python生成自定義的Word文檔。 以下是python-docx庫的一些主要特點和功能: 創(chuàng)建和編輯Word文檔:可以使用python-docx庫創(chuàng)建新的Wor

    2024年02月21日
    瀏覽(20)
  • 100天精通Python丨辦公效率篇 —— 12、Python自動化操作 office-word(word轉(zhuǎn)pdf、轉(zhuǎn)docx、段落、表格、標題、頁面、格式)

    100天精通Python丨辦公效率篇 —— 12、Python自動化操作 office-word(word轉(zhuǎn)pdf、轉(zhuǎn)docx、段落、表格、標題、頁面、格式)

    本文收錄于 《100天精通Python專欄 - 快速入門到黑科技》專欄 ,是由 CSDN 內(nèi)容合伙人丨全站排名 Top 4 的硬核博主 不吃西紅柿 傾力打造。 基礎(chǔ)知識篇以理論知識為主 ,旨在幫助沒有語言基礎(chǔ)的小伙伴,學習我整理成體系的精華知識,快速入門構(gòu)建起知識框架; 黑科技應(yīng)用篇

    2023年04月18日
    瀏覽(41)
  • Python操作Word:輕松實現(xiàn)文檔的創(chuàng)建、編輯與自動化處理

    引言: 在日常工作和學習中,我們經(jīng)常需要使用Microsoft Word來創(chuàng)建、編輯和處理文檔。然而,手動操作Word可能會耗費大量的時間和精力。為了提高工作效率,我們可以使用Python編程語言來操作Word文檔,實現(xiàn)文檔的自動化處理。本文將詳細介紹如何使用Python操作Word,包括創(chuàng)建

    2024年01月21日
    瀏覽(21)
  • Word、Excel、PPT題庫——“辦公自動化”

    Word、Excel、PPT題庫——“辦公自動化”

    小雅蘭期末加油沖沖沖?。?! 1. 【單選題】下列文件擴展名,不屬于Word模板文件的是( A )。 A. .DOCX B. .DOTM C. .DOTX D. .DOT 本題的考查點是word基本知識的了解。 ? ? .DOCX:word文檔。 ? ? .DOTM:啟用宏的word模板。 ? ? .DOTX:word模板。 ? ? .DOT:word 97-2003模板。 ? ? 故本題答案為

    2024年02月07日
    瀏覽(25)
  • python自動化操作:批量處理照片尺寸并輸出到word文檔中【第14篇—python-照片尺寸批量處理輸出】

    python自動化操作:批量處理照片尺寸并輸出到word文檔中【第14篇—python-照片尺寸批量處理輸出】

    在當今數(shù)字化時代,照片處理和文檔編輯是許多領(lǐng)域中不可或缺的任務(wù)。從個人創(chuàng)作到企業(yè)文檔,人們經(jīng)常需要快速而有效地處理大量照片,并將它們整合到文檔中。Python作為一種強大而靈活的編程語言,為自動化這一過程提供了理想的平臺。 這篇文章將探討如何使用Pytho

    2024年02月05日
    瀏覽(26)
  • [bat]0基礎(chǔ)實現(xiàn)自動化辦公-基于start實現(xiàn)一鍵打開常用軟件/文檔

    [bat]0基礎(chǔ)實現(xiàn)自動化辦公-基于start實現(xiàn)一鍵打開常用軟件/文檔

    每次開機時,都要一個個打開常用軟件,比如微信、QQ或是word文檔、excel表格等程序,比較費時。 使用bat腳本中的start方法,通過將需要打開的程序或文件寫入到bat腳本中,運行bat腳本從而實現(xiàn)一鍵批量打開常用軟件。 通過前文已實現(xiàn)了新建一個可運行的bat腳本,現(xiàn)在我們只

    2024年01月19日
    瀏覽(21)
  • Python辦公自動化 – 自動化清理數(shù)據(jù)和自動化系統(tǒng)命令

    Python辦公自動化 – 自動化清理數(shù)據(jù)和自動化系統(tǒng)命令

    以下是往期的文章目錄,需要可以查看哦。 Python辦公自動化 – Excel和Word的操作運用 Python辦公自動化 – Python發(fā)送電子郵件和Outlook的集成 Python辦公自動化 – 對PDF文檔和PPT文檔的處理 Python辦公自動化 – 對Excel文檔和數(shù)據(jù)庫的操作運用、設(shè)置計劃任務(wù) Python辦公自動化 – 對

    2024年02月01日
    瀏覽(26)
  • python實現(xiàn)辦公自動化

    目錄 一 python辦公自動化所需類庫 二 python操作excel文件 三 python自動發(fā)送郵件 四 python操作word文件 五 python操作PPT文件 一 python辦公自動化所需類庫 python操作excel、word、ppt所需庫如下, 二 python操作excel文件 三 python自動發(fā)送郵件 四 python操作word文件 五 python操作PPT文件

    2024年02月05日
    瀏覽(23)
  • Python&Excel辦公自動化

    操作工作簿 01 新建一個excel工作簿 02 批量新建多個工作簿 03 打開已有的工作簿 04 打開文件夾下的所有工作簿 05 重命名多個工作簿 06 批量修改工作簿格式 07 拆分一個工作簿變成多個新工作簿 08 將多個工作簿合并為一個工作簿 09 按照擴展名分類工作簿 10 按照日期分類工作簿

    2024年02月08日
    瀏覽(23)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包