国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<th id="nribq"><progress id="nribq"><ul id="nribq"></ul></progress></th>

python辦公自動化（6）——讀取word文檔

2年前作者：數(shù)學ばか分類：Toy博客閱讀(21)違法舉報

這篇具有很好參考價值的文章主要介紹了python辦公自動化（6）——讀取word文檔。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

一、思路和基礎(chǔ)知識

因為我們要進行文件相關(guān)的操作，所以需要在一開始使用import導入Python內(nèi)置的os模塊。

我們需要先獲取該文件夾下所有的答題卡列表，再使用for循環(huán)遍歷文件夾中所有學生的答題卡，以便之后逐個讀取信息。
完成了第一個步驟，接下來，我們就需要在for循環(huán)里，依次獲取每位學生的班級、姓名、學號、選擇題分數(shù)和填空題分數(shù)。

面對總共三個班的學生，每位學生都有相對應(yīng)的五條信息，我們應(yīng)該如何在程序中存儲這些數(shù)據(jù)呢？我們可以在for循環(huán)內(nèi)，使用字典來存儲每位學生的信息。在這個字典中，我們用5個鍵（key）值（value）對來分別存儲學生的班級、姓名、學號、填空題成績和選擇題成績。鍵的名稱和對應(yīng)數(shù)據(jù)如圖所示。

確定使用字典來存儲每個學生的數(shù)據(jù)后，我們可以在for循環(huán)外，使用一個列表來匯總存儲所有學生的字典數(shù)據(jù)。如圖所示：列表中的每個元素就是一個裝了學生信息的字典。

# 使用import導入os模塊
import os

# 將喬老師的答題卡文件夾路徑 /Users/qiao/answerKey 賦值給變量allKeyPath
allKeyPath = "/Users/qiao/answerKey"
# 使用os.listdir()函數(shù)獲取該路徑下所有的文件，并賦值給變量allItems
allItems = os.listdir(allKeyPath)

# 定義一個空列表allStudentsData存儲所有學生數(shù)據(jù)
allStudentsData = []

# 使用for循環(huán)逐個遍歷所有學生答題卡
for item in allItems:
    # 定義一個空字典studentData存儲單個學生數(shù)據(jù)
    studentData = {
   }
    
    # 使用os.path.splitext()函數(shù)獲取文件名的前半段，并賦值給變量fileName
    fileName = os.path.splitext(item)[0]
    # 使用split()函數(shù)以"-"分隔文件名，將第1部分班級信息賦值到學生數(shù)據(jù)字典的classInfo鍵里
    studentData["classInfo"] = fileName.split("-")[0]
    # 使用split()函數(shù)以"-"分隔文件名，將第2部分姓名信息賦值到學生數(shù)據(jù)字典的name鍵里
    studentData["name"] = fileName.split("-")[1]

    # 使用append()函數(shù)將studentData添加到總學生數(shù)據(jù)allStudentsData中
    allStudentsData.append(studentData)
    
# 使用print輸出變量allStudentsData
print(allStudentsData)

剛剛我們已經(jīng)完成了前兩步，現(xiàn)在我們來完成第三步：確定答題卡中要讀取的信息位置。

在開始確定答題卡中要讀取的信息位置前，我們需要先學習一下Word文檔的基本結(jié)構(gòu)。
一個Word文件就是一個Word文檔（Document）。Word文檔（Document）的基本組成單位是段落（Paragraph）。標題、目錄、正文、圖形、空行都是段落。每個段落之中的內(nèi)容可以具有不同的樣式（Style）。常見的樣式有：字體、字形、字號、字體顏色、下劃線、刪除線、上標和下標等。連續(xù)具有相同樣式的基本單元可稱為一個樣式塊（run）。例如，圖中這一段話原本是同一個樣式塊。但在這個段落中加粗一個字，那么這個字就形成了一個樣式塊。并且這個加粗的字的左右兩邊都被切割成了新的樣式塊。這樣這句話就變成了三個樣式塊。沒有任何內(nèi)容的空行段落里沒有樣式塊。段落里只要有內(nèi)容就至少包含一個樣式塊。
python辦公自動化（6）——讀取word文檔

除了段落外，Word文檔中還能嵌入表格（Table）。表格和段落在Word文檔中屬于并列級別。也就是說表格不屬于任何段落，我們不能夠通過遍歷段落來獲取表格。

和Excel表格的結(jié)構(gòu)很相似，Word文檔中的表格也是由單元格（Cell）組成。單元格中的內(nèi)容可以包含段落和表格，相當于獨自構(gòu)成了一個完整的Word文檔。

和Excel表格的結(jié)構(gòu)很相似，Word文檔中的表格也是由單元格（Cell）組成。單元格中的內(nèi)容可以包含段落和表格，相當于獨自構(gòu)成了一個完整的Word文檔。

二、安裝docx

要使用Python對Word文檔進行讀取，我們需要安裝一個用于讀取數(shù)據(jù)的工具python-docx。

python-docx是一個用于創(chuàng)建和更新Word文檔的開源模塊。需要注意的是，該模塊只可讀取、寫入.docx文件，不支持.doc文件。

安裝python-docx非常簡單，在終端中輸入代碼：pip install python-docx即可。

如果在自己電腦上安裝不上或安裝緩慢，可在命令后添加如下配置進行加速：
pip install python-docx -i https://pypi.tuna.tsinghua.edu.cn/simple/

三、讀取doc文檔

在安裝和導入python-docx之后，讀取指定路徑下的Word文檔需要使用函數(shù)?文章來源地址http://www.zghlxwxcb.cn/news/detail-403366.html

到了這里，關(guān)于python辦公自動化（6）——讀取word文檔的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔相關(guān)法律責任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

怎么從休學證明中取出休學原因（python自動化辦公，涉及word和excel）
本代碼偏向處理高校教務(wù)處的工作休學或請假模板如下：需求說明：代碼如下：重要知識點補充
2024年02月07日
瀏覽(23)
python從小白到大師-第一章Python應(yīng)用（八）應(yīng)用領(lǐng)域與常見包-自動化辦公word
目錄一.python-docx 二.pypiwin32 Python-docx是一個用于創(chuàng)建、修改和讀取Microsoft Word文件（.docx）的Python庫。它提供了一組豐富的功能，使開發(fā)人員能夠使用Python生成自定義的Word文檔。以下是python-docx庫的一些主要特點和功能：創(chuàng)建和編輯Word文檔：可以使用python-docx庫創(chuàng)建新的Wor
2024年02月21日
瀏覽(20)
100天精通Python丨辦公效率篇 —— 12、Python自動化操作 office-word（word轉(zhuǎn)pdf、轉(zhuǎn)docx、段落、表格、標題、頁面、格式）
本文收錄于《100天精通Python專欄 - 快速入門到黑科技》專欄，是由 CSDN 內(nèi)容合伙人丨全站排名 Top 4 的硬核博主不吃西紅柿傾力打造。基礎(chǔ)知識篇以理論知識為主，旨在幫助沒有語言基礎(chǔ)的小伙伴，學習我整理成體系的精華知識，快速入門構(gòu)建起知識框架；黑科技應(yīng)用篇
2023年04月18日
瀏覽(41)
Python操作Word：輕松實現(xiàn)文檔的創(chuàng)建、編輯與自動化處理
引言：在日常工作和學習中，我們經(jīng)常需要使用Microsoft Word來創(chuàng)建、編輯和處理文檔。然而，手動操作Word可能會耗費大量的時間和精力。為了提高工作效率，我們可以使用Python編程語言來操作Word文檔，實現(xiàn)文檔的自動化處理。本文將詳細介紹如何使用Python操作Word，包括創(chuàng)建
2024年01月21日
瀏覽(21)
Word、Excel、PPT題庫——“辦公自動化”
小雅蘭期末加油沖沖沖?。?！ 1. 【單選題】下列文件擴展名,不屬于Word模板文件的是（ A ）。 A. .DOCX B. .DOTM C. .DOTX D. .DOT 本題的考查點是word基本知識的了解。 ? ? .DOCX：word文檔。 ? ? .DOTM：啟用宏的word模板。 ? ? .DOTX：word模板。 ? ? .DOT：word 97-2003模板。 ? ? 故本題答案為
2024年02月07日
瀏覽(25)
python自動化操作：批量處理照片尺寸并輸出到word文檔中【第14篇—python-照片尺寸批量處理輸出】
在當今數(shù)字化時代，照片處理和文檔編輯是許多領(lǐng)域中不可或缺的任務(wù)。從個人創(chuàng)作到企業(yè)文檔，人們經(jīng)常需要快速而有效地處理大量照片，并將它們整合到文檔中。Python作為一種強大而靈活的編程語言，為自動化這一過程提供了理想的平臺。這篇文章將探討如何使用Pytho
2024年02月05日
瀏覽(26)
[bat]0基礎(chǔ)實現(xiàn)自動化辦公-基于start實現(xiàn)一鍵打開常用軟件/文檔
每次開機時，都要一個個打開常用軟件，比如微信、QQ或是word文檔、excel表格等程序，比較費時。使用bat腳本中的start方法，通過將需要打開的程序或文件寫入到bat腳本中，運行bat腳本從而實現(xiàn)一鍵批量打開常用軟件。通過前文已實現(xiàn)了新建一個可運行的bat腳本，現(xiàn)在我們只
2024年01月19日
瀏覽(21)
Python辦公自動化 – 自動化清理數(shù)據(jù)和自動化系統(tǒng)命令
以下是往期的文章目錄，需要可以查看哦。 Python辦公自動化 – Excel和Word的操作運用 Python辦公自動化 – Python發(fā)送電子郵件和Outlook的集成 Python辦公自動化 – 對PDF文檔和PPT文檔的處理 Python辦公自動化 – 對Excel文檔和數(shù)據(jù)庫的操作運用、設(shè)置計劃任務(wù) Python辦公自動化 – 對
2024年02月01日
瀏覽(26)
python實現(xiàn)辦公自動化
目錄一 python辦公自動化所需類庫二 python操作excel文件三 python自動發(fā)送郵件四 python操作word文件五 python操作PPT文件一 python辦公自動化所需類庫 python操作excel、word、ppt所需庫如下，二 python操作excel文件三 python自動發(fā)送郵件四 python操作word文件五 python操作PPT文件
2024年02月05日
瀏覽(23)
Python&Excel辦公自動化
操作工作簿 01 新建一個excel工作簿 02 批量新建多個工作簿 03 打開已有的工作簿 04 打開文件夾下的所有工作簿 05 重命名多個工作簿 06 批量修改工作簿格式 07 拆分一個工作簿變成多個新工作簿 08 將多個工作簿合并為一個工作簿 09 按照擴展名分類工作簿 10 按照日期分類工作簿
2024年02月08日
瀏覽(23)

<big id="2dxmp"></big>