国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

python批量處理修改pdf內(nèi)容

2年前作者：EaSoNgo111分類：Toy博客閱讀(21)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了python批量處理修改pdf內(nèi)容。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

將PDF轉(zhuǎn)換為Word：
- 使用pdf2docx庫(kù)中的Converter類來(lái)進(jìn)行PDF轉(zhuǎn)換。
- convert_pdf_to_docx函數(shù)接受PDF文件路徑和輸出的Word文檔路徑作為參數(shù)。
- 通過(guò)調(diào)用Converter對(duì)象的convert方法將PDF轉(zhuǎn)換為Docx格式。
- 最后調(diào)用close方法關(guān)閉Converter對(duì)象并保存轉(zhuǎn)換后的文檔。
將Word轉(zhuǎn)換為Excel：
- 使用docx庫(kù)打開(kāi)Word文檔。
- 創(chuàng)建一個(gè)新的Excel文件。
- 遍歷Word文檔中的表格，逐行讀取表格內(nèi)容，并將其寫(xiě)入Excel文件。
- 使用openpyxl庫(kù)保存Excel文件。
替換Excel中的數(shù)據(jù)：
- 使用openpyxl庫(kù)加載輸入的Excel文件。
- 獲取原始數(shù)據(jù)，并復(fù)制一份用于替換。
- 遍歷替換數(shù)據(jù)的范圍，更新特定位置的數(shù)據(jù)。
- 創(chuàng)建新的Excel文件，更新數(shù)據(jù)并保存。
將Excel轉(zhuǎn)換為Word：
- 遍歷輸入文件夾下的所有Excel文件。
- 為每個(gè)Excel文件創(chuàng)建一個(gè)新的Word文檔。
- 打開(kāi)Excel文件并獲取活動(dòng)工作表。
- 在Word文檔中創(chuàng)建一個(gè)表格，并將Excel單元格數(shù)據(jù)寫(xiě)入表格。
- 調(diào)整表格樣式和單元格樣式，并保存Word文檔。
將Word轉(zhuǎn)換為PDF：
- 使用docx2pdf庫(kù)的convert函數(shù)將Word文檔轉(zhuǎn)換為PDF。
- 遍歷輸入文件夾下的所有Word文件，并將其轉(zhuǎn)換為PDF格式。
流程步驟

?①初始pdf python批量處理修改pdf內(nèi)容,開(kāi)發(fā)語(yǔ)言,python,pdf

?②變成word python批量處理修改pdf內(nèi)容,開(kāi)發(fā)語(yǔ)言,python,pdf

③變成excel python批量處理修改pdf內(nèi)容,開(kāi)發(fā)語(yǔ)言,python,pdf

④批量處理更換

⑤轉(zhuǎn)成word python批量處理修改pdf內(nèi)容,開(kāi)發(fā)語(yǔ)言,python,pdf

⑥轉(zhuǎn)成pdf python批量處理修改pdf內(nèi)容,開(kāi)發(fā)語(yǔ)言,python,pdf 文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-824225.html

#pdf 轉(zhuǎn) word
from pdf2docx import Converter

def convert_pdf_to_docx(pdf_path, docx_path):
    cv = Converter(pdf_path)
    cv.convert(docx_path, start=0, end=None)
    cv.close()

if __name__ == '__main__':
    pdf_path = 'C:/Users/wangkejun/Desktop/1/結(jié)果1.pdf'  # 輸入的 PDF 文件路徑
    docx_path = 'C:/Users/wangkejun/Desktop/1/結(jié)果2.docx' # 輸出的 Word 文檔路徑
    convert_pdf_to_docx(pdf_path, docx_path)
    print('轉(zhuǎn)換完成！')


# word 轉(zhuǎn) excel
import docx
from openpyxl import Workbook

# 打開(kāi) Word 文檔
doc = docx.Document(r'C:/Users/wangkejun/Desktop/1/結(jié)果2.docx')

# 創(chuàng)建一個(gè)新的 Excel 文件
workbook = Workbook()
sheet = workbook.active

# 遍歷 Word 文檔中的表格
for table in doc.tables:
    for row in table.rows:
        # 按行遍歷表格并將內(nèi)容寫(xiě)入 Excel 文件
        data = []
        for cell in row.cells:
            data.append(cell.text)
        sheet.append(data)

# 保存 Excel 文件
workbook.save(r'C:/Users/wangkejun/Desktop/1/結(jié)果3.xlsx')

import os
from openpyxl import load_workbook

def replace_data_in_excel(input_file, output_folder):
    # 加載輸入的 Excel 表
    wb = load_workbook(input_file)
    sheet = wb.active
    
    # 獲取原始數(shù)據(jù)
    data = []
    for row in sheet.iter_rows(values_only=True):
        data.append(list(row))
    
    # 替換數(shù)據(jù)
    for i in range(1, 39):
        # 復(fù)制原始數(shù)據(jù)
        new_data = [row[:] for row in data]
        # 替換特定位置的數(shù)據(jù)
        new_data[1][1] = f"{i}/38"
        
        # 創(chuàng)建新的 Excel 表
        new_wb = load_workbook(input_file)
        new_sheet = new_wb.active
        
        # 更新新的 Excel 表的數(shù)據(jù)
        new_sheet.delete_rows(1, new_sheet.max_row)
        for row in new_data:
            new_sheet.append(row)
        
        # 保存新的 Excel 表
        output_file = os.path.join(output_folder, f"{i}.xlsx")
        new_wb.save(output_file)
    
    print("生成完成！")

if __name__ == '__main__':
    input_file = r'C:/Users/wangkejun/Desktop/1/結(jié)果3.xlsx'  # 輸入的 Excel 表路徑
    output_folder = r'C:/Users/wangkejun/Desktop/1'  # 輸出的文件夾路徑
    
    replace_data_in_excel(input_file, output_folder)

#excel 轉(zhuǎn) word
import os
import openpyxl
from docx import Document
from docx.enum.table import WD_CELL_VERTICAL_ALIGNMENT, WD_ALIGN_VERTICAL

def convert_excel_to_word(input_folder, output_folder):
    # 遍歷輸入文件夾下的所有 Excel 文件
    for file_name in os.listdir(input_folder):
        if file_name.endswith('.xlsx') or file_name.endswith('.xls'):
            # 構(gòu)造輸出文件路徑
            output_file = os.path.join(output_folder, f"{file_name.split('.')[0]}.docx")
            
            # 創(chuàng)建一個(gè)新的 Word 文檔
            doc = Document()
            
            # 打開(kāi) Excel 文件
            file_path = os.path.join(input_folder, file_name)
            workbook = openpyxl.load_workbook(file_path)
            sheet = workbook.active
            
            # 在 Word 文檔中創(chuàng)建一個(gè)表格
            table = doc.add_table(rows=1, cols=sheet.max_column)
            table.autofit = False
            
            # 設(shè)置表格樣式
            table.style = 'Table Grid'
            
            # 將 Excel 單元格數(shù)據(jù)寫(xiě)入 Word 表格
            for row in sheet.iter_rows(values_only=True):
                new_row = table.add_row().cells
                for i, cell_value in enumerate(row):
                    new_row[i].text = str(cell_value)
            
            # 調(diào)整單元格樣式
            for row in table.rows:
                for cell in row.cells:
                    cell.vertical_alignment = WD_CELL_VERTICAL_ALIGNMENT.CENTER
                    cell.paragraphs[0].paragraph_format.alignment = WD_ALIGN_VERTICAL.CENTER
            
            # 保存 Word 文檔
            doc.save(output_file)
    
    print("轉(zhuǎn)換完成！")

if __name__ == '__main__':
    input_folder = r'C:/Users/wangkejun/Desktop/1/excel'  # 輸入的文件夾路徑
    output_folder = r'C:/Users/wangkejun/Desktop/1/word'  # 輸出的 Word 文件夾路徑
    
    convert_excel_to_word(input_folder, output_folder)


# #word 轉(zhuǎn) pdf
from docx2pdf import convert
import os

def batch_word_to_pdf(input_folder, output_folder):
    # 遍歷輸入文件夾下的所有 Word 文件
    for file_name in os.listdir(input_folder):
        if file_name.endswith('.docx'):
            # 構(gòu)造輸出文件路徑
            output_file = os.path.join(output_folder, f"{file_name.split('.')[0]}.pdf")
            
            # 調(diào)用 docx2pdf 庫(kù)的 convert 函數(shù)將 Word 文檔轉(zhuǎn)換為 PDF
            convert(os.path.join(input_folder, file_name), output_file)
    
    print("轉(zhuǎn)換完成！")

if __name__ == '__main__':
    input_folder = r'C:/Users/wangkejun/Desktop/1/word'  # 輸入的文件夾路徑
    output_folder = r'C:/Users/wangkejun/Desktop/1/pdf'  # 輸出的 PDF 文件夾路徑
    
    batch_word_to_pdf(input_folder, output_folder)

到了這里，關(guān)于python批量處理修改pdf內(nèi)容的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

【批量區(qū)域識(shí)別內(nèi)容重命名】批量識(shí)別圖片區(qū)域文字并重命名，批量圖片部分識(shí)別內(nèi)容重命文件，PDF區(qū)域識(shí)別提取重命名
我們?cè)诠ぷ骱蜕钪薪?jīng)常遇到這樣的需求：比如將以下的圖片區(qū)域識(shí)別進(jìn)行重命名，批量識(shí)別后改成以時(shí)間和工作內(nèi)容重命名，便于日后檢索，快速查詢首先我們拍攝照片用到的是水印相機(jī)，這里的文字呢我們需要加個(gè)背景，這樣在文字識(shí)別就很容易的被識(shí)別，準(zhǔn)確率也非常
2024年04月25日
瀏覽(28)
批量去除pdf每一頁(yè)相同未知的同樣的內(nèi)容
例如我想去除每一頁(yè)右下角的www.alevelcollege.com ①打開(kāi)acrobat pro ②編輯文件和圖像 ③ctrl+F輸入字符串www.alevelcollege.com替換為空 ④鼠標(biāo)點(diǎn)擊替換 ⑤回車鍵按下不放，會(huì)自動(dòng)翻頁(yè)，直到翻頁(yè)到最后一頁(yè)。
2024年02月06日
瀏覽(8)
PDF可以修改內(nèi)容嗎？有什么注意的事項(xiàng)？
PDF是一種跨平臺(tái)的電子文檔格式，可以在各種設(shè)備上輕松閱讀和共享。許多人喜歡將文檔轉(zhuǎn)換為PDF格式以確保格式的一致性和易讀性。但是，PDF文件一般被認(rèn)為是“只讀”文件，即無(wú)法編輯。那么，PDF文件是否可以修改呢？ ? 答案是肯定的。實(shí)際上，PDF文件可以被編輯和修改
2024年02月10日
瀏覽(25)
PDF 文檔處理：使用 Java 對(duì)比 PDF 找出內(nèi)容差異
不論是在團(tuán)隊(duì)寫(xiě)作還是在個(gè)人工作中，PDF 文檔往往會(huì)經(jīng)過(guò)多次修訂和更新。掌握 PDF 文檔內(nèi)容的變化對(duì)于管理文檔有極大的幫助。通過(guò)對(duì)比 PDF 文檔，用戶可以快速找出文檔增加、刪除和修改的內(nèi)容，更好地了解文檔的演變過(guò)程，輕松地管理文檔。本文將介紹如何通過(guò) Java 程
2024年02月08日
瀏覽(43)
R語(yǔ)言批量將PDF中表格，轉(zhuǎn)化為excel
您好！以下是使用R語(yǔ)言將PDF中的表格批量轉(zhuǎn)化為Excel的步驟： 1. 安裝必要的包您需要安裝`pdftools`和`tabulizer`包?？梢酝ㄟ^(guò)以下代碼來(lái)安裝它們： install.packages(\\\"pdftools\\\") install.packages(\\\"tabulizer\\\") ? 2. 設(shè)置工作目錄將包含PDF文件的文件夾設(shè)置為R的工作目錄?？梢允褂靡韵麓a來(lái)設(shè)
2024年02月11日
瀏覽(19)
SpringBoot+JPA實(shí)現(xiàn)批量處理新增、修改
jpa的sava與saveAll save()方法根據(jù)源碼我們可以看出來(lái)，save是先通過(guò)判斷這個(gè)對(duì)象是不是新的，新的便會(huì)新增，否則就是執(zhí)行的修改。整個(gè)是有分兩步進(jìn)行的，先查詢?cè)傩略?saveAll()方法 saveAll（）方法是一種更新多條的一種方式，里面?zhèn)鞯拇鎸?duì)象的集合。分析源碼我們可以看出
2024年02月09日
瀏覽(18)
【Python】Python 批量轉(zhuǎn)換PDF到Excel
PDF是面向展示和打印使用的，并未考慮編輯使用，所以缺少了很多編輯屬性且非常難修改PDF里面的數(shù)據(jù)。當(dāng)您需要分析或修改PDF文檔數(shù)據(jù)時(shí)，可以將PDF保存為Excel工作簿，實(shí)現(xiàn)輕松編輯數(shù)據(jù)的需求。PDF轉(zhuǎn)Excel，技術(shù)關(guān)鍵就是提取原文檔內(nèi)的表格數(shù)據(jù)，保證轉(zhuǎn)換前后數(shù)據(jù)的一致性
2024年02月04日
瀏覽(28)
使用Python批量將PDF轉(zhuǎn)Word
????????以下全部代碼無(wú)法完美對(duì)圖片、表格等非文字形式的內(nèi)容轉(zhuǎn)化。要較好的效果需要使用光學(xué)字符分析等方法進(jìn)行轉(zhuǎn)化 ? ? ? ? 我懶，不想將代碼模塊拆分出來(lái)寫(xiě)注釋 ? ? ? ? 除代碼1中有詳細(xì)注釋外，剩下的代碼僅在關(guān)鍵部分進(jìn)行注釋 ????????不使用線程，挨
2024年04月13日
瀏覽(22)
批處理批量替換文本內(nèi)容，用bat代碼全篇替換txt文本文件中指定字符信息
批處理批量全篇替換txt文本文件中指定字符信息，修改三個(gè)參數(shù)后即可使用，話不多說(shuō)直接上代碼： @echo off setlocal EnableDelayedExpansion set path_str=\\\"C:UsersAdministratorDesktop1.txt\\\" set old_str=需要替換的原文本內(nèi)容 set new_str=替換后的文本內(nèi)容 set souerce_path=%path_str% for /f \\\"tokens=1* delims=
2024年02月11日
瀏覽(15)
python小腳本——批量將PDF文件轉(zhuǎn)換成圖片
語(yǔ)言：python 3 用法：選擇PDF文件所在的目錄，點(diǎn)擊確定后，自動(dòng)將該目錄下的所有PDF 轉(zhuǎn)換成單個(gè)圖片，圖片名稱為: ? pdf文件名.page_序號(hào).jpg 如運(yùn)行中報(bào)錯(cuò)，需要自行根據(jù)報(bào)錯(cuò)內(nèi)容按照缺失的庫(kù) 例如：這里提供兩種源碼，第一種是在代碼中手動(dòng)添加pdf所在目錄第二種是點(diǎn)
2024年02月11日
瀏覽(27)