国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

python批量處理修改pdf內(nèi)容

這篇具有很好參考價(jià)值的文章主要介紹了python批量處理修改pdf內(nèi)容。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

?

  1. 將PDF轉(zhuǎn)換為Word:

    • 使用pdf2docx庫(kù)中的Converter類來(lái)進(jìn)行PDF轉(zhuǎn)換。
    • convert_pdf_to_docx函數(shù)接受PDF文件路徑和輸出的Word文檔路徑作為參數(shù)。
    • 通過(guò)調(diào)用Converter對(duì)象的convert方法將PDF轉(zhuǎn)換為Docx格式。
    • 最后調(diào)用close方法關(guān)閉Converter對(duì)象并保存轉(zhuǎn)換后的文檔。
  2. 將Word轉(zhuǎn)換為Excel:

    • 使用docx庫(kù)打開(kāi)Word文檔。
    • 創(chuàng)建一個(gè)新的Excel文件。
    • 遍歷Word文檔中的表格,逐行讀取表格內(nèi)容,并將其寫(xiě)入Excel文件。
    • 使用openpyxl庫(kù)保存Excel文件。
  3. 替換Excel中的數(shù)據(jù):

    • 使用openpyxl庫(kù)加載輸入的Excel文件。
    • 獲取原始數(shù)據(jù),并復(fù)制一份用于替換。
    • 遍歷替換數(shù)據(jù)的范圍,更新特定位置的數(shù)據(jù)。
    • 創(chuàng)建新的Excel文件,更新數(shù)據(jù)并保存。
  4. 將Excel轉(zhuǎn)換為Word:

    • 遍歷輸入文件夾下的所有Excel文件。
    • 為每個(gè)Excel文件創(chuàng)建一個(gè)新的Word文檔。
    • 打開(kāi)Excel文件并獲取活動(dòng)工作表。
    • 在Word文檔中創(chuàng)建一個(gè)表格,并將Excel單元格數(shù)據(jù)寫(xiě)入表格。
    • 調(diào)整表格樣式和單元格樣式,并保存Word文檔。
  5. 將Word轉(zhuǎn)換為PDF:

    • 使用docx2pdf庫(kù)的convert函數(shù)將Word文檔轉(zhuǎn)換為PDF。
    • 遍歷輸入文件夾下的所有Word文件,并將其轉(zhuǎn)換為PDF格式。
  6. 流程步驟

?①初始pdfpython批量處理修改pdf內(nèi)容,開(kāi)發(fā)語(yǔ)言,python,pdf

?②變成wordpython批量處理修改pdf內(nèi)容,開(kāi)發(fā)語(yǔ)言,python,pdf

③變成excelpython批量處理修改pdf內(nèi)容,開(kāi)發(fā)語(yǔ)言,python,pdf

④批量處理更換

⑤轉(zhuǎn)成wordpython批量處理修改pdf內(nèi)容,開(kāi)發(fā)語(yǔ)言,python,pdf

⑥轉(zhuǎn)成pdfpython批量處理修改pdf內(nèi)容,開(kāi)發(fā)語(yǔ)言,python,pdf文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-824225.html

#pdf 轉(zhuǎn) word
from pdf2docx import Converter

def convert_pdf_to_docx(pdf_path, docx_path):
    cv = Converter(pdf_path)
    cv.convert(docx_path, start=0, end=None)
    cv.close()

if __name__ == '__main__':
    pdf_path = 'C:/Users/wangkejun/Desktop/1/結(jié)果1.pdf'  # 輸入的 PDF 文件路徑
    docx_path = 'C:/Users/wangkejun/Desktop/1/結(jié)果2.docx' # 輸出的 Word 文檔路徑
    convert_pdf_to_docx(pdf_path, docx_path)
    print('轉(zhuǎn)換完成!')


# word 轉(zhuǎn) excel
import docx
from openpyxl import Workbook

# 打開(kāi) Word 文檔
doc = docx.Document(r'C:/Users/wangkejun/Desktop/1/結(jié)果2.docx')

# 創(chuàng)建一個(gè)新的 Excel 文件
workbook = Workbook()
sheet = workbook.active

# 遍歷 Word 文檔中的表格
for table in doc.tables:
    for row in table.rows:
        # 按行遍歷表格并將內(nèi)容寫(xiě)入 Excel 文件
        data = []
        for cell in row.cells:
            data.append(cell.text)
        sheet.append(data)

# 保存 Excel 文件
workbook.save(r'C:/Users/wangkejun/Desktop/1/結(jié)果3.xlsx')

import os
from openpyxl import load_workbook

def replace_data_in_excel(input_file, output_folder):
    # 加載輸入的 Excel 表
    wb = load_workbook(input_file)
    sheet = wb.active
    
    # 獲取原始數(shù)據(jù)
    data = []
    for row in sheet.iter_rows(values_only=True):
        data.append(list(row))
    
    # 替換數(shù)據(jù)
    for i in range(1, 39):
        # 復(fù)制原始數(shù)據(jù)
        new_data = [row[:] for row in data]
        # 替換特定位置的數(shù)據(jù)
        new_data[1][1] = f"{i}/38"
        
        # 創(chuàng)建新的 Excel 表
        new_wb = load_workbook(input_file)
        new_sheet = new_wb.active
        
        # 更新新的 Excel 表的數(shù)據(jù)
        new_sheet.delete_rows(1, new_sheet.max_row)
        for row in new_data:
            new_sheet.append(row)
        
        # 保存新的 Excel 表
        output_file = os.path.join(output_folder, f"{i}.xlsx")
        new_wb.save(output_file)
    
    print("生成完成!")

if __name__ == '__main__':
    input_file = r'C:/Users/wangkejun/Desktop/1/結(jié)果3.xlsx'  # 輸入的 Excel 表路徑
    output_folder = r'C:/Users/wangkejun/Desktop/1'  # 輸出的文件夾路徑
    
    replace_data_in_excel(input_file, output_folder)

#excel 轉(zhuǎn) word
import os
import openpyxl
from docx import Document
from docx.enum.table import WD_CELL_VERTICAL_ALIGNMENT, WD_ALIGN_VERTICAL

def convert_excel_to_word(input_folder, output_folder):
    # 遍歷輸入文件夾下的所有 Excel 文件
    for file_name in os.listdir(input_folder):
        if file_name.endswith('.xlsx') or file_name.endswith('.xls'):
            # 構(gòu)造輸出文件路徑
            output_file = os.path.join(output_folder, f"{file_name.split('.')[0]}.docx")
            
            # 創(chuàng)建一個(gè)新的 Word 文檔
            doc = Document()
            
            # 打開(kāi) Excel 文件
            file_path = os.path.join(input_folder, file_name)
            workbook = openpyxl.load_workbook(file_path)
            sheet = workbook.active
            
            # 在 Word 文檔中創(chuàng)建一個(gè)表格
            table = doc.add_table(rows=1, cols=sheet.max_column)
            table.autofit = False
            
            # 設(shè)置表格樣式
            table.style = 'Table Grid'
            
            # 將 Excel 單元格數(shù)據(jù)寫(xiě)入 Word 表格
            for row in sheet.iter_rows(values_only=True):
                new_row = table.add_row().cells
                for i, cell_value in enumerate(row):
                    new_row[i].text = str(cell_value)
            
            # 調(diào)整單元格樣式
            for row in table.rows:
                for cell in row.cells:
                    cell.vertical_alignment = WD_CELL_VERTICAL_ALIGNMENT.CENTER
                    cell.paragraphs[0].paragraph_format.alignment = WD_ALIGN_VERTICAL.CENTER
            
            # 保存 Word 文檔
            doc.save(output_file)
    
    print("轉(zhuǎn)換完成!")

if __name__ == '__main__':
    input_folder = r'C:/Users/wangkejun/Desktop/1/excel'  # 輸入的文件夾路徑
    output_folder = r'C:/Users/wangkejun/Desktop/1/word'  # 輸出的 Word 文件夾路徑
    
    convert_excel_to_word(input_folder, output_folder)


# #word 轉(zhuǎn) pdf
from docx2pdf import convert
import os

def batch_word_to_pdf(input_folder, output_folder):
    # 遍歷輸入文件夾下的所有 Word 文件
    for file_name in os.listdir(input_folder):
        if file_name.endswith('.docx'):
            # 構(gòu)造輸出文件路徑
            output_file = os.path.join(output_folder, f"{file_name.split('.')[0]}.pdf")
            
            # 調(diào)用 docx2pdf 庫(kù)的 convert 函數(shù)將 Word 文檔轉(zhuǎn)換為 PDF
            convert(os.path.join(input_folder, file_name), output_file)
    
    print("轉(zhuǎn)換完成!")

if __name__ == '__main__':
    input_folder = r'C:/Users/wangkejun/Desktop/1/word'  # 輸入的文件夾路徑
    output_folder = r'C:/Users/wangkejun/Desktop/1/pdf'  # 輸出的 PDF 文件夾路徑
    
    batch_word_to_pdf(input_folder, output_folder)

到了這里,關(guān)于python批量處理修改pdf內(nèi)容的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 【批量區(qū)域識(shí)別內(nèi)容重命名】批量識(shí)別圖片區(qū)域文字并重命名,批量圖片部分識(shí)別內(nèi)容重命文件,PDF區(qū)域識(shí)別提取重命名

    【批量區(qū)域識(shí)別內(nèi)容重命名】批量識(shí)別圖片區(qū)域文字并重命名,批量圖片部分識(shí)別內(nèi)容重命文件,PDF區(qū)域識(shí)別提取重命名

    我們?cè)诠ぷ骱蜕钪薪?jīng)常遇到這樣的需求:比如將以下的圖片區(qū)域識(shí)別進(jìn)行重命名,批量識(shí)別后改成以時(shí)間和工作內(nèi)容重命名,便于日后檢索,快速查詢 首先我們拍攝照片用到的是水印相機(jī),這里的文字呢我們需要加個(gè)背景,這樣在文字識(shí)別就很容易的被識(shí)別,準(zhǔn)確率也非常

    2024年04月25日
    瀏覽(28)
  • 批量去除pdf每一頁(yè)相同未知的同樣的內(nèi)容

    批量去除pdf每一頁(yè)相同未知的同樣的內(nèi)容

    例如我想去除每一頁(yè)右下角的www.alevelcollege.com ①打開(kāi)acrobat pro ②編輯文件和圖像 ③ctrl+F輸入字符串www.alevelcollege.com替換為空 ④鼠標(biāo)點(diǎn)擊替換 ⑤回車鍵按下不放,會(huì)自動(dòng)翻頁(yè),直到翻頁(yè)到最后一頁(yè)。

    2024年02月06日
    瀏覽(8)
  • PDF可以修改內(nèi)容嗎?有什么注意的事項(xiàng)?

    PDF可以修改內(nèi)容嗎?有什么注意的事項(xiàng)?

    PDF是一種跨平臺(tái)的電子文檔格式,可以在各種設(shè)備上輕松閱讀和共享。許多人喜歡將文檔轉(zhuǎn)換為PDF格式以確保格式的一致性和易讀性。但是,PDF文件一般被認(rèn)為是“只讀”文件,即無(wú)法編輯。那么,PDF文件是否可以修改呢? ? 答案是肯定的。實(shí)際上,PDF文件可以被編輯和修改

    2024年02月10日
    瀏覽(25)
  • PDF 文檔處理:使用 Java 對(duì)比 PDF 找出內(nèi)容差異

    PDF 文檔處理:使用 Java 對(duì)比 PDF 找出內(nèi)容差異

    不論是在團(tuán)隊(duì)寫(xiě)作還是在個(gè)人工作中,PDF 文檔往往會(huì)經(jīng)過(guò)多次修訂和更新。掌握 PDF 文檔內(nèi)容的變化對(duì)于管理文檔有極大的幫助。通過(guò)對(duì)比 PDF 文檔,用戶可以快速找出文檔增加、刪除和修改的內(nèi)容,更好地了解文檔的演變過(guò)程,輕松地管理文檔。本文將介紹如何通過(guò) Java 程

    2024年02月08日
    瀏覽(43)
  • R語(yǔ)言批量將PDF中表格,轉(zhuǎn)化為excel

    您好!以下是使用R語(yǔ)言將PDF中的表格批量轉(zhuǎn)化為Excel的步驟: 1. 安裝必要的包 您需要安裝`pdftools`和`tabulizer`包??梢酝ㄟ^(guò)以下代碼來(lái)安裝它們: install.packages(\\\"pdftools\\\") install.packages(\\\"tabulizer\\\") ? 2. 設(shè)置工作目錄 將包含PDF文件的文件夾設(shè)置為R的工作目錄??梢允褂靡韵麓a來(lái)設(shè)

    2024年02月11日
    瀏覽(19)
  • SpringBoot+JPA實(shí)現(xiàn)批量處理新增、修改

    jpa的sava與saveAll save()方法 根據(jù)源碼我們可以看出來(lái),save是先通過(guò)判斷這個(gè)對(duì)象是不是新的,新的便會(huì)新增,否則就是執(zhí)行的修改。整個(gè)是有分兩步進(jìn)行的,先查詢?cè)傩略?saveAll()方法 saveAll()方法是一種更新多條的一種方式,里面?zhèn)鞯拇鎸?duì)象的集合。分析源碼我們可以看出

    2024年02月09日
    瀏覽(18)
  • 【Python】Python 批量轉(zhuǎn)換PDF到Excel

    PDF是面向展示和打印使用的,并未考慮編輯使用,所以缺少了很多編輯屬性且非常難修改PDF里面的數(shù)據(jù)。當(dāng)您需要分析或修改PDF文檔數(shù)據(jù)時(shí),可以將PDF保存為Excel工作簿,實(shí)現(xiàn)輕松編輯數(shù)據(jù)的需求。PDF轉(zhuǎn)Excel,技術(shù)關(guān)鍵就是提取原文檔內(nèi)的表格數(shù)據(jù),保證轉(zhuǎn)換前后數(shù)據(jù)的一致性

    2024年02月04日
    瀏覽(28)
  • 使用Python批量將PDF轉(zhuǎn)Word

    使用Python批量將PDF轉(zhuǎn)Word

    ????????以下全部代碼無(wú)法完美對(duì)圖片、表格等非文字形式的內(nèi)容轉(zhuǎn)化。要較好的效果需要使用光學(xué)字符分析等方法進(jìn)行轉(zhuǎn)化 ? ? ? ? 我懶,不想將代碼模塊拆分出來(lái)寫(xiě)注釋 ? ? ? ? 除代碼1中有詳細(xì)注釋外,剩下的代碼僅在關(guān)鍵部分進(jìn)行注釋 ????????不使用線程,挨

    2024年04月13日
    瀏覽(22)
  • 批處理批量替換文本內(nèi)容,用bat代碼全篇替換txt文本文件中指定字符信息

    批處理批量全篇替換txt文本文件中指定字符信息,修改三個(gè)參數(shù)后即可使用,話不多說(shuō)直接上代碼: @echo off setlocal EnableDelayedExpansion set path_str=\\\"C:UsersAdministratorDesktop1.txt\\\" set old_str=需要替換的原文本內(nèi)容 set new_str=替換后的文本內(nèi)容 set souerce_path=%path_str% for /f \\\"tokens=1* delims=

    2024年02月11日
    瀏覽(15)
  • python小腳本——批量將PDF文件轉(zhuǎn)換成圖片

    語(yǔ)言:python 3 用法:選擇PDF文件所在的目錄,點(diǎn)擊 確定 后,自動(dòng)將 該目錄下的所有PDF 轉(zhuǎn)換成單個(gè)圖片,圖片名稱為: ? pdf文件名.page_序號(hào).jpg 如運(yùn)行中報(bào)錯(cuò),需要自行根據(jù)報(bào)錯(cuò)內(nèi)容按照缺失的庫(kù) 例如: 這里提供兩種源碼,第一種是在代碼中手動(dòng)添加pdf所在目錄 第二種是點(diǎn)

    2024年02月11日
    瀏覽(27)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包