国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Python自動化小技巧23——PDF文件拆分為單獨頁面(PyMuPDF)

這篇具有很好參考價值的文章主要介紹了Python自動化小技巧23——PDF文件拆分為單獨頁面(PyMuPDF)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

其實編輯PDF用Adobe就行,它功能超級齊全,可是這玩意要收費...去弄免費破解版,找資源又得半天,所以用python來拆分PDF文件吧,可以批量化處理。

至于為什么不用WPS.....別問,問就是不想開會員。


腳本代碼

先安裝PyMuPDF庫,

pip install PyMuPDF

代碼:?

import fitz  # PyMuPDF

def split_pdf(input_pdf, output_folder):
    pdf_document = fitz.open(input_pdf)
    
    for page_num in range(pdf_document.page_count):
        page = pdf_document[page_num]
        
        # 構(gòu)建輸出文件名,以頁數(shù)命名
        output_pdf = f"{output_folder}/Page_{page_num + 1}.pdf"
        
        # 創(chuàng)建一個新的Document對象,包含當前頁面
        new_pdf = fitz.open()
        new_pdf.insert_pdf(pdf_document, from_page=page_num, to_page=page_num)
        
        # 保存單獨的PDF文件
        new_pdf.save(output_pdf)
        new_pdf.close()
    
    pdf_document.close()

if __name__ == "__main__":
    input_pdf = "157-GGCG[2021]157成套門--武漢******有限公司356996.80.pdf"  
    output_folder = "C:\\Users\\cx\\Desktop\\pdf"  
    split_pdf(input_pdf, output_folder)

把輸入路徑和輸出路徑都改一下就行了,整個PDF就會被拆分為一頁一頁的單獨的文件。

如果只需要某一頁的話,按照文件名拿出來就行。

需要某些面的話,按照PyMuPDF的語法改就行。


其他用法:

PyMuPDF(也稱為fitz)是一個強大的Python庫,用于處理PDF文件。除了拆分PDF文件,它還提供了許多其他常用的方法和功能。以下是一些常見的PyMuPDF方法和用法示例:

  1. 提取文本內(nèi)容

    使用get_page_text方法可以提取PDF頁的文本內(nèi)容。以下是一個示例:

    import fitz
    
    def extract_text_from_pdf(pdf_file):
        pdf_document = fitz.open(pdf_file)
        text = ""
        for page_num in range(pdf_document.page_count):
            page = pdf_document[page_num]
            text += page.get_text()
        pdf_document.close()
        return text
    
    pdf_text = extract_text_from_pdf("your_pdf.pdf")
    print(pdf_text)
    
  2. 獲取頁面信息

    您可以使用get_page_info方法來獲取PDF頁的信息,如大小和旋轉(zhuǎn)。以下是一個示例:

    import fitz
    
    def get_page_info(pdf_file):
        pdf_document = fitz.open(pdf_file)
        for page_num in range(pdf_document.page_count):
            page = pdf_document[page_num]
            page_info = page.get_page_info()
            print(f"Page {page_num + 1}: Size={page_info['size']}, Rotation={page_info['rotate']}")
    
    get_page_info("your_pdf.pdf")
    
  3. 旋轉(zhuǎn)頁面

    您可以使用set_rotation方法來旋轉(zhuǎn)PDF頁面。以下是一個示例:

    import fitz
    
    def rotate_page(pdf_file, page_num, degrees):
        pdf_document = fitz.open(pdf_file)
        page = pdf_document[page_num - 1]
        page.set_rotation(degrees)
        pdf_document.save("rotated_pdf.pdf")
        pdf_document.close()
    
    rotate_page("your_pdf.pdf", 1, 90)  # 將第一頁旋轉(zhuǎn)90度
    
  4. 插入頁面

    使用insert_pdf方法可以將一個PDF文件的頁面插入到另一個PDF文件中。以下是一個示例:

    import fitz
    
    def insert_page(source_pdf, target_pdf, page_num):
        source_document = fitz.open(source_pdf)
        target_document = fitz.open(target_pdf)
        target_document.insert_pdf(source_document, from_page=page_num - 1, to_page=page_num - 1)
        target_document.save("merged_pdf.pdf")
        source_document.close()
        target_document.close()
    
    insert_page("insert.pdf", "target.pdf", 2)  # 將insert.pdf的第二頁插入到target.pdf中
    

這些示例展示了PyMuPDF的一些常見用法。PyMuPDF還提供了許多其他功能,如合并PDF、添加注釋、提取圖像等等。您可以根據(jù)需要查閱PyMuPDF的文檔以了解更多詳細信息和用法。

咱也不裝,這都是chatgpt寫的....但是很對,是有用的。文章來源地址http://www.zghlxwxcb.cn/news/detail-731067.html

到了這里,關(guān)于Python自動化小技巧23——PDF文件拆分為單獨頁面(PyMuPDF)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔相關(guān)法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 第八篇【傳奇開心果系列】Python自動化辦公庫技術(shù)點案例示例:深度解讀使用Python庫清洗處理從PDF文件提取的文本

    第八篇【傳奇開心果系列】Python自動化辦公庫技術(shù)點案例示例:深度解讀使用Python庫清洗處理從PDF文件提取的文本

    在使用pyPDF4或任何其他Python的PDF解析庫提取PDF文件的文本后,進行清洗處理是非常重要的。這是因為PDF文件通常包含了各種格式化元素,如頁眉、頁腳、頁碼、圖表、圖片等,這些元素可能會干擾到你提取的文本內(nèi)容。清洗處理的目標是去除這些干擾元素,僅提取出你真正需

    2024年03月22日
    瀏覽(28)
  • Latex圖表制作:關(guān)于EPS文件轉(zhuǎn)PDF文件及PDF裁剪自動化的Shell腳本制作

    Latex圖表制作:關(guān)于EPS文件轉(zhuǎn)PDF文件及PDF裁剪自動化的Shell腳本制作

    很快就要步入研二了,在寫完一篇論文以后,即將進入第二篇論文寫作時,察覺到之前的一篇論文還有許多可以改進的地方,一個方面就是繪圖,一篇論文圖畫的好不好、能否吸引審稿人的眼球并獲得其青睞是一個值得琢磨的問題,而在這種收益和付出正相關(guān)的事情上,就更

    2024年02月09日
    瀏覽(28)
  • Python自動化小技巧18——自動化資產(chǎn)月報(word設(shè)置字體表格樣式,查找替換文字)

    Python自動化小技巧18——自動化資產(chǎn)月報(word設(shè)置字體表格樣式,查找替換文字)

    案例背景 每月都要寫各種月報,經(jīng)營管理月報,資產(chǎn)月報.....這些報告文字目標都是高度相似的,只是需要替換為每個月的實際數(shù)據(jù)就行,如下: ? (打碼是怕信息泄露.....) 可以看到,這個報告的都是高度模板化,我們只需要對里面的某些文字進行替換,例如2023年7月?lián)Q成2

    2024年02月12日
    瀏覽(23)
  • Python自動化小技巧12——根據(jù)論文題目自動導(dǎo)出參考文獻格式

    Python自動化小技巧12——根據(jù)論文題目自動導(dǎo)出參考文獻格式

    在寫論文的時候,弄參考文獻格式也很麻煩,不可能手打人名題目期刊名稱年月日卷號頁碼這些,我們一般都是使用系統(tǒng)自動導(dǎo)出的格式復(fù)制粘貼就行。中國知網(wǎng)可以直接導(dǎo)出論文的格式,但是知網(wǎng)基本只有中文的論文,英文的論文還有很多sci的庫里面的論文都沒有。 我們一

    2023年04月25日
    瀏覽(26)
  • 【辦公自動化】使用Python一鍵提取PDF中的表格到Excel

    【辦公自動化】使用Python一鍵提取PDF中的表格到Excel

    ? ???♂? 個人主頁:@艾派森的個人主頁 ???作者簡介:Python學(xué)習者 ?? 希望大家多多支持,我們一起進步!?? 如果文章對你有幫助的話, 歡迎評論 ??點贊???? 收藏 ??加關(guān)注+ 目錄 一、Python處理Excel 二、提取PDF表格到excel 三、往期推薦 文末推薦? 文末福利 ? Pyth

    2024年02月13日
    瀏覽(23)
  • 【辦公自動化】使用Python一鍵提取PDF中的表格到Excel(文末送書5本)

    【辦公自動化】使用Python一鍵提取PDF中的表格到Excel(文末送書5本)

    ? ???♂? 個人主頁:@艾派森的個人主頁 ???作者簡介:Python學(xué)習者 ?? 希望大家多多支持,我們一起進步!?? 如果文章對你有幫助的話, 歡迎評論 ??點贊???? 收藏 ??加關(guān)注+ 目錄 一、Python處理Excel 二、提取PDF表格到excel 三、往期推薦 文末推薦? 文末福利 ? Pyth

    2024年02月14日
    瀏覽(26)
  • Python文件自動化處理

    Python文件自動化處理

    Python標準庫 和操作系統(tǒng)有關(guān)的操作 創(chuàng)建、移動、復(fù)制文件和文件夾 文件路徑和名稱處理 路徑的操作 獲取當前Python程序運行路徑 不同操作系統(tǒng)之間路徑的表示方式? windows中采用反斜杠()作為文件夾之間的分隔符? Mac和Linux中采用斜杠(/)作為文件夾之間的分隔符 把文件夾里面

    2024年01月17日
    瀏覽(19)
  • Python 自動化(十六)靜態(tài)文件處理

    Python 自動化(十六)靜態(tài)文件處理

    準備工作 將不同day下的代碼分目錄管理,方便后續(xù)復(fù)習查閱 使用 Pycharm 打開新項目 mysite3,并設(shè)置解釋器為 testenv 虛擬環(huán)境 修改基礎(chǔ)配置 settings.py 什么是靜態(tài)文件 如:圖片、音頻、視頻、css、js等 ? 靜態(tài)文件配置 靜態(tài)文件的相關(guān)配置也在 settings.py 文件中進行配置 配置靜態(tài)

    2024年02月06日
    瀏覽(20)
  • python自動化辦公--文件整理腳本詳解

    python自動化辦公--文件整理腳本詳解

    今天講解文件整理腳本的實現(xiàn)過程。這是一個很有用的技能,可以幫助你管理你的電腦上的各種文件。需求如下: 需求內(nèi)容:給定一個打算整理的文件夾目錄,這個腳本可以將該目錄下的所有文件都揪出來,并且根據(jù)后綴名歸類到不同的文件夾里。 python能力:使用python的內(nèi)

    2024年02月10日
    瀏覽(21)
  • Python 自動化指南(繁瑣工作自動化)第二版:十六、使用 CSV 文件和 JSON 數(shù)據(jù)

    Python 自動化指南(繁瑣工作自動化)第二版:十六、使用 CSV 文件和 JSON 數(shù)據(jù)

    原文:https://automatetheboringstuff.com/2e/chapter16/ 在第 15 章,你學(xué)習了如何從 PDF 和 Word 文檔中提取文本。這些文件是二進制格式的,需要特殊的 Python 模塊來訪問它們的數(shù)據(jù)。另一方面,CSV 和 JSON 文件只是純文本文件。您可以在文本編輯器(如 Mu)中查看它們。但是 Python 還附帶

    2023年04月08日
    瀏覽(657)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包