国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

用python實(shí)現(xiàn)提取word中的所有圖片

這篇具有很好參考價(jià)值的文章主要介紹了用python實(shí)現(xiàn)提取word中的所有圖片。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

你可以使用python-docx庫(kù)來(lái)處理word文件,然后遍歷文件中的所有形狀,找到圖片。

首先,你需要安裝python-docx庫(kù)。在命令行中輸入以下命令進(jìn)行安裝:

 

復(fù)制代碼

pip install python-docx

然后,你可以使用以下代碼提取word文件中的所有圖片:

 

python復(fù)制代碼

from docx import Document
from docx.shared import Inches
def extract_images(filename):
# 加載word文件
doc = Document(filename)
# 存儲(chǔ)圖片路徑的列表
image_paths = []
# 遍歷文件中的所有形狀
for shape in doc.shapes:
# 如果形狀是圖片,則添加到列表中
if shape.has_image:
image_paths.append(shape.image.filename)
return image_paths

這個(gè)函數(shù)會(huì)返回一個(gè)列表,其中包含word文件中所有圖片的路徑。

請(qǐng)注意,這個(gè)函數(shù)只能提取word文件中嵌入的圖片,無(wú)法提取鏈接的圖片。如果你需要提取鏈接的圖片,你可能需要使用更復(fù)雜的工具或庫(kù),如python-docx的高級(jí)版python-docx-image-to-data。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-812883.html

到了這里,關(guān)于用python實(shí)現(xiàn)提取word中的所有圖片的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • python提取word文本和word圖片

    提取文本 docx只支持docx格式,所以如果想讀取doc需要另存為docx格式即可 提取圖片

    2024年02月09日
    瀏覽(23)
  • Python - 讀取pdf、word、excel、ppt、csv、txt文件提取所有文本

    本文對(duì)使用python讀取pdf、word、excel、ppt、csv、txt等常用文件,并提取所有文本的方法進(jìn)行分享和使用總結(jié)。 可以讀取不同文件的庫(kù)和方法當(dāng)然不止下面分享的這些,本文的代碼主要目標(biāo)都是:方便提取文件中所有文本的實(shí)現(xiàn)方式。 這些庫(kù)的更多使用方法,請(qǐng)到官方文檔中查

    2024年02月13日
    瀏覽(641)
  • 基于Tesseract模塊Python實(shí)現(xiàn)提取圖片中的文字信息(安裝+使用教程)

    基于Tesseract模塊Python實(shí)現(xiàn)提取圖片中的文字信息(安裝+使用教程)

    Python實(shí)現(xiàn)提取圖片中的文字可以使用Optical Character Recognition (OCR) 技術(shù)來(lái)解決。OCR是指將圖像中的文本轉(zhuǎn)換成可編輯的文本的過(guò)程。Python有許多OCR庫(kù),但最流行和最廣泛使用的是Tesseract庫(kù)。 下面是一個(gè)使用Python和Tesseract來(lái)提取圖像中的文本的簡(jiǎn)單示例代碼。 OCR,即光學(xué)字符識(shí)

    2024年02月05日
    瀏覽(19)
  • Python和VBA批量提取Word中的表格

    表格在word文檔中常見(jiàn)的文檔元素之一。操作word文件時(shí)有時(shí)需要提取文件中多個(gè)表格的內(nèi)容到一個(gè)新的文件,甚至有時(shí)還會(huì)要提取題注信息。 今天,給大家分享兩種批量提取文檔中表格的兩種方法,分別是VBA法和Python法兩種。 1. 代碼實(shí)現(xiàn) VBA(Visual Basic for Applications)操作Wo

    2024年02月19日
    瀏覽(24)
  • python-自動(dòng)篇-辦公-案例-一鍵將word中的表格提取到excel文件中

    python-自動(dòng)篇-辦公-案例-一鍵將word中的表格提取到excel文件中

    前提:您電腦上有python,還有就是編輯器vscode或其他 第一:您復(fù)制代碼到vscode運(yùn)行,花現(xiàn)下面的報(bào)錯(cuò),這時(shí)候需要pip按照對(duì)應(yīng)的庫(kù) 其實(shí)就是在:cmd中輸入:pip install +對(duì)應(yīng)報(bào)錯(cuò)需要的庫(kù),如上是docx 當(dāng)然,也不會(huì)很順利只使用“pip”就能解決,比如 使用pip時(shí),出現(xiàn)紅色報(bào)錯(cuò)啦

    2024年01月22日
    瀏覽(52)
  • 【Python ? 圖片識(shí)別】pytesseract快速識(shí)別提取圖片中的文字

    【Python ? 圖片識(shí)別】pytesseract快速識(shí)別提取圖片中的文字

    提示:本文多圖,請(qǐng)手機(jī)端注意流量。 利用python做圖片識(shí)別,識(shí)別提取圖片中的文字會(huì)有很多方法,但是想要簡(jiǎn)單一點(diǎn)怎么辦,那就可以使用tesseract識(shí)別引擎來(lái)實(shí)現(xiàn),一行代碼就可以做到提取圖片文本。 本程序用到了兩個(gè)python庫(kù),pytesseract和PIL,所以先來(lái)安裝。 運(yùn)行以下命

    2024年02月02日
    瀏覽(28)
  • python提取圖片型pdf中的文字(提取pdf掃描件文字)

    python提取圖片型pdf中的文字(提取pdf掃描件文字)

    前言 文字型pdf提取,python的庫(kù)一大堆,但是圖片型pdf和pdf掃描件提取,還是有些難度的,我們需要用到OCR(光學(xué)字符識(shí)別)功能。 一、準(zhǔn)備 1、安裝OCR(光學(xué)字符識(shí)別)支持庫(kù) 首先要安裝 pytesseract 和 Tesserac OCR ,Tesseract OCR是一種廣泛使用的OCR工具,它可以用于從圖像中提取

    2024年03月23日
    瀏覽(29)
  • 通過(guò)Python的fitz庫(kù)提取pdf中的圖片

    通過(guò)Python的fitz庫(kù)提取pdf中的圖片

    大家好,我是空空star,本篇給大家分享一下 《通過(guò)Python的fitz庫(kù)提取pdf中的圖片》 。 Fitz庫(kù)是一個(gè)Python圖像處理庫(kù),主要用于打開(kāi)、編輯和保存PDF、TIFF和JPEG格式的圖像。它可以幫助用戶讀取和寫(xiě)入PDF文件,提取PDF頁(yè)面以及在頁(yè)面上進(jìn)行標(biāo)記和注釋。此外,F(xiàn)itz庫(kù)還提供了一些

    2024年02月07日
    瀏覽(26)
  • 通過(guò)Python的PyPDF2庫(kù)提取pdf中的圖片

    通過(guò)Python的PyPDF2庫(kù)提取pdf中的圖片

    大家好,我是空空star,本篇給大家分享一下通過(guò)Python的PyPDF2庫(kù) 提取pdf中的圖片 。 上一篇已經(jīng)給大家分享了 提取pdf中的文字 ,感興趣的同學(xué)可以閱讀下。 本篇演示所用python版本: Python 3.8.9 通過(guò)Python的PyPDF2庫(kù)提取pdf中的文字 PyPDF2庫(kù)是一個(gè)用于處理PDF文件的Python庫(kù)。它提供了

    2024年02月06日
    瀏覽(26)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包