国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

如何通過Java代碼將 PDF文檔轉(zhuǎn)為 HTML格式

這篇具有很好參考價(jià)值的文章主要介紹了如何通過Java代碼將 PDF文檔轉(zhuǎn)為 HTML格式。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

雖然PDF文件適合用于打印和發(fā)布,但不適合所有類型的文檔。例如,包含復(fù)雜圖表和圖形的文檔可能無法在PDF中呈現(xiàn)得很好。但是HTML文件可以在任何可運(yùn)行瀏覽器的計(jì)算機(jī)上進(jìn)行閱讀并顯示。并且HTML還具有占用服務(wù)器資源較小,便于搜索引擎收錄的特點(diǎn)。那么今天這篇文章就將展示如何通過Java應(yīng)用程序?qū)DF文檔轉(zhuǎn)為HTML格式。下面是我整理的具體步驟及方法,并附上Java代碼供大家參考。

  • 將PDF文檔轉(zhuǎn)換為HTML文件
  • 將PDF文檔轉(zhuǎn)換為嵌入SVG的HTML文件
  • 將PDF文檔轉(zhuǎn)換為HTML流

代碼編譯環(huán)境:

IntelliJ IDEA 2019(jdk 1.8.0)

PDF Jar包:Free Spire.PDF for Java 5.1.0

引入jar

導(dǎo)入方法1:

手動(dòng)引入。將Free Spire.PDF for Java下載到本地,解壓,找到lib文件夾下的Spire.PDF.jar文件。在IDEA中打開如下界面,將本地路徑中的jar文件引入Java程序:

如何通過Java代碼將 PDF文檔轉(zhuǎn)為 HTML格式

導(dǎo)入方法2:如果您想通過 Maven安裝,則可以在 pom.xml 文件中添加以下代碼導(dǎo)入 JAR 文件。

<repositories>

        <repository>

            <id>com.e-iceblue</id>

            <url>https://repo.e-iceblue.cn/repository/maven-public/</url>

        </repository>

    </repositories>

<dependencies>

    <dependency>

        <groupId>e-iceblue</groupId>

        <artifactId>spire.pdf.free</artifactId>

        <version>5.1.0</version>

    </dependency>

</dependencies>

將PDF文檔轉(zhuǎn)換為HTML文件

我們可以使用 PdfDocument.saveToFile(String filename, FileFormat.HTML) 方法,可以直接將PDF文檔轉(zhuǎn)換為HTML文件。具體步驟如下。

  • 創(chuàng)建PdfDocument的對象。
  • 使用PdfDocument.loadFromFile() 方法加載PDF文件。
  • 使用PdfDocument.saveToFle() 方法將PDF文件另存為HTML文件。

完整代碼

Java

import com.spire.pdf.*;

public class convertPDFToHTML {
    public static void main(String[] args) {

        //創(chuàng)建PdfDocument的對象
        PdfDocument pdf = new PdfDocument();

        //加載PDF文件
        pdf.loadFromFile("郁金香.pdf");

        //將PDF文件保存為HTML文件
        pdf.saveToFile("PDFToHTML.html",FileFormat.HTML);
        pdf.close();
    }
}

PDF文檔轉(zhuǎn)換為嵌入SVGHTML文件

PdfDocument.getConvertOptions().setPdfToHtmlOptions(true) 方法,可以在轉(zhuǎn)換時(shí)嵌入SVG。將PDF文件轉(zhuǎn)換為嵌入SVG的HTML文件的詳細(xì)步驟如下。

  • 創(chuàng)建PdfDocument的對象。
  • 使用PdfDocument.loadFromFile() 方法加載PDF文件。
  • 使用PdfDocument.getConvertOptions().setPdfToHtmlOptions(true) 方法啟用嵌入SVG。
  • 使用PdfDocument.saveToFle() 方法將PDF文件另存為HTML文件。

完整代碼

Java

import com.spire.pdf.*;

public class convertPDFToHTMLEmbeddingSVG {
    public static void main(String[] args) {

        //創(chuàng)建PdfDocument的對象
        PdfDocument doc = new PdfDocument();

        //加載PDF文件
        doc.loadFromFile("郁金香.pdf");

        //設(shè)置嵌入SVG
        doc.getConvertOptions().setPdfToHtmlOptions(true);

        //將PDF文件另存為HTML文件
        doc.saveToFile("PDFToHTMLEmbeddingSVG.html", FileFormat.HTML);
        doc.close();
    }
}

將PDF文檔轉(zhuǎn)換為HTML流

Free Spire.PDF for Java還支持將PDF文檔轉(zhuǎn)換為HTML流。具體步驟如下。

  • 創(chuàng)建PdfDocument的對象。
  • 使用PdfDocument.loadFromFile() 方法加載PDF文件。
  • 使用PdfDocument.saveToStream() 方法將PDF文件保存為HTML流。

完整代碼

Java

import com.spire.pdf.*;

import java.io.*;


public class convertPDFToHTMLStream {
    public static void main(String[] args) throws FileNotFoundException {

        //創(chuàng)建PdfDocument的對象
        PdfDocument pdf = new PdfDocument();

        //加載PDF文件
        pdf.loadFromFile("郁金香.pdf");

        //將PDF文件另存為HTML流
        File outFile = new File("PDFToHTMLStream.html");
        OutputStream outputStream = new FileOutputStream(outFile);
        pdf.saveToStream(outputStream, FileFormat.HTML);
        pdf.close();
    }
}

效果圖

如何通過Java代碼將 PDF文檔轉(zhuǎn)為 HTML格式

—本文完—文章來源地址http://www.zghlxwxcb.cn/news/detail-454787.html

到了這里,關(guān)于如何通過Java代碼將 PDF文檔轉(zhuǎn)為 HTML格式的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 如何利用python將pdf文檔轉(zhuǎn)為word?

    1.前言 有些時(shí)候,我們需要將pdf文檔轉(zhuǎn)換為word文檔進(jìn)行處理,但市面上的一些pdf軟件往往需要付費(fèi)才能使用。那么作為一名技術(shù)人員,如何才能實(shí)現(xiàn)pdf轉(zhuǎn)word自由? 2.準(zhǔn)備工作 提前安裝好python的環(huán)境,并且安裝對應(yīng)的第三方包: 3.實(shí)現(xiàn)方法 3.1 convert方法 3.2 parse方法 3.3 僅轉(zhuǎn)換其

    2024年02月13日
    瀏覽(26)
  • 批量PDF轉(zhuǎn)HTML:高效管理與優(yōu)化文檔格式

    批量PDF轉(zhuǎn)HTML:高效管理與優(yōu)化文檔格式

    隨著數(shù)字化時(shí)代的快速發(fā)展,PDF文件因其跨平臺(tái)兼容性和良好的排版效果而被廣泛應(yīng)用。然而,在文本批量管理的場景中,我們可能需要將PDF文件轉(zhuǎn)換為HTML格式,以便更好地進(jìn)行編輯、搜索和定制。本文將為您介紹一種高效的方法,幫助您輕松實(shí)現(xiàn)PDF到HTML的批量轉(zhuǎn)換。 首先

    2024年03月13日
    瀏覽(20)
  • Java【代碼 16】將word、excel文件轉(zhuǎn)換為pdf格式和將pdf文檔轉(zhuǎn)換為image格式工具類分享(Gitee源碼)aspose轉(zhuǎn)換中文亂碼問題處理

    感謝小伙伴兒的分享: ● 不羈 ● 郭中天 整合調(diào)整后的工具類Gitee地址:https://gitee.com/yuanzhengme/java_application_aspose_demo ● WordToPdfUtil用于將word文檔轉(zhuǎn)換為pdf格式的工具類 ● ExcelToPdfUtil用于將excel文檔轉(zhuǎn)換為pdf格式的工具類 ● PdfToImageUtil用于將pdf文檔轉(zhuǎn)換為image格式的工具類

    2024年01月24日
    瀏覽(34)
  • Java 將word轉(zhuǎn)為PDF的三種方式和處理在服務(wù)器上下載后亂碼的格式

    Java 將word轉(zhuǎn)為PDF的三種方式和處理在服務(wù)器上下載后亂碼的格式

    我這邊是因?yàn)闃I(yè)務(wù)需要將之前導(dǎo)出的word文檔轉(zhuǎn)換為PDF文件,然后頁面預(yù)覽下載這樣的情況。之前導(dǎo)出word文檔又不是我做的,所以為了不影響業(yè)務(wù),只是將最后在輸出流時(shí)轉(zhuǎn)換成了PDF,當(dāng)時(shí)本地調(diào)用沒什么問題,一切正常,后面發(fā)布測試環(huán)境使用時(shí)才發(fā)現(xiàn),導(dǎo)出時(shí)PDF文件內(nèi)容

    2024年02月03日
    瀏覽(27)
  • Java HTML生成PDF(格式不變)

    Java HTML生成PDF(格式不變)

    Java是大規(guī)模和企業(yè)級(jí)應(yīng)用程序最常用的編程語言之一。PDF 格式代表可移植文檔格式,為人們提供了一種簡單、可靠的方式來呈現(xiàn)和交換文檔 - 無論查看文檔的任何人使用何種軟件、硬件或操作系統(tǒng)。因此,pdf 是一種廣泛使用的格式,用于在軟件應(yīng)用程序中生成文檔。 HTML 用

    2024年02月12日
    瀏覽(19)
  • 如何在電腦上免費(fèi)更改 PDF 格式文檔的字體大?。? decoding=

    如何在電腦上免費(fèi)更改 PDF 格式文檔的字體大???

    對于需要編輯或修改的 PDF 文件來說,更改其字體大小是一個(gè)非常常見且必要的工作。雖然 Adobe Acrobat Pro DC 等專業(yè)的 PDF 編輯軟件可以幫助您完成此任務(wù),但他們通常都需要昂貴的恢復(fù)。幸運(yùn)的是,有許多免費(fèi)的 PDF 編輯工具可供選擇。在本文中,我們將介紹如何在電腦上免費(fèi)

    2024年01月18日
    瀏覽(38)
  • 如何通過C++ 給PDF文檔添加文字水印

    如何通過C++ 給PDF文檔添加文字水印

    因PDF文檔具有較好的穩(wěn)定性和兼容性,現(xiàn)在越來越多的合同、研究論文、報(bào)告等都采用PDF格式。為了進(jìn)一步保護(hù)這些重要文檔內(nèi)容免受未經(jīng)授權(quán)的復(fù)制或使用,我們可以添加水印以表明其狀態(tài)、所有權(quán)或用途。針對工作中可能出現(xiàn)的在 C++ 應(yīng)用程序中給 PDF 文檔添加文字水印的

    2024年02月05日
    瀏覽(23)
  • ElasticSearch 實(shí)現(xiàn) 全文檢索 支持(PDF、TXT、Word、HTML等文件)通過 ingest-attachment 插件實(shí)現(xiàn) 文檔的檢索

    ElasticSearch 實(shí)現(xiàn) 全文檢索 支持(PDF、TXT、Word、HTML等文件)通過 ingest-attachment 插件實(shí)現(xiàn) 文檔的檢索

    Attachment 插件是 Elasticsearch 中的一種插件,允許將各種二進(jìn)制文件(如PDF、Word文檔等)以及它們的內(nèi)容索引到 Elasticsearch 中。插件使用 Apache Tika 庫來解析和提取二進(jìn)制文件的內(nèi)容。通過使用 Attachment 插件,可以輕松地在 Elasticsearch 中建立全文搜索功能,而無需事先轉(zhuǎn)換二進(jìn)制

    2024年02月05日
    瀏覽(22)
  • C#將word文檔轉(zhuǎn)為PDF

    C#將word文檔轉(zhuǎn)為PDF

    使用?Microsoft.Office.Interop.Word 將word文檔轉(zhuǎn)為PDF 在NuGet中搜索?Microsoft.Office.Interop.Word 安裝 方法 參數(shù)參考?微軟官網(wǎng)地址

    2024年02月13日
    瀏覽(22)
  • js將html頁面轉(zhuǎn)為pdf

    在 JavaScript 中,可以使用以下兩種方法將 HTML 頁面轉(zhuǎn)換為 PDF 文件: 使用第三方庫,如 jsPDF 或 html2canvas。 使用瀏覽器的內(nèi)置功能,如 window.print() 方法,可以將 HTML 頁面轉(zhuǎn)換為 PDF 文件。 下面是使用 jsPDF 的例子: 使用 window.print() 方法的例子: 在瀏覽器中,你可以使用快捷鍵

    2024年02月15日
    瀏覽(75)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包