雖然PDF文件適合用于打印和發(fā)布,但不適合所有類型的文檔。例如,包含復(fù)雜圖表和圖形的文檔可能無法在PDF中呈現(xiàn)得很好。但是HTML文件可以在任何可運(yùn)行瀏覽器的計(jì)算機(jī)上進(jìn)行閱讀并顯示。并且HTML還具有占用服務(wù)器資源較小,便于搜索引擎收錄的特點(diǎn)。那么今天這篇文章就將展示如何通過Java應(yīng)用程序?qū)DF文檔轉(zhuǎn)為HTML格式。下面是我整理的具體步驟及方法,并附上Java代碼供大家參考。
- 將PDF文檔轉(zhuǎn)換為HTML文件
- 將PDF文檔轉(zhuǎn)換為嵌入SVG的HTML文件
- 將PDF文檔轉(zhuǎn)換為HTML流
代碼編譯環(huán)境:
IntelliJ IDEA 2019(jdk 1.8.0)
PDF Jar包:Free Spire.PDF for Java 5.1.0
引入jar包
導(dǎo)入方法1:
手動(dòng)引入。將Free Spire.PDF for Java下載到本地,解壓,找到lib文件夾下的Spire.PDF.jar文件。在IDEA中打開如下界面,將本地路徑中的jar文件引入Java程序:
導(dǎo)入方法2:如果您想通過 Maven安裝,則可以在 pom.xml 文件中添加以下代碼導(dǎo)入 JAR 文件。
<repositories> <repository> <id>com.e-iceblue</id> <url>https://repo.e-iceblue.cn/repository/maven-public/</url> </repository> </repositories> <dependencies> <dependency> <groupId>e-iceblue</groupId> <artifactId>spire.pdf.free</artifactId> <version>5.1.0</version> </dependency> </dependencies>
將PDF文檔轉(zhuǎn)換為HTML文件
我們可以使用 PdfDocument.saveToFile(String filename, FileFormat.HTML) 方法,可以直接將PDF文檔轉(zhuǎn)換為HTML文件。具體步驟如下。
- 創(chuàng)建PdfDocument的對象。
- 使用PdfDocument.loadFromFile() 方法加載PDF文件。
- 使用PdfDocument.saveToFle() 方法將PDF文件另存為HTML文件。
完整代碼
Java
import com.spire.pdf.*; public class convertPDFToHTML { public static void main(String[] args) { //創(chuàng)建PdfDocument的對象 PdfDocument pdf = new PdfDocument(); //加載PDF文件 pdf.loadFromFile("郁金香.pdf"); //將PDF文件保存為HTML文件 pdf.saveToFile("PDFToHTML.html",FileFormat.HTML); pdf.close(); } }
將PDF文檔轉(zhuǎn)換為嵌入SVG的HTML文件
PdfDocument.getConvertOptions().setPdfToHtmlOptions(true) 方法,可以在轉(zhuǎn)換時(shí)嵌入SVG。將PDF文件轉(zhuǎn)換為嵌入SVG的HTML文件的詳細(xì)步驟如下。
- 創(chuàng)建PdfDocument的對象。
- 使用PdfDocument.loadFromFile() 方法加載PDF文件。
- 使用PdfDocument.getConvertOptions().setPdfToHtmlOptions(true) 方法啟用嵌入SVG。
- 使用PdfDocument.saveToFle() 方法將PDF文件另存為HTML文件。
完整代碼
Java
import com.spire.pdf.*; public class convertPDFToHTMLEmbeddingSVG { public static void main(String[] args) { //創(chuàng)建PdfDocument的對象 PdfDocument doc = new PdfDocument(); //加載PDF文件 doc.loadFromFile("郁金香.pdf"); //設(shè)置嵌入SVG doc.getConvertOptions().setPdfToHtmlOptions(true); //將PDF文件另存為HTML文件 doc.saveToFile("PDFToHTMLEmbeddingSVG.html", FileFormat.HTML); doc.close(); } }
將PDF文檔轉(zhuǎn)換為HTML流
Free Spire.PDF for Java還支持將PDF文檔轉(zhuǎn)換為HTML流。具體步驟如下。
- 創(chuàng)建PdfDocument的對象。
- 使用PdfDocument.loadFromFile() 方法加載PDF文件。
- 使用PdfDocument.saveToStream() 方法將PDF文件保存為HTML流。
完整代碼
Java
import com.spire.pdf.*; import java.io.*; public class convertPDFToHTMLStream { public static void main(String[] args) throws FileNotFoundException { //創(chuàng)建PdfDocument的對象 PdfDocument pdf = new PdfDocument(); //加載PDF文件 pdf.loadFromFile("郁金香.pdf"); //將PDF文件另存為HTML流 File outFile = new File("PDFToHTMLStream.html"); OutputStream outputStream = new FileOutputStream(outFile); pdf.saveToStream(outputStream, FileFormat.HTML); pdf.close(); } }
效果圖
文章來源:http://www.zghlxwxcb.cn/news/detail-454787.html
—本文完—文章來源地址http://www.zghlxwxcb.cn/news/detail-454787.html
到了這里,關(guān)于如何通過Java代碼將 PDF文檔轉(zhuǎn)為 HTML格式的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!