????????下面是一個使用Jsoup庫解析HTML的簡單Java例子。這個例子展示了如何使用Jsoup從一個HTML字符串中提取數(shù)據(jù)。
????????首先,確保你已經(jīng)將Jsoup作為依賴項(xiàng)添加到你的項(xiàng)目中。如果你使用的是Maven,可以在`pom.xml`文件中添加以下依賴:
????????
<dependencies>
? ? <dependency>
? ? ? ? <groupId>org.jsoup</groupId>
? ? ? ? <artifactId>jsoup</artifactId>
? ? ? ? <version>1.14.3</version> <!-- 請檢查最新版本 -->
? ? </dependency>
</dependencies>
????????
然后,你可以使用以下Java代碼來解析HTML:
?文章來源:http://www.zghlxwxcb.cn/news/detail-835872.html
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class JsoupExample {
public static void main(String[] args) {
String html = "<html><head><title>Sample Title</title></head>"
+ "<body><p>Sample Content</p><div class='links'><a
+ "<a ;
Document doc = Jsoup.parse(html);
// 獲取標(biāo)題
String title = doc.title();
System.out.println("Title: " + title);
// 獲取所有鏈接
Elements links = doc.select("a[href]");
for (Element link : links) {
System.out.println("Link: " + link.attr("href"));
System.out.println("Text: " + link.text());
}
// 獲取具有特定類的元素
Elements divLinks = doc.select("div.links");
for (Element div : divLinks) {
System.out.println("Div Class: " + div.className());
// 可以進(jìn)一步操作div元素
}
}
}
????????在這個例子中,我們首先創(chuàng)建了一個包含HTML內(nèi)容的字符串。然后,我們使用Jsoup.parse()方法來解析這個字符串,并得到了一個Document對象,它可以代表整個HTML文檔。
????????接著,我們使用Document對象的title()方法來獲取文檔的標(biāo)題。使用select()方法,我們可以通過CSS選擇器來選擇和提取特定的元素。在這個例子中,我們提取了所有<a>標(biāo)簽的href屬性和文本內(nèi)容,以及具有l(wèi)inks類的<div>標(biāo)簽。
????????這個例子展示了Jsoup的基本用法,包括HTML解析、選擇元素和提取屬性。Jsoup還有很多其他功能,比如處理實(shí)時的HTML文檔、修改DOM結(jié)構(gòu)、清理HTML等。文章來源地址http://www.zghlxwxcb.cn/news/detail-835872.html
到了這里,關(guān)于java 中開源的html解析庫Jsoup 簡單例子的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!