您当前的位置：首页 > 彭世瑜 Java

Java爬虫：Jsoup解析HTML

彭世瑜发布时间：2020-08-10 17:55:56 ，浏览量：6

官网：https://jsoup.org/

依赖


    org.jsoup
    jsoup
    1.13.1

使用示例

String html = "this is a text";

// 解析字符串
Document doc = Jsoup.parse(html);
System.out.println(doc);

// 解析Html片段
Document fragment = Jsoup.parseBodyFragment(html);
System.out.println(fragment);

// 从Url解析
Document doc = Jsoup.connect("https://www.baidu.com/").get();
System.out.println(doc.title());

// 使用css解析器
Element element = doc.selectFirst("title");
System.out.println(element.text());

参考