您当前的位置: 首页 >  Java

彭世瑜

暂无认证

  • 0浏览

    0关注

    2791博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

Java爬虫:Jsoup解析HTML

彭世瑜 发布时间:2020-08-10 17:55:56 ,浏览量:0

官网:https://jsoup.org/

依赖


    org.jsoup
    jsoup
    1.13.1

使用示例

String html = "

this is a text

"; // 解析字符串 Document doc = Jsoup.parse(html); System.out.println(doc); // 解析Html片段 Document fragment = Jsoup.parseBodyFragment(html); System.out.println(fragment);
// 从Url解析
Document doc = Jsoup.connect("https://www.baidu.com/").get();
System.out.println(doc.title());

// 使用css解析器
Element element = doc.selectFirst("title");
System.out.println(element.text());

参考

  1. Java爬虫利器HTML解析工具-Jsoup
  2. https://www.open-open.com/jsoup/parsing-a-document.htm
关注
打赏
1665367115
查看更多评论
立即登录/注册

微信扫码登录

0.2000s