您当前的位置: 首页 >  爬虫

IT之一小佬

暂无认证

  • 3浏览

    0关注

    1192博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

爬虫之 lxml模块和xpath语法

IT之一小佬 发布时间:2021-01-25 22:59:24 ,浏览量:3

爬虫之 lxml模块和xpath语法

对html或xml形式的文本提取特定的内容,就需要我们掌握lxml模块的使用和xpath语法。

  • lxml模块可以利用XPath规则语法,来快速的定位HTML\XML 文档中特定元素以及获取节点信息(文本内容、属性值)
  • XPath (XML Path Language) 是一门在 HTML\XML 文档中查找信息的语言,可用来在 HTML\XML 文档中对元素和属性进行遍历。
    • W3School官方文档:http://www.w3school.com.cn/xpath/index.asp    【需要查看详情】
  • 提取xml、html中的数据需要lxml模块和xpath语法配合使用
关注
打赏
1665675218
查看更多评论
立即登录/注册

微信扫码登录

0.0542s