什么是XPath
XPath (XML Path Language)是一门在 HTML\XML文档中查找信息的语言,可用来在HTML\XML文档中对元素和属性进行遍历。
html和xml的区别
Everyday Italian
Giada De Laurentiis
2005
30.00
Harry Potter
J K. Rowling
2005
29.99
Learning XML
Erik T. Ray
2003
39.95
上面的xml内容可以表示为下面的树结构
知识点:
- 认识xpath中的节点
- 了解xpath中节点之间的关系
- 每个html的标签我们都称之为节点。(根节点、子节点、同级节点)
XPath使用路径表达式来选取XML文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。
下面列出了最有用的表达式:
在下面的表格中,我们已列出了一些路径表达式以及表达式的结果:
在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果:
import parsel # str --> Selector对象具有xpath方法
提取到的数据返回一个列表
html_str = """
第一个
关注
打赏