爬虫之xml和html的区别
要搞清楚html和xml的区别,首先需要我们来认识xml
1.1 认识xmlxml是一种可扩展标记语言,样子和html很像,功能更专注于对传输和存储数据
Everyday Italian
Giada De Laurentiis
2005
30.00
Harry Potter
J K. Rowling
2005
29.99
Learning XML
Erik T. Ray
2003
39.95
上面的xml内容可以表示为下面的树结构:
二者区别如下图
- html:
- 超文本标记语言
- 为了更好的显示数据,侧重点是为了显示
- xml:
- 可扩展标记语言
- 为了传输和存储数据,侧重点是在于数据内容本身