emmm~
起因呢,这昨晚女同桌跟我说电脑有点卡,喊我去宿舍给她装个新系统,装系统就装系统吧,结果又说新系统表情包都没保存~
我当时就有点生气,真当我是万能的呢?
于是我直接就用Python给她爬了几十个G,完事扭头就走,任她怎么喊我也没用!
使用的环境
- python3.8 | Anaconda
- pycharm
使用的模块
- requests 第三方模块 需要手动安装
- re 内置模块不需要安装
win+r 输入cmd ,确定后新窗口输入 pip install requests 即可安装成功。
插件安装
xpath helper扩展工具包
安装步骤:找助理老师获取xpath helper扩展工具包(注意:不要解压) 》》 打开Google浏览器 --> 更多工具 --> 扩展程序 --> 打开开发者模式 --> 把xpath helper扩展工具包直接拖入 --> 刷新 使用方法:快捷键 ctrl+shift+X
思路流程
1、分析数据来源 第一页:https://fabiaoqing.com/biaoqing/lists/page/1.html 多页 —> 第一页 --> 一个 2、实现代码
- 发送请求,第一页数据
- 获取数据
- 解析数据,表情
- 保存数据
部分效果展示
1、发送请求
第一页数据
url = 'https://fabiaoqing.com/biaoqing/lists/page/1.html'
headers = {
# 键值对 用户代理 浏览器的基本身份
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36'
}
response = requests.get(url, headers=headers)
# 响应对象 200 状态 成功 404 403
print(response)
2、获取数据
网页源代码
print(response.text)
re 找规律
3、解析数据
.*? 精准匹配数据
re_data = re.findall('
关注
打赏
热门博文
- Python骚操作,实现驾考自动答题,这就直接满分了?
- 用Python自动实现图表可视化操作,提高工作效率,又能有更多的时间摸鱼了~
- Python:用tkinter制做一个音乐下载小软件
- Python丨小学妹喜欢看漫画,于是我写了四十行代码获取了它所有漫画
- 女同桌找我要表情包,还好我会Python,分分钟给她下载几十个G...
- 为了防止这上面的文章被封,我连夜用Python获取了它所有内容,真香~
- 这个Python读取文件的方法,堪称天花板级别...
- Python做一个通过输入bv号就能下载视频的工具,评论和弹幕也不放过
- Python爬虫何如抓包?这三个案例手把手教会你,非常详细...
- Python:50行代码实现下载小说,图片章节可自动识别转文字保存...