一、概况
一般大家都能会有个财富自由、时间自由的梦想。除了我们勤奋努力外,有些人运气比较好,买了一注彩票,瞬间会走上人生巅峰。彩票确实让有些人实现了这个梦想,但是这个概率太低了,低到无法想象。所以我们还是努力奋斗,做一个追梦人吧!
我们今天就爬取有史以来所有的双色球数据,看看这些年哪些数字出现的次数比较高。有的小伙伴可能不知道双色球是什么?双色球顾名思义就是两种颜色的球,一个红色,一个蓝色。红球从1-33中取出6个,篮球从1-16取出1个,如果你买的跟开奖号码一样,恭喜你几百万到手。
二、分析网站我们今天准备爬取的网站叫500彩票(https://www.500.com/) 这个网站有很多彩票的开奖信息,我们找到全国开奖这个导航(https://kaijiang.500.com/)
在这我们可以查询任何的彩票开奖信息:
我们选择双色球,并打开浏览器调试:
可以看出来是一个ajax(https://kaijiang.500.com/static/info/kaijiang/xml/ssq/list.xml?_A=ERICBJLA1552888430108) 请求,并且返回很多的xml信息。信息里面包括了有史以来所有双色球的开奖号码信息。数据有了,我们完全可以用正则表达式把我们想要的数据提取出来,然后保存到数据库。
三、逻辑实现我们在本地先创建好数据库,我们要的信息只有三个:
-
红球
-
篮球
-
日期
代码比较简单:
'''
想要学习Python?Python学习交流群:984632579满足你的需求,资料都已经上传群文件,可以自行下载!
'''
1import requests
2import re
3import pymysql
4
5# 请求地址
6url = 'http://kaijiang.500.com/static/info/kaijiang/xml/ssq/list.xml?_A=BLWXUIYA1546584359929'
7
8# 数据库连接
9connection = pymysql.connect(host='localhost',
10 user='root',
11 password='123456',
12 db='db_shuangseqiu', )
13# 获取游标对象
14cursor = connection.cursor()
15
16# 请求头
17headers = {
18 'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'
19}
20# 发起请求
21reponse = requests.get(url=url, headers=headers)
22
23# 正则规则
24pattern = re.compile(r'
关注
打赏
热门博文
- Python骚操作,实现驾考自动答题,这就直接满分了?
- 用Python自动实现图表可视化操作,提高工作效率,又能有更多的时间摸鱼了~
- Python:用tkinter制做一个音乐下载小软件
- Python丨小学妹喜欢看漫画,于是我写了四十行代码获取了它所有漫画
- 女同桌找我要表情包,还好我会Python,分分钟给她下载几十个G...
- 为了防止这上面的文章被封,我连夜用Python获取了它所有内容,真香~
- 这个Python读取文件的方法,堪称天花板级别...
- Python做一个通过输入bv号就能下载视频的工具,评论和弹幕也不放过
- Python爬虫何如抓包?这三个案例手把手教会你,非常详细...
- Python:50行代码实现下载小说,图片章节可自动识别转文字保存...