您当前的位置: 首页 >  Python

嗨学编程

暂无认证

  • 1浏览

    0关注

    1405博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

Python爬取双色球,妈妈再也不会担心我不会中奖了

嗨学编程 发布时间:2019-03-19 16:53:15 ,浏览量:1

一、概况

一般大家都能会有个财富自由、时间自由的梦想。除了我们勤奋努力外,有些人运气比较好,买了一注彩票,瞬间会走上人生巅峰。彩票确实让有些人实现了这个梦想,但是这个概率太低了,低到无法想象。所以我们还是努力奋斗,做一个追梦人吧!

我们今天就爬取有史以来所有的双色球数据,看看这些年哪些数字出现的次数比较高。有的小伙伴可能不知道双色球是什么?双色球顾名思义就是两种颜色的球,一个红色,一个蓝色。红球从1-33中取出6个,篮球从1-16取出1个,如果你买的跟开奖号码一样,恭喜你几百万到手。

二、分析网站

我们今天准备爬取的网站叫500彩票(https://www.500.com/) 这个网站有很多彩票的开奖信息,我们找到全国开奖这个导航(https://kaijiang.500.com/)

 在这我们可以查询任何的彩票开奖信息:

 我们选择双色球,并打开浏览器调试:

 

 可以看出来是一个ajax(https://kaijiang.500.com/static/info/kaijiang/xml/ssq/list.xml?_A=ERICBJLA1552888430108) 请求,并且返回很多的xml信息。信息里面包括了有史以来所有双色球的开奖号码信息。数据有了,我们完全可以用正则表达式把我们想要的数据提取出来,然后保存到数据库。

三、逻辑实现

我们在本地先创建好数据库,我们要的信息只有三个:

  • 红球

  • 篮球

  • 日期

    代码比较简单:

'''
想要学习Python?Python学习交流群:984632579满足你的需求,资料都已经上传群文件,可以自行下载!
'''
 1import requests
 2import re
 3import pymysql
 4
 5# 请求地址
 6url = 'http://kaijiang.500.com/static/info/kaijiang/xml/ssq/list.xml?_A=BLWXUIYA1546584359929'
 7
 8# 数据库连接
 9connection = pymysql.connect(host='localhost',
10                             user='root',
11                             password='123456',
12                             db='db_shuangseqiu', )
13# 获取游标对象
14cursor = connection.cursor()
15
16# 请求头
17headers = {
18    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'
19}
20# 发起请求
21reponse = requests.get(url=url, headers=headers)
22
23# 正则规则
24pattern = re.compile(r'            
关注
打赏
1663681728
查看更多评论
0.3959s