您当前的位置：首页 > 嗨学编程 Python

【Python爬虫案例学习20】Python爬虫爬取智联招聘职位信息

嗨学编程发布时间：2019-08-06 20:16:00 ，浏览量：3

目的：输入要爬取的职位名称，五个意向城市，爬取智联招聘上的该信息，并打印进表格中

####基本环境配置：

Python版本：2.7
开发工具：pycharm
系统：win10
####相关模块：

import urllib2
import re
import xlwt

####完整代码：

import urllib2
import re
import xlwt

'''
遇到不懂的问题？Python学习交流群：821460695满足你的需求，资料都已经上传群文件，可以自行下载！
'''
class ZLZP(object):

    def __init__(self,workname,citys):
        # 记录查找工作名称
        self.workname = workname
        # 基础URL地址
        self.url = 'http://sou.zhaopin.com/jobs/searchresult.ashx?'
        # 工作名称
        args = 'kw=%s&jl='%workname
        # 工作地点
        for city in citys:
            # 判断城市是否为最后一个
            if city == citys[-1]:
                args += city
            else:
                args += city
                args += '%2B'
        # kw=python&jl=北京%2B上海%2B南京%2B广州%2B深圳
        # 拼接完整的url地址
        self.url += args
        self.headers = {
            'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:54.0) Gecko/20100101 Firefox/54.0'
        }
    # 根据页码获取某一页HTML源代码
    def get_page(self,pageNum):
        # 1.根据页码拼接完整的url地址
        getUrl = self.url + '&p=%s'%pageNum
        # 2.创建request对象
        request = urllib2.Request(getUrl,headers=self.headers)
        try:
            response = urllib2.urlopen(request)
        except Exception ,e:
            print '获取第%s页数据失败，原因%s'%(pageNum,e)
            return None
        else:
            return response.read()

    # 从html代码中提取总职位数
    def get_total(self,html):
        # 1.准备正则表达式
        pattern = re.compile(r'


    
        
            
        
        
            
                
                
                    嗨学编程
                    暂无认证
                
            
            
                
                    
                        3浏览
                        0关注
                        1306博文
                        0收益
                    

                    
                        0浏览
                        0点赞
                        0打赏
                        0留言
                    
                
            
            
                私信
                关注
            

        
        
            热门博文
            
                Python：用tkinter制做一个音乐下载小软件
Python丨小学妹喜欢看漫画，于是我写了四十行代码获取了它所有漫画
女同桌找我要表情包，还好我会Python，分分钟给她下载几十个G...
为了防止这上面的文章被封，我连夜用Python获取了它所有内容，真香~
这个Python读取文件的方法，堪称天花板级别...
Python做一个通过输入bv号就能下载视频的工具，评论和弹幕也不放过
Python：50行代码实现下载小说，图片章节可自动识别转文字保存...
只用二十行代码，用Python实现获取网抑云榜单文件保存本地，非常简单...
发现一个舔狗神器，Python真的太厉害了，自动下载妹子视频...
使用Python探索四大名著【红楼梦】人物之间的关系，简直帅呆了







    [ 申请 ]友情链接：
    
        
        优质稳定机场推荐

        绘画宝宝
        配音宝宝
    


    
        
            关于我们
            服务条款
            广告服务
            联系我们
            网站地图
            免责声明
            WAP
        
        技术支持：
            武汉快勤科技有限公司
            XML网站地图 
            备案号：鄂ICP备18027844号-9
            
        
    




    
        立即登录/注册
        
    
    
        
        微信扫码登录