Python爬虫实现模拟自动刷新51job简历

    技术2022-07-11  110

    # !/usr/bin/python # Filename: 实战 自动刷新简历.py # Data : 2020/07/01 # Author : --king-- # ctrl+alt+L自动加空格格式化 # 反爬策略 # 1.伪装U-A # 2.使用代理ip # 3.图片识别验证码 # 4.抓包分析突破异步加载-ajax # 5.降低访问频率 # 6.添加cookies from selenium import webdriver import time # from 用户名密码.py import accont_name,accont_pass import random import datetime # 1.模拟登录51job # 1.1 模拟打开指定url url = 'https://www.51job.com/' broswer = webdriver.Chrome() broswer.get(url) # 1.2 设置浏览器窗口大小 broswer.set_window_size(1024,800) # broswer.maximize_window() # 窗口最大化 # 2.登录 # 2,1 定位登录按钮并点击 # 注意class属性名尽量不要出现空格,可以值写一部分class属性名 # .click()模拟点击 time.sleep(2) broswer.find_element_by_class_name("showLogin").click() # 2.2 等待,防止页面打开缓慢 time.sleep(2) # 2.3 定位到账号的输入框 username = broswer.find_element_by_id("loginname") # 2.4 输入用户名 time.sleep(2) username.send_keys("xxx用户名") # 2.5 定位到密码的输入框 time.sleep(2) password = broswer.find_element_by_id("password") # 2.6 输入密码 # 可以把账号和密码写入其他py文件,然后import # 也可以加密 # 也可以从其他文本文件导入 time.sleep(2) password.send_keys("xxx密码") # 2.7 再次定位并点击登录键 ret = broswer.find_element_by_id("login_btn").click() print('登陆成功') # 3.刷新简历 # 3.1 定位刷新简历按钮 # 有id优先选id time.sleep(2) while True: # 设定一个随机数 wait_time = random.randint(10,15) # 等待10~15秒的一个随机时间 time.sleep(wait_time) # 定位刷新简历的按钮并点击 broswer.find_element_by_id("refreshresume").click() # 打印刷新成功的时间 print("简历在%s刷新成功"%datetime.datetime.now())
    Processed: 0.011, SQL: 9