关于python爬虫的淘宝信息爬取要点

    技术2022-07-13  60

    1、如何绕过登录验证,

          在网页登录自己的淘宝账号,f12打开开发者模式找到如图所示cookie

    如图所示定义cookie的值,爬取数据时,便会默认已登录

     2、如何筛选信息

       通过正则表达式进行筛选

    教程https://www.runoob.com/regexp/regexp-syntax.html

    例:

    Processed: 0.009, SQL: 9