Python3爬虫(1)——爬取一个页面

    技术2022-07-11  111

    Python3爬虫(1)——爬取一个页面


    三七二十一

    不管三七二十一,先放代码。

    import requests if __name__ == "__main__"": target = "https://www.baidu.com" # 网页链接 page = requests.get(target) # 获取页面并保存到变量page中 text = page.text # 将页面以文本方式输出 print(text)

    运行结果(为了美观,部分截图):

    代码分析:

    import requests

    爬虫的包很多,选一个用就好。requests 就是其中一个。 requests包的安装

    1. pip install requests 2. pip install -i https://mirrors.aliyun.com/pypi/simple/ requests 3. https://mirrors.aliyun.com/pypi/simple/requests/

    三种方法的比较: 第一种慢 第二种快 第三种下载后多一步python setup.py install 大多数包使用第二种就可以了,不过有些包的安装可能会出错,此时使用第三种并修改setup.py等的错可手动安装。

    Processed: 0.010, SQL: 9