Python3爬虫教程基础篇之二:网络库Reqeusts详解(上)
蜻蜓代理 · 6年前 · 3019字Requests 是 Kenneth Reitz 编写的一个优雅、易用的 HTTP 库。Requests 的底层基于 Python 官方库 urllib,但 Requets 良好的 API 设计更适合人类使用。 Requests 最核心的两个类,一个是 request(对 HTTP 请求的分装),另一个是 response(对 HTTP 返回结果的封装)。 简单来说,一次 HTTP 请求,其实就是: 从上面可以看出,理解了 request 和 response 类,对掌握 Requests 库和学习 HTTP 协议有很大的帮助。 用法: 常用的请求方法如下: 示例: 请求头是 request 和 response 的描述信息。这里列举几个在爬取数据过程中,比较重要的几个 header。如下: 不同的 状态码一共有5大分类,如下:Requests 是什么
Requests 的核心类
request 类
请求方法
请求方法 资源名
。比如:GET /help.html
、POST /users
GET /index.html
的意思就是,获取 index.html
这个文件资源。GET
方法类似,但是只返回 headers。HEAD 方法通常用于判断一个较大的文件资源是否存在。比如,有一个100M的视频文件,如果用 GET
方法,则这个请求耗时太长。而如果用 HEAD
方法,只获取这个资源的 header 信息,则速度会快许多。
请求头
请求体
Content-Type
头部,请求体的格式是不同的,这里不多做说明。response 类
状态码
转载请注明
- 蜻蜓代理 - Python3爬虫教程基础篇之二:网络库Reqeusts详解(上)
- 头条号 - 蜻蜓软件
- 微信公众号:蜻蜓软件(qingtingsoft)