多语言展示
当前在线:1768今日阅读:126今日分享:42

怎么用python爬取亚马逊图书信息

python是一个比较流行的编程语言,其具有很强大的功能,其中requests库是信息爬取很重要的库,下面通过一个简单的例子来说明怎么样获取亚马逊页面信息吧
工具/原料
1

python

2

requests

方法/步骤
2

复制它的链接

3

导入requests库,获取相应链接的返回信息。

4

输入状态码,返回相应的返回状态。返回的状态如果是200,这说明访问成功。否则,返回失败,这里是503,说明访问失败

5

根据返回的信息判断可能是由于访问进行限制。接受的是由于浏览器发出的http请求。所以通过网站访问的http的头部判断请求

6

服务器判断出访问是由于python的requests库的程序的进行的。因此,修改访问头部的信息,模拟浏览器访问状态。

7

首先构造一个字典类型,修改 user-agent的信息

8

重新提交访问请求

9

再次检查访问状态。下图说明访问成功

10

获取访问的信息就可以了

注意事项

注意检查状态码

推荐信息