如何用python抓取动态网页数据

python制作爬虫是比较方便的，爬取的网页有静态和动态的区分，此经验演示如何爬取动态网页数据。

工具/原料

pycharm

方法/步骤

在浏览器中按F12，打开开发者工具，选中network、ALL，点击名词的“下一页”，会显示出请求数据。

点击右侧的Preview，会看到有json数据，展开后，能看到显示的名词。

在headers中能看到请求的url地址跟参数，接下来就是要在pycharm中编写代码来获取相应的数据了。

# -*- coding:utf-8 -*- import re,requests,json from lxml import etree headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.', } def downloadtxt(url,coding='gb2312'): try: html = requests.get(url, headers=headers) html.encoding = coding return html.text except: return if __name__ == '__main__': for i in range(432): url = 'https://sp0.baidu.com/8aQDcjqpAAV3otqbppnN2DJv/api.php?resource_id=28204&from_mid=1&format=json&query=名词&sort_type=1&pn={}&rn=40'.format(i*40) res = downloadtxt(url) json_data = json.loads(res) for word in json_data['data'][0]['result']: print(word['ename'],end=',') print() downloadtxt是封装的一个获取请求返回结果的函数，在main主函数中有进行调用，for i in range(432)，是因为共有432页。

最后会直接print到屏幕，结果如图。

上一篇：怎么查看python版本

下一篇：Python的下载和安装

欧尼酱

如何用python抓取动态网页数据

如何提高自己的情商（EQ）

如何才能提高自己的情商 提高情商的方法

如何提升自己的情商

如何提高自己的情商

如何让宝宝睡得更香

剖腹产后如何快速恢复？

剖腹产后如何恢复？

剖腹产产妇如何坐月子

如何检查完美万词王APP的是否最近版本

过完年后企业如何避免员工跳槽？

如何减轻饥饿所带来的痛苦

减肥期间如何抵抗饥饿？ 5大妙招帮你抵抗饥饿

如何吃东西少影响健康？

如何减肥不饿肚子

如何保护好自己的肠胃

如何记住高中英语单词 不遗忘

我叫MT 如何获得免费符石 刷紫卡

Cdr如何做印章？一键解决

如何用withme录制视频寄送给三年后的自己

如何将Win8.1开始界面分组？

狼人杀守卫牌怎么玩

海上狼人杀攻略

滤镜的使用：做一个美丽光环

怎样告别“婴儿肥”

长嘴贵宾怎样美容

图虫怎么制作卡点视频，有图虫同样功能的软件。

高考分数线在哪里有公布?

如何查询高校历年录取分数线

高考同一分数如何录取

哪里可以查各大学高考的录取分数线和专业

怎么查询2021考研国家线

如何查往年各高校高考录取专业分数线

高考分数线怎么查

如何查询2020年各大学录取分数线

高考分数怎么看名次

清华大学各专业录取分数线-历年平均分参考

春季关键要养肺 运动加食疗养肺最有效

肺癌患者该如何养肺

清肺居家小妙招

怎么在冬季护肺

如何才能提高自己的情商提高情商的方法

如何记住高中英语单词不遗忘

我叫MT 如何获得免费符石刷紫卡

春季关键要养肺运动加食疗养肺最有效