教你如何编写自己的第一条爬虫代码
工具/原料
1
Python 3.8
2
sublime
方法/步骤
1
下载安装Python:打开官网链接,下拉找到download,选择最近版本Python 3.8
2
点击进去,下拉,根据自己的电脑选择对应的版本
3
如果不知道自己的电脑是32位还是64位,可以按下win+q,搜索此电脑,点击属性,即可查看到
4
下载安装代码编辑工具sublime:打开官网链接,点击download for windows即可
5
打开sublime,开始编写代码import urllib.request #表示输入URL链接请求模块
8
打印出请求到的信息。这样就完成了一条简单的爬虫,爬取到的数据还需要进行数据的清洗
9
对爬取到的数据进行清洗,获取到自己想要的信息:1、引入正则表达式模块:import re
10(.*?) 'data=re.findall(pat,response) #通过正则表达式进行数据清洗
通过正则表达式对数据进行清洗:pat=r'
12
好了,这就是简单的数据爬虫与数据清洗,后续我会为大家分享更加深入的爬虫知识
下一篇:C#如何写爬虫