给大家介绍爬一爬数据采集器使用教程,对于编程基础不是很强的数据分析人员来说,这款数据采集器简直像是量身定做。跟之前使用过的其他爬虫软件对比发现,爬一爬数据采集器在使用过程中有几点感受必须大赞特赞。 (1)免费。不仅插件可免费,而且采集的数据也可免费下载,下载格式为Excel,方便处理数据。 (2)操作简单。可视化采集数据,只需通过鼠标的点击就可以智能的识别您对数据的需求,色彩框可以您清晰的看到自己采集了哪些数据。(3)跨平台。不再需要担心操作系统的问题, 无论是Windows、Mac、Linux, 都可以使用。轻量高效率。(4)高效率。没有复杂的客户端,只需要一个Chrome插件。使用谷歌浏览器高效的V8引擎,不再需要担心CPU及并发问题。
工具/原料
爬一爬数据采集器
方法/步骤
1
首先在爬一爬官网(pa1pa)下载谷歌浏览器插件,并如下步骤安装。
2
安装成功后,在浏览器点击插件栏上便会出现”爬”的图标,注册登录即可使用爬一爬数据采集器。
3
打开想要采集的网站,点击浏览器插件栏的”爬”的图标,启动插件。点击选取所要抓取的元素。如果色彩框没有包含所有的任务数据, 点击 切换按钮切换算法,直到选中所有的任务数据。
4
如果要抓取多页信息,按照下图所示,点击分页设置的箭头后,选中页面所在的区域
5
确认色彩框选中全部数据后,先点击“完成”按钮,再点击“测试”按钮,测试所采集的数据是否就是您想要的
6
确认测试成功后,点击”OK”关闭测试窗口。填写任务名称(长度为4-32的字符,必填),并根据个人需要修改列名。
7
点击“提交”按钮,任务创建成功。您可在爬一爬官网的“任务”页面下运行并管理该任务。
8
数据抓取成功后,点击官网“任务”页面的数据选项即可查看并下载数据。
9
如果想获得本例采集的数据,可在爬一爬官网论坛页面的数据中心下载或关注我索要即可。