多语言展示
当前在线:1296今日阅读:167今日分享:27

地图数据采集

出门打开手机上的百度地图APP,搜索自己要去的目的地、查询乘车或驾车的路线,然后出发。这样的场景在当下的移动互联网生活显得稀松平常。但是,对于需要分析利用地图数据的人来说,如何爬下地图的数据包括商家类型、地点、电话、坐标等等,则是一种更高效简单的应用方法。比起繁杂的团购平台,地图数据显得更加精准直观,大家若有兴趣,不如坐下小板凳,咱们今天就来细说。
方法/步骤
2

在八爪鱼规则里,你简单设置了翻页循环,逐一点取你需要的数据例如商家名称、评价指数、地址、电话。一分钟后,你爬取了地图数据,得到了一份餐饮商家名单。

3

当然,这些都建立在你多次的采集操练,曾经,你在地图上爬取的数据是错位的,你百思不得其解,求救了采集老手之后,你明白是Xpath的设置问题。所以今天,你轻车熟路地在“提取数据”这个步骤修改了Xpath。

4

你骄傲地宣称,这一整个采集过程,花了不到两分钟的时间。成都火锅店—以高德地图为例你是一名火锅底料经销商,早年也承接火锅食材的批发生意,或者你梦想着有一天,能开一家自己的火锅店。总之,在成都这个城市,你嗅到了火辣辣的火锅商机。

5

因此,你需要掌握成都所有的火锅店的数据,其中最重要的是他们的选址和电话,不管是用于业务开发还是为了以后的火锅创业而关注筹划。你以为我肯定又要说你打开了八爪鱼采集器,NO!你首先打开了高德地图网页,然后再打开了八爪鱼采集器。复制网址,点击设置你要收集情报的地区“成都”,输入关键词“火锅店”。

6

然后你逐一勾选了自己想要提取的情报,就是下面这些

7

高德地图很矫情,它的采集页面是Ajex页面(假装我知道什么是Ajex页面),反正八爪鱼采集大神多次对我强调,你要记得在“提取数据”之后还要设置“返回”,如下图所示。

8

就这样,成都地区火锅店的采集就大功告成了,好吧,我知道你们只想看采集成果。

9

酒店信息—以搜狗地图为例作为酒店管理专业的学生,你可能正在经历深圳酒店行业分析报告的折磨。作为酒店运营者,你希望能够实时掌握竞争对手酒店的定价信息。或者你只是一个普通的酒店业务开发人员,不管什么业务,总之你就是需要相关的酒店数据。于是你打开八爪鱼贴入网址,搜索酒店,创建一个简单的规则,提取你所需的数据,直接生成了一份深圳市酒店的数据。其中包括酒店名称、价格、好评率、电话、地点等等,是不是很详细?

10

地图采集需要掌握一定的xpath知识,如果各位看官有兴趣深究为大神,可以在八爪鱼官网找到这两个视频自学。

11

如果不想动手做规则的,很简单,你也可以移步“数多多”规则市场,里面关于地图采集的规则种类繁多、应有尽有,有些还可以采集到商家具体的坐标。

推荐信息