火车头采集器8.6
我们现在以采集同顺商城http://www.tongshun88.com的图片为例,首先复制网址打开同顺商城。选择一类你要采集的图片,你可以选择下面任意你喜欢的一类图片作为图片采集对象(我就以同顺商城的衣帽服饰栏为例)
【第一步】新建任务,编辑采集网址规则。
【同顺商城】的【衣帽服饰】商品产品页一共2421页,由于时间关系,我现在只采集前5页的图片。在火车头批量添加前5也的起始网页网址:http://www.tongshun88.com/?a=class&i=1&b=0&p1=0&p2=0&o=0&k=&p=2&pagecount=2421http://www.tongshun88.com/?a=class&i=1&b=0&p1=0&p2=0&o=0&k=&p=3&pagecount=2421http://www.tongshun88.com/?a=class&i=1&b=0&p1=0&p2=0&o=0&k=&p=4&pagecount=2421http://www.tongshun88.com/?a=class&i=1&b=0&p1=0&p2=0&o=0&k=&p=5&pagecount=2421http://www.tongshun88.com/?a=class&i=1&b=0&p1=0&p2=0&o=0&k=&p=6&pagecount=2421如图.
打开刚刚添加的5个起始网页网址,右键,查看源代码。在源代码中找到能标示商品链接的首和尾,确定好采集网址规则。如下图.
保存所有的采集规则,测试采集,确定采集网址无误,进行下一步操作。
【第二步】编辑采集内容规则。因为是采集图片,所以我们只需要编辑采集内容的的规则就行了。
采集内容规则如下设置:
勾选下载图片和图片保存路径,保存。
【第三步】发布内容设置,保存,所以得设置完毕,开始采集!
在火车头采集器的【date】文件夹内可以找到采集到的所以图片。
在编辑采集网址代码的时候一定要截取代码里唯一的一串代码作为截取代码