爬虫采集过程中单个文本输入和点击登录方法

本文给大家演示单个文本输入及点击登录进行数据采集的方式。

方法/步骤

上述网址如果是需要登陆才能采集的，就需要做一个登陆流程。登陆地址为某猫，我们这个网址里面需要输入用户名、密码登陆进去然后打开前面的网址采集数据。步骤1 登陆采集器7.0版本→点击新建任务→自定义采集，进入到任务配置页面：然后输入网址→保存网址，系统会进入到流程设计页面并自动打开前面输入的网址。

接下来步骤是输入用户名密码了，采集器模拟的是人的操作行为，所以这一步过程也很简单步骤2 在浏览器中鼠标点击用户名输入框→在右边弹出的提示里面选择“输入文字”→输入自己的用户名→选择“确定”同样的方式输入密码这样输入用户名密码的步骤就完成了

接下来模拟人工手动点击登陆按钮，完成这一步就会进入到登陆之后的页面采集我们最终需要的数据了步骤3 在浏览器中鼠标点击登陆按钮→在右边弹出的提示框里选择“点击该按钮”这时候就会看到浏览器会跳转到登陆页面，这时登陆流程便做好了

前面的步骤都完成之后打开我们最终需要采集数据的网址再做之后的采集流程步骤4 点开页面上的“流程”按钮，流程显示出来之后，我们往流程里拖入一个打开网页的步骤，打开最终采集的某猫网址。可以看到浏览器打开之后的网址就已经是登陆的网址了

本教材重点是教用户怎么通过输入用户名、密码方式登陆网站，至于后面的数据采集步骤按照前面新手入门的方法提取即可。小贴士：另外有些网站这个登录框其实是iframe的登录框，iframe即html标签，会创建包含另外一个文档的内联框架（即行内框架），含义是网页中的网页。例如上面某猫的登陆地址，八爪鱼获取的是当时操作时的iframe,但是某猫有防采集措施，如果登录框的xpath有变化的话，就需要通过下面的方式获取登录框的详细URL直接输入这个URL做登陆流程。我们可以通过某狐获取登陆框的详细地址，然后直接输入这个详细的地址进行流程设计在某狐浏览器上鼠标右键登录框→选择此框架→查看框架信息→地址这个地址即为登录框的真实地址，获取到这个地址之后在采集器规则里输入这个地址做规则即可。

上一篇：如何java写/实现网络爬虫抓取网页

下一篇：教你Photoshop液化工具把人物头像变成漫画风格

欧尼酱

爬虫采集过程中单个文本输入和点击登录方法

使用Python3和Scrapy进行网站图片爬虫自动下载

python爬虫入门教程

怎么剪创意小爬虫的画法简单儿童手工剪纸小虫儿

python爬虫的工作步骤

爬虫教学基础篇

Java 简单网络爬虫

网络爬虫类型

最好养的爬虫宠物

python简单爬虫

node.js 爬虫-Puppeteer 包的使用

Python爬虫之文件下载

python如何实现简单爬虫

爬虫wwwhj8828comI8669I44445Scrapy入门教程

如何评测爬虫代理哪家强

怎么用神箭手编写基于JS的爬虫？

如何学习Python网络爬虫？

从零开始的Python爬虫速成指南

爬虫如何防止数据重复爬取

Python 爬虫建站入门手记（1）：环境搭建

Python爬虫--正则表达式

【香菇鸡肉焖饭】

“我的电脑”中腾讯微云的图标怎么删除？

2003版ppt 如何添加自定义动作

给宝宝玩气球时应注意什么？

番茄免费小说怎么查看我下载过的书籍？

怎样自制巧克力手指饼干

怎样做巧克力马卡龙

PPT几张图片怎么组合成一张

“一抹香唇”纯脂手工巧克力的做法

被烧伤了怎么处理？

趣头条的邀请码怎样填写

怎么样炒出好吃的粉丝？

宝宝天天戴银镯子竟然会成这样

蜜月行的出行方式攻略

怎样拒绝别人宴请又不让双方尴尬？

自制花瓣巧克力

热巧克力的做法

暖心巧克力的做法

香菇香肠蛋包饭

年会邀请函怎么制作