多语言展示
当前在线:571今日阅读:19今日分享:20

Python爬虫(我怎么知道标题写啥嘛)

python爬虫
工具/原料

Python3.5 IDLE

方法/步骤
1

首先我们先打开Python 按ctrl+n新建一个文件

2

那我们就先导入一些模块吧 要用到的模块有 :1、requests库  http://blog.csdn.net/shanzhizi/article/details/50903748 2、re 正则表达式 http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html

3

那我们先让爬虫模拟一个浏览器环境

4

然后写个提示 让用户输入要搜索的内容和获取用户输入的内容

5

那么要怎么样才能让网站知道我们需要搜索的内容呢(貌似我还没定义URL)

6

那么怎么让他显示内容呢,先改下网站的编码格式,,然后再打印输出就行了,可是搜索结果好乱,如果我只要链接怎么办!!!

7

只需要链接的话就用BeautifulSoup库,虽然前面没有提到,下载以及使用方法http://cuiqingcai.com/1319.htmlprint(link.get('href'))#输出

8

正则表达式???

注意事项
1

正则表达式你们可以完善一下,我做的不怎么好

2

以上链接是转载的,侵立删

推荐信息