想要使用python提取一个网页的所有连接,并不是很困难的事情,结合一些第三方模块可以方便的实现这个功能,例如:BeautifulSoup
工具/原料
1
python
2
BeautifulSoup
方法/步骤
1
新建一个Python文档,并导入两个重要模块,示例:from bs4 import BeautifulSoupimport urllib2
2
定义想要访问的url,并使用urllib2模块读取内容,示例:url = 'http://www.baidu.com'html = urllib2.urlopen(url).read()
5
保存以上内容并在客户端执行,获取网页中的所有连接,示例:ptyon 保存的文件名
注意事项
1
需要对BeautifulSoup模块有一定了解
2
喜欢此经验,请投票和点赞
上一篇:怎样获取网站整站链接地址