Python实现网页源码抓取

Python中的Urllib库功能非常强大，可以下面我们一起来看一下如何用这个库实现网页源码抓取

工具/原料

电脑

Python开发工具

Urllib模块

方法/步骤

用import 命令导入 urllib 库，具体代码为：import urllib.request

用 urllib.request.urlopen 打开一个网页，具体代码为：file = urllib.request.urlopen('http://www.baidu.com')经过上面的处理，我们把读取到的网页内中存到了变量 file当中

用 read 方法将内容读取出来，具体代码为：data = file.read()

读取到内容之后，我们用文件操作方式，将读取的内容存放到文件当中。f = open('date.html','wb') f.write(data) f.close()

我们将内容存到了 date.html 当中，查看文件内容如图所示

上面代码是先读取内容，然后用文件操作方式进行保存源码，下面我们直接用模块中的方法进行保存，代码如下： filename = urllib.request.urlretrieve('http://www.baidu.com',filename='2.html') urllib.request.urlcleanup()

代码总结：import urllib.request file = urllib.request.urlopen('http://www.baidu.com') data = file.read() f = open('date.html','wb') f.write(data) f.close() #直接将网页写入本地 filename = urllib.request.urlretrieve('http://www.baidu.com',filename='2.html') urllib.request.urlcleanup()以上是通过两种不同方式，读取指定网页的内容

注意事项

Python中所有字符需要是英文格式

上一篇：python怎么运行代码

下一篇：小白如何入门 Python 编程

欧尼酱

Python实现网页源码抓取

如何在线学习Python的编程？

Python如何运行一个python程序

如何使用Python实现根据网址采集网页？

Python编程初学者指南

Python web开发框架github下载地址

（web开发）用python创建一个最简单的网站

怎么学习用python编程序：[1]python初尝试

（web开发）用python模拟登录

python 从入门到精通教程一：[1]Hello,world!

python怎么运行代码

Python实现网页源码抓取

小白如何入门 Python 编程

怎么使用PyCharm编写Python程序，简单教程。

如何使用python的requests模块调用网站API

python编程序如何学习

python开发操作系统教程

如何成为一名高级Python程序员

Python下载教程

python入门系列:(3) python的几种编写方式

入门Python的教程

手机照片一键导入电脑

如何在网上预借图书（国家图书馆篇）

三星手机中相片如何导出到u盘

OPPO手机存储的图片，怎么移动到外接OTG卡里

奥日与黑暗森林全成就详解

练出马甲线。

如何把小米手机上的照片传到u盘里

《三国群英传7》新手攻略

怎么练出结实肌肉

如何将手机里的相片放到电脑里或者存到U盘呢

手机连接u盘后怎么传输图片?

如何“脱单”改变单身的命运

华为手机照片如何导入u盘

塞尔达传说 荒野之息 迷宫攻略

备份手机照片传到U盘、内存卡？

密室逃脱12神庙之旅第20关怎么在温室找到扫帚？

撕裂肌肉攻略，男人就该对自己狠一点

手机照片怎样下载到手机U盘

如何将手机照片拷贝到U盘上？

怎样把手机里的照片传到u盘里

塞尔达传说荒野之息迷宫攻略