如何使用爬虫下载网站小说

以免费小说下载网站下载小说为例.从网站上直接下载小说的页面如图，这里利用python从网站的每章的小说阅读页面读取小说、写入到文件中.

代码实现

首先import所需的库，urllib.request的urlopen和beautifulsoup.由于需要将内容写入到txt文件中，也需要import os库

输入文本写入路径，使用urlopen打开网址并用beautifulsoup解析.

打开网站源代码，找到小说地址，查看其所属区域块.每个块都会有起始、终止符号，例如

...

，符号中间的部分是该块的内容，同时，每个块不是只有一个，需要其他标签定位等.

list是小说网址部分的内容href=子网址，由于源码内ul有3个，所需部分是最后一个，所以加上下标定位最后一个ul。

如步骤3中图片所示，网址的内容是不全的，前面省略了主网址。为保证正确，需要打开该网址，查看主网址，在代码中重定义org_url.

内容的下载、写入部分代码如图.第一个for循环是写入每章的内容.第二个for循环写入该章的内容.该部分也需要查看具体章节页面的源码.最后关闭文件，进行保存.

结果

运行该命令，代码正确后会显示如图.可以看出文件正成功逐章下载。

打开保存的文件，会看到小说成功保存到文件中，如图.

上一篇：python爬取网络数据后保存为csv文件格式乱码

下一篇：如何禁止浏览器爬虫

欧尼酱

如何使用爬虫下载网站小说

如何正确的开关机？

电脑如何开机、关机

如何养成正确开关机的好习惯！

电脑如何设置自动开关机？

如何设置自动开关机

如何设置电脑自动开关机？

如何查看电脑开关机时间，开关机时间记录在哪里

如何设定快速开机、关机以及在固定的时间关机

如何查看电脑开关机记录

如何查看电脑开机关机时间

win10怎么关机如何关机（四种方法）

win10怎么关机如何关机（四种方法）

iphone x如何进行开关机

如何加快开机关机速度

如何看开关机记录

开机键损坏了如何开机，怎么开机

如何加快电脑的开机和关机速度？

iphone如何开机、关机、重启和死机处理?

如何让电脑定时开机和定时关机设置

电脑如何设置定时开机和定时关机呢？

玩游戏网络不稳定，完美解决方法

玩游戏cpu使用率高怎么办

电脑玩游戏的时候FPS突然降低变卡怎么办？

电脑玩游戏卡是什么原因，玩游戏卡怎么办？

喜欢玩游戏可以找什么工作 喜欢玩游戏怎么赚钱

玩游戏到底为什么？

正版足球服该怎样洗涤保养？

玩游戏延迟很高怎么办？（网速正常,速度也快）

你玩游戏的FPS低吗?想知道如何提高吗？

龙族幻想卡塞尔队服怎么获得

WE队服从青涩到成熟到王者，唯一不变的是王者路

对于小孩玩游戏父母禁止的几点意见

刺激战场国际服战队服怎么购买

小孩玩游戏好不好

笔记本玩游戏总是掉帧

怎样测试宽带网速，然后优化网络提升速度。

如何解决玩游戏时电脑卡顿的问题

怎么让fps稳定 玩游戏很卡怎么办 FPS低 波动

电脑玩游戏fps低怎么办

玩游戏不流畅、卡帧、掉帧怎么办？

喜欢玩游戏可以找什么工作喜欢玩游戏怎么赚钱

怎么让fps稳定玩游戏很卡怎么办 FPS低波动