很多时候大家会用到python来爬取网络中想获取的数据,然后进行保存。有些人会保存为csv文件格式,可能会出现乱码的情况。下面我来分享一下我的经验,如何解决python保存csv文件数据后不乱码
工具/原料
1
电脑:华硕 FH5900V 、系统:win10
2
编程语言:python3.0
方法/步骤
1
首先,我们运行我们的爬虫程序,发现我们可以直接写入文件,并没有bug。如图:
2
当我们首次使用wps,或者office打开csv文件时,也不会发现有乱码在里面。如下图:
3
然后,我们保存文件后,再次运行爬虫程序时,就发现了乱码,如下图:
4
第四,这是由于wps、office只支持打开GBK等类型的存储格式,如果是UTF-8的话就会出现乱码,所以我们把存储的数据格式改为‘GBK’就行。如下图:
总结
1、确保程序能够完整的运行2、如果用wps或者office打开,我们要考虑换数据存储格式3、数据存储格式改为‘GBK’
注意事项
如果不用wps打开或者office打开文件的话,用记事本的话,就可以不用改编码格式。