在很多时候我们厌烦了【open】一个文件,再去进行读和写,特别是对于学习python的新手同学来说。而pandas包是一个很好的处理数据的包,今天我们来一起学习一下如何使用pandas包来读写数据文件吧!
工具/原料
1
pycharm
2
python3.7
3
win10/7
方法/步骤
2
读取文件时,使用【read_csv】函数一般包括文件名(这个自行定义),【sep】表示每一列数据之间的分割方式,是空格形式【' '】,还是tab形式【'\t'】或者其他形式,但常用的无非就这两种。【header=None】表明数据中的第一行不作为列名;使用head打印前十行看一下效果:
3
如果需要自行指定列名,形如下图,以【names】参数,每个[]中代表每一列的名字,有几列就定义几个列名;再打印出来看看效果:
4
写文件所用到的函数是【to_csv】函数。首先假设我们随便定义一个【a】数组,打印出来;
5
然后将数组转化为Dataframe形式,注意,只有Dataframe形式才能用pandas包写入,而且在使用pandas包时,数据一概都是Dataframe形式。这里写入的参数中有一个【index=0】表示数据写入时不需要写入索引;
6
这样打开【test】文件,发现写入成功了
注意事项
1
对于不等长的数组读写可使用numpy包!
2
欢迎交流!