在用pandas进行数据分析之前,我们一把首先要从本地文档中读取数据到pandas中,本次记录一下怎么读取本地的csv文件,并进行数据处理前的观察,预览等操作。
工具/原料
1
python pandas库
2
pycharm
3
csv格式表格(见上图)
方法/步骤
2
上一步将csv文件的数据读取到data_info对象中之后,我们可以简单的预览数据print(data_info.head()),如果head()中没有任何参数的话,默认读取前5行记录。同样的print(data_info.tail(),读取后5行的数据。
3
前两步可以对数据局部有个具体的预览,通过使用columns和shape方法可以对数据整理情况有一个很好的了解。print(data_info.columns) 打印数据的行字段情况print(data_info.shape) 打印数据的行数和列数每一条记录有11个字段,总共有74291条记录
注意事项
1
首先需要先装好pandas,情况好的话直接pip3 instal pandas 。
2
网络或资源不好,可以先下载pandas的wheel文件用pip安装
3
最后这个columns和shape方法非常有用,在数据分析的实际案例中经常需要引用到