将数据读取到DataFrom中之后,经常需要对庞大的数据进行选择处理,这里记录一下,pandas选择数据的几种方法类型,还是以上一篇的数据为例。1用pandas读取数据并进行数据结构预览
工具/原料
1
pandas
2
pycharm
3
基础数据
方法、步骤
1
如果只想选取某一列数据可以直接使用 print(data_info['户型']) data_info['户型'] 和data_info.户型 结果是一样的,建议使用第一种方法。如果要选取某几行数据 可以使用切片的方法print(data_info[5:9])
2
第二种方法可以使用索引方式,print(data_info.loc[100:110,['小区','户型']])即,选取索引100到110行,小区列和户型列的数据这里要注意 100到110 是默认的索引列数据,没有指定索引时自动生成的。所以不能使用负数去切片
4
第4中方法是索引和位置的混合查找print(data_info.ix[:3,['名称','户型']]) 即,索引0到3行,位置为名称和户型列
5
最后一张是判断的方法查找符合条件的记录print(data_info[data_info.套内面积 > 300]) 即,指定套内面积列大于300的所有记录
注意事项
1
所有查询出来的对象都是一个DataFrom 所以所有查询方法可以结合起来使用
2
判断之前要注意数据的类型,这里我提前把数据转换成了浮点型。
3
data_info[['建筑面积','套内面积']] = data_info[['建筑面积','套内面积']].apply(pandas.to_numeric)
上一篇:vb.net对话框操作实例(二)