多语言展示
当前在线:367今日阅读:167今日分享:27

5种方法用pandas灵活的选择数据

将数据读取到DataFrom中之后,经常需要对庞大的数据进行选择处理,这里记录一下,pandas选择数据的几种方法类型,还是以上一篇的数据为例。1用pandas读取数据并进行数据结构预览
工具/原料
1

pandas

2

pycharm

3

基础数据

方法、步骤
1

如果只想选取某一列数据可以直接使用 print(data_info['户型']) data_info['户型'] 和data_info.户型 结果是一样的,建议使用第一种方法。如果要选取某几行数据 可以使用切片的方法print(data_info[5:9])

2

第二种方法可以使用索引方式,print(data_info.loc[100:110,['小区','户型']])即,选取索引100到110行,小区列和户型列的数据这里要注意 100到110 是默认的索引列数据,没有指定索引时自动生成的。所以不能使用负数去切片

4

第4中方法是索引和位置的混合查找print(data_info.ix[:3,['名称','户型']]) 即,索引0到3行,位置为名称和户型列

5

最后一张是判断的方法查找符合条件的记录print(data_info[data_info.套内面积 > 300]) 即,指定套内面积列大于300的所有记录

注意事项
1

所有查询出来的对象都是一个DataFrom 所以所有查询方法可以结合起来使用

2

判断之前要注意数据的类型,这里我提前把数据转换成了浮点型。

3

data_info[['建筑面积','套内面积']] = data_info[['建筑面积','套内面积']].apply(pandas.to_numeric)

推荐信息