Python是目前最流行最简单用途最广泛的编程语言,大数据时代最应该学习的一门编程语言。其中,数据分析的库pandas是Python最经典的库之一。现在我们看一下Series的排序和排名方法的使用例子。
工具/原料
1
python
2
anaconda,spyder
3
Series
方法/步骤
1
前提:加载numpy,pandas和Series,DataFrame。生成一个Series,指定索引,具体如图
2
Series的按索引排序和按值排序。分别使用s1.sort_index()和s1.sort_values()对s1按索引和值进行排序。如图
3
Series如果有缺失值,那么用sort_values方法排序后,缺失值将会被放在Series的末尾,如图
4
Series的排名。这里新生成一个Series,名称是s3,使用s3.rank()或s3.rank(method='average')均可对s3分配平均排名,如图
6
Series的降序排名和升序排名。s3.rank(ascending=False,method='max')表示s3降序并按分组最大排名;s3.rank(ascending=True,method='min')表示s3升序并按分组最小排名;如图
注意事项
1
排序使用sort_index和sort_values注意此处values带's'的,方法后面还要加()
2
排序时自动将缺失值放在末尾
3
排名的时候默认为分组平均排名(即可能出现小数)
4
使用method方法可以选择按原出现顺序排名或者分组的最大、最小进行排名
下一篇:TIMES排名介绍