多语言展示
当前在线:180今日阅读:126今日分享:42

R语言基础:展示数据分布

展示数据分布
工具/原料

R

方法/步骤
1

首先我们引入一个大数据集

2

对于一维连续型分布,最重要的几何对象是直方图 geom_histogram。例如,展示diomands数据集中的depth变量

3

如果你想展示更多组间信息,那你可以使用下面的几种参数,按照cut变量的不同取值进行线条的上

4

按照cut变量的不同取值进行填充柱状图

5

geom_density 一维密度曲线图:如果不设置其他参数,实际上就是直方图的平滑曲线版本,无法回溯数据本身,意义不大

6

如果用cut变量的不同取值进行上色,就会得到一个信息量更大的版本

7

如果想比较两个变量之间的关系,那就需要使用其他函数,诸如geom_boxplot:箱型图,也称箱须图横轴取值是离散型变量时:

8

横轴取值是连续型变量时,用cut_width设置离散区间,用xlim设置横轴取值范围

9

横轴取值是离散型变量时

推荐信息