展示数据分布
工具/原料
R
方法/步骤
1
首先我们引入一个大数据集
2
对于一维连续型分布,最重要的几何对象是直方图 geom_histogram。例如,展示diomands数据集中的depth变量
3
如果你想展示更多组间信息,那你可以使用下面的几种参数,按照cut变量的不同取值进行线条的上
4
按照cut变量的不同取值进行填充柱状图
5
geom_density 一维密度曲线图:如果不设置其他参数,实际上就是直方图的平滑曲线版本,无法回溯数据本身,意义不大
6
如果用cut变量的不同取值进行上色,就会得到一个信息量更大的版本
7
如果想比较两个变量之间的关系,那就需要使用其他函数,诸如geom_boxplot:箱型图,也称箱须图横轴取值是离散型变量时:
8
横轴取值是连续型变量时,用cut_width设置离散区间,用xlim设置横轴取值范围
9
横轴取值是离散型变量时
上一篇:骨质增生分为哪几种类型
下一篇:重症肌无力者的五大类型症状!