多语言展示
当前在线:1284今日阅读:19今日分享:20

Mathematica数据可视化:[31]散点图

到目前为止,我们已经了解了有关时间和比例的一些基础数据关系。我们可以掌握对象随时间变化的趋势  ,或者比较对象中包含的各个部分所占的百分比, 接触了DateListPlot 和 PieChart , 那我想说的是, 其实跳过去了很多理论背景, 以及 Mathematica 图表的函数工具具体如何应用. 我只是从每一大类的数据可视化中摘出了一个函数分享一点经验, 那在这一小节呢, 我们把目光聚焦在关系数据的可视化上.
方法/步骤
1

一提到关系, 我们就想到先用散点图把相关数据绘制出来, 从图中看看这两者是不是存在这关联关系, 或者是因果关系. 两个变量存在的关系, 还是很容易去处理的, 我们来看平日用散点图来显示一组变量的例子( 数据集合源自[1]). 美国人口统计局公布的 2005 年美国各州的每10万人中, 谋杀, 抢劫的犯罪率, 共有7种, 我们先来看看其中两种, 谋杀和盗窃. 观察两者之间是否存在某种联系. 考虑是否谋杀率相对较高的州, 盗窃率也比较高.  第一步数据的导入, 然后检查整个数据的结构:

2

接着, 数据集合稍作分析.  可以看的出 第一列显示的州名, 其他每一列是各种类型犯罪的发生率. 比如抢劫是每10万人发生140.7 起.

3

下面开始过滤, 整理数据, 我们并不需要整个数据矩阵, 是吧. 那只把用于绘图的数据和吃一点, 用来做标签的美国各州的州名提取出来.

4

我们先看开始绘制出图像, LIstPlot 命令即可完成此任务, 记住 x 轴代表谋杀率, y 轴表示入室盗窃率.

5

这里需要暂停一会, 我想要告诉大家非常重要的一点, 看到了 y 轴的绘图范围了吗? 并不是从 0 开始, 所以容易让观众产生误解(除法你是有意而为之的!) , 让我们调整 y  轴的绘制范围, 再次运行并且赋值给一个变量, 会更清楚看到整幅图形.

6

似乎谋杀与入室盗窃有着较为强烈的对应关系, 现在我们来求出这个线性回归的方程吧, 当然 Mathematica 可以得出很多相关的属性.

7

现在让我们将该线性方程和原来的图形放在一个坐标轴下, 大家会得出更加清晰的结论来.

8

并没有完, 还需要经过很多的实际去修饰, 整理, 最后得到的图形如下图所示:

注意事项

关联数据的可视化 难点在于如何一次性展示三个或更多个变量间的多元关系,  也就是如何在在一幅图形中展示多个变量的相关性.

推荐信息