多语言展示
当前在线:1789今日阅读:84今日分享:32

二项分布的正态分布近似(Mathematica)

介绍二项分布标准化以后,随着n趋近于正无穷,其累计分布趋近于正态分布。这一现象可由中心极限定理得出。
工具/原料

Mathematica

方法/步骤
1

首先,使用符号BinomialDistribution[n,p]创建参数为n,p的二项分布。如图得到该分布的均值和方差,供一会标准化使用。

2

使用PDF得出其概率函数,通过指定两个参变量的数值得到其具体形式。其中Binomial是二项式系数。

3

接下来,要对该二项分布标准化。标准化方法是,(随机变量-期望)/标准差。验证标准化后的均值和标准差,为0和1。

4

使用TransformedDistribution标准化,使用CDF得到标准化后的分布的累计分布函数,是个阶梯状函数。使用Plot绘制该图形。

5

接下来,将该累积分布函数和标准正太分布对照画出。并且使用如图代码产生随n变化的动画。

6

如图当p=0.5时,n从2到100,两个累积分布函数的对比。当p=0.5时图像始终是对称的。

7

如图当p=0.1时,n仍然同样变化。可以看到,当单次概率p偏离0.5时,n较小时偏态非常明显。但是随着n增大,中心极限定理保证了其趋近于对称的标准正态分布。

8

为了计算变换后二项分布累计分布的具体表达式(x的函数),我们首先使用Solve解出指定位置x时,原来二项分布中k的数值(k应当取整)。普通二项分布的累计分布函数,可以使用正则化的不完全beta函数表示,形式已知。接下来,使用正则化的不完全beta函数,带入k。即得到标准化后累计分布。绘图比较结果正确。

9

或者,我们也可以比较变换后的每一个离散项,和正态分布概率密度函数中代表同样宽度的条带的面积(概率)。首先使用Solve,假设原二项分布的k对应变换后的x,使用Solve接触n。令k趋近于正无穷,计算如图极限,发现为1。也就是说,二项分布对任意的x反解出k,对应的离散项的概率和正态分布x处概率密度乘上离散宽度比值为1。那么他们的CDF累计分布函数也处处比值为1。

注意事项
1

中心极限定理的证明难度较大,不在本经验范围。

2

二项分布当np定值时还可以趋近于泊松分布。

推荐信息