淘先锋技术网

首页 1 2 3 4 5 6 7

参考资料:电子工业出版社的《深入浅出统计学》

前言

并非所有数据集合都是离散的、可以指定确切数值的概率分布,其中也有数值型的概率分布,最典型的便是正态分布。

具体内容

离散型和数据型数据

离散型数据就像一块块垫脚石,可以从一个数值跳到另一个数值,同时每个数值之间都有明确的间隔。连续型数据往往通过测量得到,而不是通过计数得到,测量结果在很大程度上取决于测量精度要求。
在处理连续数据的时候,实际上是考虑一个可以接受的精度,比如我们想要10英寸的细线,但实际上这种测量本身并不精确,我们可能要的只是能满足一定范围的细线就可以了,比如9.5英寸到10.5英寸之间的细线。也因为如此,在连续概率分布中,我们想求一确定无疑的数值的概率时会发现其始终为0,因为根本难以达到那种精度。
对于离散概率分布,我们关心的是取得一个特定数值的概率,而对于连续概率分布来说,我们关心的是取得一个特定范围的概率。

概率密度函数

概率密度函数描述连续随机变量的概率分布,它给我们指出了该概率分布的形状,并开辟了计算概率的道路。在这里插入图片描述

正态分布

正态分布之所以被称为正态,是因为它的形态看起来呵护理想,在遇到测量值之类的大量连续数据时,你通过很期望数据符合这种形态。在这里插入图片描述
μ \mu μ指出曲线的中央位置, δ 2 \delta^2 δ2指出分散性,这也意味着 δ 2 \delta^2 δ2越大,正态分布曲线越扁平、越宽。值得指出的是,在正态分布中,概率密度始终不可能为0,因为不管多少难发生但多少有些可能。在这里插入图片描述

正态概率计算

1、确定分布与范围:如果正态分布适用于所遇到的情况,那看看是否能求出均值和标准差。因为只有先得知这些,我们才能只有正态分布的特性。
2、标准化:利用标准分来将其他非标准正态分布转化成N(0,1)标准正态分布。 Z = X − u δ Z=\frac{X-u}{\delta} Z=δXu在这里插入图片描述在这里插入图片描述
3、利用概率表查找概率:通过标准分,利用标准正态概率表可以查找任何z值,进而查出相应概率P(Z<z)。
在这里插入图片描述