样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;
样本方差的算术平方根叫做样本标准差。
样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。
数学上一般用E{[X-E(X)]^2}来度量随机变量X与其均值E(X)的偏离程度,称为X的方差。
定义
设X是一个随机变量,若E{[X-E(X)]^2}存在,则称E{[X-E(X)]^2}为X的方差,记为D(X)或DX。
即D(X)=E{[X-E(X)]^2},而σ(X)=D(X)^0。5(与X有相同的量纲)称为标准差或均方差。
由方差的定义可以得到以下常用计算公式:
D(X)=E(X^2)-[E(X)]^2
方差的几个重要性质(设一下各个方差均存在)。
(1)设c是常数,则D(c)=0。
(2)设X是随机变量,c是常数,则有D(cX)=c^2D(X)。
(3)设X,Y是两个相互独立的随机变量,则D(X Y)=D(X) D(Y)。
(4)D(X)=0的充分必要条件是X以概率为1取常数值c,即P{X=c}=1,其中E(X)=c。
标准差 标准差(Standard Deviation)
各数据偏离平均数的距离(离均差)的平均数,它是离差平方和平均后的方根。
用σ表示。因此,标准差也是一种平均数
标准差能反映一个数据集的离散程度。平均数相同的,标准差未必相同。
例如,A、B两组各有6位学生参加同一次语文测验,A组的分数为95、85、75、65、55、45,B组的分数为73、72、71、69、68、67。
这两组的平均数都是70,但A组的标准差为17。08分,B组的标准差为2。16分,说明A组学生之间的差距要比B组学生之间的差距大得多。