标准偏差是一种用来描述数据分散程度(离散程度)的统计量,通常表示为σ。 下面是计算标准偏差的步骤:
1. 计算平均值:计算数据集的平均值x̄,即各个数据之和除以数据个数。
2. 计算偏差:每个数据点与平均值的差值称为偏差,即xi - x̄。
3. 计算偏差的平方:对每个偏差进行平方,得到(xi - x̄)^2。
4. 计算方差:将所有偏差的平方求和并除以数据个数n,得到方差s^2,公式为:s^2 = ∑(xi - x̄)^2 / n。
5. 计算标准偏差:将方差取平方根就得到标准偏差σ,公式为:σ = √s^2。
例如,对于数据集[2, 4, 6, 8, 10],可以按照上述步骤计算标准偏差:
1. 平均值 x̄ = (2+4+6+8+10)/5 = 6
2. 计算偏差:(-4, -2, 0, 2, 4)
3. 计算偏差的平方:(16, 4, 0, 4, 16)
4. 计算方差:s^2 = (16+4+0+4+16) / 5 = 8
5. 计算标准偏差:σ = √8 ≈ 2.83
因此,该数据集的标准偏差为2.83。标准偏差越大,数据分布越分散;标准偏差越小,数据分布越集中。