标准差(Standard Deviation,缩写STDEV),是一个统计学中的专有名词,用于描述数据的离散程度的统计量。标准差也被称为标准偏差,或者实验标准差[1][2][3] 。一般而言,标准差越小,表明数据越聚集;标准差越大,表明数据越离散。
在国家计量技术规范中,标准差的正式名称是标准偏差, 简称标准差,标准差的名称有10余种,如总体标准差、母体标准差、均方根误差、均方根偏差、均方误差、均方差、单次测量标准差和理论标准差等。标准差是统计学中非常重要的一个概念,可以帮助人们更好地理解和分析数据分布规律,进而进行更加科学和准确的推断和决策。
总体标准差:
样本标准差:
标准误差:
标准差是由英国统计学家卡尔·皮尔逊在19世纪末首先提出来的,当时,人们通过求解方差已经可以很好地描述数据分布的离散程度,但是方差最后获得的值是平方单位的,不利于人们对其进行直观的理解和比较。而标准差的出现,正是为了解决这个问题。[1] 它是方差的平方根,具有良好的可解释性和可比性,更容易被人们直观地理解和应用。因此,到了20世纪初,标准差很快被广泛地应用于数据分析、统计学、概率论以及各种相关领域。
标准差的非负性指标准差的值始终为非负数,即标准差不可能为负数。因为标准差是一个衡量数据分散程度的统计量,它是平均值和每个数据点之间的差的平方的平均值的平方根。平方根的结果始终为非负数,所以标准差也始终为非负数。[1]
标准差的可加性是指在满足一定条件下,两个或多个相互独立随机变量的标准差可以相加。如果有多个随机变量,例如X、Y、Z等,它们各自具有自己的标准差 , , ,想要计算它们的总体标准差s,可以将每个随机变量的标准差平方相加,然后再将其和开平方即可得到总体标准差。使用以下公式:
标准差的正态分布是指,对于一个服从正态分布的随机变量,其标准差的取值也服从一个正态分布。正态分布是由它的平均数 和标准差 唯一决定的,常把它记为 ,即标准差 条件下的正态分布记为 。[3]
从形态上看,正态分布是一条单峰、对称钟形的曲线,其对称轴为 ,并在 时取最大值从 点开始,曲线向正负两个方向递减延伸,不断逼近x轴但永不与x轴相交因此说曲线在正负两个方向都是以x轴为渐近线的。[3]