在科学研究过程中,常常需要对试验结果进行统计分析,标准差( Standard deviation) 和标准误( Standard error) 是数据分析中经常用到的3 个统计量。在科研结果的整理和论文写作过程中,如何正确合理的应用标准差与标准误也是常常碰到的问题。

SD标准差的定义

标准差(standard deviation)是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的,标准差未必相同。标准差,简称SD,描述的是样本集的离散程度,或者说数据的波动大小(两个均值相同的样本集,离散程度(即标准差)不一定相同)。即下面的公式:

标准误公式_异方差稳健标准误公式_平均数标准误公式

SEM均值标准误的定义

均值标准误,Standard error of mean,即SEM,也称为均值标准误差,均值标准差标准误公式,大多数时候约定称为标准误。SEM描述的是多个均值样本的标准差,体现均值抽样分布的离散程度,反映了样本均值之间的差异。标准误用来衡量抽样误差,标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。因此,标准误是统计推断可靠性的指标。样本容量越大,标准误越小标准误公式,那么抽样误差就越小,就表明所抽取的样本能够较好地代表总体。

标准误是由样本的标准差除以样本容量的开平方来计算的。但是SEM的定义是从多个样本均值来的。简单来说,一个总体可以取很多次样本(甚至这个样本集只有一个样本),这个1个样本也是总体的一次体现,从1个样本的情况累加到N个样本的情况,求每次的均值,然后再求均值的标准差。即下面的公式:

联系和区别

标准误和标准差,都是来自统计学,是想从样本集获得总体分布特征的学科。然而,现实中不可能得到所有数据,只能抽样,然后利用统计原理进行分析,用得到的结果来代表总体的情况。

区别:SD用来表征样本的离散程度;SEM用来表征得到的均值是否能体现总体均值,即均值稳定性的表现。

联系:SEM的计算用到SD,在SD的基础上再除以N(样本数量),所以在动物实验设计时,尽量使N值较大,建议大于30。作图时,SEM那根柱线会看着比SD小很多(毕竟除了N,而且又开方了)。

标准偏差(SD)与标准误(SEM)之间的差值很容易混淆。主要区别在于:

随着样本量变大,SEM变小。因为大样本的平均值可能比小样本的平均值更接近真实的总体平均值。因此在一个巨大样本的情况下,即使数据非常分散,但你也能非常精确地知道平均值的值;

随着你获得更多的数据,SD不会发生可预测的变化。你从样本中计算出的SD是对总体SD的最佳估计。随着你收集更多的数据,你将更精确地评估总体的SD。但你不能预测来自大样本的SD是否会大于或小于来自小样本的SD。

总结

标准差(亦称单数标准差)一般用s表示, 是表示个体间变异大小的指标,反映了整个样本对样本平均数的离散程度, 是数据精密度的衡量指标;而标准误一般用Sx表示, 反映样本平均数对总体平均数的变异程度, 从而反映抽样误差的大小 , 是量度结果精密度的指标。

标准差是最常用的统计量, 一般用于表示一组样本变量的分散程度; 标准误一般用于统计推断中, 主要包括假设检验和参数估计, 如样本平均数的假设检验、参数的区间估计与点估计等。

往期推荐

限 时 特 惠: 本站每日持续更新海量各大内部创业教程,一年会员只需98元,全站资源免费下载 点击查看详情
站 长 微 信: muyang-0410