本站所有资源均为高质量资源,各种姿势下载。
格拉布斯准则是一种用于识别数据集中异常值的统计方法,尤其适用于样本量较小(通常n≤30)的情况。其核心思想是通过计算数据点与均值的标准化偏差来判断该点是否属于统计学意义上的异常值。
基本原理 计算数据集的算术平均值和标准差。 对每个数据点,计算其与均值的绝对偏差,并找到最大偏差值。 通过格拉布斯临界值表(与样本量和显著性水平相关)判断该最大偏差是否超过阈值。若超过,则判定为异常值。
实现要点 需预先确定显著性水平(常用0.05或0.01),反映误判概率。 每次仅剔除一个异常值后需重新计算均值与标准差,迭代检测直至无异常。 适用于近似正态分布的数据,非正态数据需谨慎使用。
应用场景 常用于传感器数据清洗、实验测量误差剔除等场景,能有效提升后续分析的可靠性。