统计学中那些乱七八糟的假设检验汇总~

    技术2026-01-22  12

    统计学中一些常见的检验

    检验目的Z/U检验平均值参数 μ \mu μ的检验单总体T检验一组数据平均值和样本值有无差异独立样本T检验两组数据平均值有无差异配对样本T检验一组样本处理前后平均值有无差异 X 2 \mathcal{X}^2 X2检验样本观察频数与理论频数分布是否相一致F检验独立样本的方差的差异显著性检验

    Z/U检验

    特点:大样本,方差已知

    单总体均值的检验统计量: u = x ‾ − μ 0 σ / n u=\frac{\overline{x}-\mu_0}{\sigma/\sqrt{n}} u=σ/n xμ0 双正态总体均值的检验统计量: u = x ‾ − y ‾ σ 1 2 m + σ 2 2 n u=\frac{\overline{x}-\overline{y}}{\sqrt{\frac{\sigma_1^2}{m}+\frac{\sigma_2^2}{n}}} u=mσ12+nσ22 xy

    T检验

    整体特点:小样本、方差未知、样本数据服从正态或近似正态分布 T检验属于参数检验,用于检验定量数据(数字有比较意义的),若数据均为定类数据则应使用卡方检验。关于卡方检验的详细介绍可以参考这篇文章。

    单个正态总体均值的检验统计量: t = x ‾ − μ 0 s / n t=\frac{\overline{x}-\mu_0}{s/\sqrt{n}} t=s/n xμ0 双正态总体均值的检验统计量: u = x ‾ − y ‾ s w 1 m + 1 n u=\frac{\overline{x}-\overline{y}}{s_w\sqrt{\frac{1}{m}+\frac{1}{n}}} u=swm1+n1 xy s w 2 = 1 m + n − 2 [ ∑ i = 1 m ( x i − x ‾ ) 2 + ∑ i = 1 n ( y i − y ‾ ) 2 ] s_w^2=\frac{1}{m+n-2}[\sum_{i=1}^m(x_i-\overline{x})^2+\sum_{i=1}^n(y_i-\overline{y})^2] sw2=m+n21[i=1m(xix)2+i=1n(yiy)2]

    配对样本T检验

    配对样本T检验要求两组样本量相等,而独立样本T检验对样本量没有要求。 t = x ‾ − y ‾ s w n 2 t=\frac{\overline{x}-\overline{y}}{s_w\sqrt{\frac{n}{2}}} t=sw2n xy s w 2 = ( s x 2 + s y 2 ) / 2 s_w^2=(s_x^2+s_y^2)/2 sw2=(sx2+sy2)/2

    独立样本T检验

    条件:

    两样本均来自于正态总体两样本相互独立满足方差齐性(通过方差齐性检验)(F检验)

    若未满足方差齐性检验,则需要看T’'检验的结果

    F检验

    有一个可能混淆的地方: 方差同质性检验即方差齐性检验是——检查不同样本的总体方差是否相同 注意这里的检验并没有对平均值做任何要求,只是满足F检验的前提条件。 在单因素方差分析中使用Levene检验来做方差齐性检验。

    Tips:单因素方差分析和独立样本T检验的区别? 一方面,两个类别的时候可以使用T检验,两个或两个类别以上的数据可以使用单因素方差分析。另一方面,独立样本T检验可以不要求样本满足方差齐性的条件,但是单因素分析必须满足方差的同质性检验。

    Tips:F检验和卡方检验? 卡方检验在正态总体方差的检验中只能检验单个正态总体,而F检验可以检验双正态分布总体。 单正态总体的方差的检验统计量: X 2 = ( n − 1 ) s 2 σ 0 2 ∼ X 2 ( n − 1 ) \mathcal{X}^2=\frac{(n-1)s^2}{\sigma_0^2}\sim\mathcal{X}^2(n-1) X2=σ02(n1)s2X2(n1) 双正态总体的方差的检验统计量: F = s x 2 s y 2 ∼ F ( m − 1 , n − 1 ) F=\frac{s_x^2}{s^2_y}\sim{F(m-1,n-1)} F=sy2sx2F(m1,n1)

    非参数检验

    Mann-Whitney U检验

    使用情境:独立样本T检验中不满足正态分布性 它假设两个样本分别来自除了总体均值以外完全相同的两个总体,目的是检验这两个总体的均值是否有显著的差别。

    单样本Wilcoxon

    使用情境:配对样本或单样本T检验不满足正态分布性

    Kruskal-Wallis 单因子变异数分析

    使用情境:当数据不满足单因素方差分析的条件时(严重偏态)

    Processed: 0.017, SQL: 9