总体率估计抽样与显著性检验

    技术2022-07-11  84

    文章目录

    抽样抽样方法:概率抽样和非概率抽样样本量估计总体概率公式样本量公式汇总 均值差异显著性检验单样本总体比例的检验两总体比例之差的显著性检验

    抽样

    抽样方法:概率抽样和非概率抽样

    样本量估计

    样本量:取样时选出的样本量,能代表整体的最小样本量

    有效样本量:有效响应的样本量

    总体概率公式

    总体率:又称为总体比例,指总体中具有某一相同特征表现的单位数量的比重,一般用π表示。常见的总体率:点击率、展示率、响应率等。 计算出的样本量,不一定全部有效,在试验时,需初步确定有效样本比例。用计算出的样本量/有效样本比例得到最终样本量。

    样本量公式汇总

    样本量估计—z检验,适用于正态总体或大样本(n>30)

    均值差异显著性检验

    正态分布下均值差异显著性检验非正态分布下均值差异显著性检验

    均值差异是否显著的主要决定因素

    均值差异是否显著主要受均值之差和标准差的影响均值差异的衡量指标统计量,在正态分布的假设检验中最终转化为均值之差/标准差这一比值的形式;在非正态分布的假设检验中最终转化为取值的排序差异

    组间数据产生数据差异的原因

    差异完全由抽样误差导致存在抽样误差之外的因素导致的差异

    样本观测值:试验中样本所有个体的取值。在广告展示率的案例中,广告展示只有两个值,要么展示要么不展示,即要么取1要么取0;样本观测值就是由样本个体取值组成的一个数组(向量)

    单样本总体比例的检验

    检验统计量:当n很大(>30),且np和n(1-p)两者均>=5时,样本比率的抽样分布近似服从于正态分布,因此,我们可用z统计量作为检验统计量。 其中,π0为假设的总体比例。

    两总体比例之差的显著性检验

    Processed: 0.009, SQL: 9