此处输入图片的描述

卡方检验(Pearson’s Chi-square test)主要用来做两件事:

  • 适合性检验(Test for Goodness of fit):检查样本是否符合某种随机分布;
  • 独立性检验(Test for Independence):检查变量之间是否独立。

$\chi^2$ 统计量

我们前面提到过,各种检验方法的差别在于计算的检验统计量不同。

我们先来关注下 $\chi^2$ 统计量,

其中 $A$ 表示实际观察次数, $E$ 表示理论观察次数(对比一下 $\chi^2$ 分布)。

$\chi^2$ 是度量实际观察次数与理论次数偏离程度的一个统计量。

  • $\chi^2$ 越小,表明实际观察次数与理论次数越接近
  • $\chi^2=0$ 表示两者完全吻合
  • $\chi^2$ 越大,表示两者相差越大

举个栗子

我们想判断两组患者的总体阳性率是否相同,

此处输入图片的描述

步骤1: 建立检验假设,限定显著性水平.

这里我们限定显著性水平为 $\alpha = 0.05$.

步骤2: 计算检验统计量.

在 $H_0$ 成立的前提条件下,计算 $\chi^2$ 统计量:

步骤3: 确定P值,做出推断结论.

按 $\alpha=0.05$ 的水准,拒绝 $H_0$,两组差异有统计 学意义(统计结论),认为两组总体阳性率不同,可 以认为肺癌患者癌胚抗原的阳性率要高于健康人。