基本概念

对于分类数据,最简单的统计检验就是卡方检验

卡方检验 (Chi-square Test) 是一种衡量实际观察到的频率理论预期频率之间偏离程度的统计方法。

它主要用于分析分类数据(如:性别、颜色、职业等),旨在判断两个变量之间是否存在显著的相关性(独立性检验),或者观测到的数据分布是否符合某种预期的模型(拟合优度检验)。

简单来说,它的核心逻辑是:如果实际情况与理论预期差别巨大,超出了随机误差的范围,我们就认为这两个变量之间存在某种必然的联系。


chisq. test() 函数

使用卡方检验,先要得到频数表。频数表的获取使用 table()(见计算频数),传入两个因子,便得到二维的频数表

将频数表传给 chisq.test() 即可得到 p-value

chisq.test(table(Improved , Threatmemt))