当前位置:首页>维修大全>综合>

分类变量有什么统计分析方法(统计学里各个分析方法的用途)

分类变量有什么统计分析方法(统计学里各个分析方法的用途)

更新时间:2024-06-08 14:24:51

分类变量有什么统计分析方法

通常在回归分析时,如果是二分类变量可以直接当做连续性变量进行回归,而多分类时,则需要设置哑变量,即将每个类别转换成0,1的编码来表示,因此这里我们求相关系数时,也可以采用类似的设置哑变量,只不过是有几个类别就设置几个哑变量,这也相当于将多分类变量变成了多个0、1编码的二分类变量,然后再直接使用相关分析,选择所有的哑变量和连续性因变量进行普通的pearson相关,就可以得出每个分类与因变量的相关系数了。

)小样本数据:用二项分布进行确切概率法检验;

  (2)大样本数据:用U检验;

  2)多分类数据:用Pearson检验(又称拟合优度检验)。

  2. 四格表(2×2表)数据

  1)完全随机设计的四格表数据的分析

  (1)当样本量n>40,并且4个格子理论数均大于5时,则用Pearson 检验;

  (2)当样本量n>40,并且4个格子理论数均大于1且至少存在一个格子的理论数<5时,则用校正检验或用Fisher’s精确概率法检验;

  (3)当样本量n£40或存在任一格子理论数<1,则用精确概率法检验;

  2)配对设计的四格表数据的分析

  (1)b+c≥40,则用McNemar配对检验;

  (2)b+c<40,则用二项分布确切概率法检验;

  3. 2×C表或R×2表数据的统计分析

  1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则可以采用行平均得分差(Row Mean Scores Differ)的CMH 或成组的Wilcoxon秩和检验;

  2)列变量为效应指标并且为二分类,行变量为有序多分类变量,则可采用普通的Pearson 检验比较各组之间有无差别,如果总的'来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。

  3)行变量和列变量均为无序分类变量:

  (1)当样本量n>40,并且理论数小于5的格子数少于行列表中格子总数的25%,则用Pearson 检验;

  (2)当样本量n£40,或理论数小于5的格子数多于行列表中格子总数的25%,则用Fisher’s确切概率法检验;

  4. R×C表数据的统计分析

  1)完全随机设计的R×C表数据的统计分析

  (1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH 或Kruskal Wallis的秩和检验;

  (2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,则采用普通的Pearson 检验比较各组之间有无差别,如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义;

  (3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析或者非零相关(none zero correlation)的CMH ;

更多栏目