我的编程空间,编程开发者的网络收藏夹
学习永远不晚

R语言-如何实现卡方检验

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

R语言-如何实现卡方检验

卡方检验

在数据统计中,卡方检验是一种很重要的方法。

通常卡方检验的应用主要为:

1、 卡方拟合优度检验

2、卡方独立性检验

本文主要通过使用自己编程的方法实现相关检验。

卡方拟合优度检验

理论:

1、我们先做出0假设:H0:总体服从假定的理论分布

2、我们再构造一个统计量:

3、当n充分大时

4、我们得到该拒绝域

代码


#Chi_square Goodness Of Fit Test
#函数说明:
#n为所得样本数据;p为理论概率
#alpha为置信水平,df为自由度
cgoft <- function(n,p){
  N <- length(n)#N为样本总容量
  sumn <- sum(n)
  XX <- 0
  for (i in 1:N) {
    XX <- XX +(n[i]-sumn*p[i])^2/(sumn*p[i])
    print(XX)
  }
  return(XX)
}
c <- qchisq(1-aplha,df)

卡方独立性检验

理论:

1、我们先做出0假设:H0:二者没有相关关系

2、我们再构造一个统计量:

3、当n充分大时

4、我们得到该拒绝域

代码


#Chi_square Independence Test
#函数说明:
#n为样本数据,表格按行排列,写成向量形式;row为表格行数
#alpha为置信水平,df为自由度
cit <- function(n,row){
  N <- length(n)
  sumn <- sum(n)
  n1 <- matrix(n,nrow=row,byrow = TRUE)
  column <- N/row
  pi <- c()
  for (i in 1:row) {
    pi[i] <- sum(n1[i,])/sumn
  }
  pj <- c()
  for (j in 1:column) {
    pj[j] <- sum(n1[,j])/sumn
  }
  XX <- 0
  print(pj)
  for (i in 1:row) {
    for (j in 1:column) {
      XX <- XX + (n1[i,j]-sumn*pi[i]*pj[j])^2/(sumn*pi[i]*pj[j])
    }
  }
  return(XX)
}
c <- qchisq(1-aplha,df)

补充:R语言实施皮尔森卡方检验

说明

检查两个数据集中的类别分量是否不同,在统计中会碰到离散型数据与计数数据,比如性别分男、女,某个问题的态度分为赞成、反对,成绩可分优良差,能力可分高中低。对这类数据的统计处理的假设检验一般用计数数据的统计方法进行非参数检验。

卡方检验主要用于两个方面,一是对总体分布进行拟合性检验,检验观查次数是否与某种理论次数相一致。

二是独立性检验,用于检验两组或者多组资料相互关联还是彼此独立。

操作示例(独立性检验)


#mtcars$am有0,1两个因素表示行,mtcars$gear 有3,4,5三个因素表示列
library(stats)
data("mtcars)
ftable = table(mtcars$am,mtcars$gear)
ftable = table(mtcars$am,mtcars$gear)
ftable = table(mtcars$am,mtcars$gear)
> ftable
     3  4  5
  0 15  4  0
  1  0  8  5

#绘制列联表的马赛克图
mosaicplot(ftable,main ="number of forward gears within automatic and manual cars",color = TRUE )

对列联表执行卡方检验,以检测自动档与手动档汽车前驱的齿轮数目是否相同:


chisq.test(ftable)
    Pearson's Chi-squared test
data:  ftable
X-squared = 20.945, df = 2, p-value = 2.831e-05
Warning message:
In chisq.test(ftable) : Chi-squared近似算法有可能不准

总结

卡方检验用于发现两个类别变量之间是否存在某种关联,最适用于数组中非成组信息的检验。使用条件:1.数据都为类别数据2.变量包括两个或者两个以上独立数据组。

H0:变量A与变量B相互独立(gear数目相同)

H1:变量A与变量B相互不独(gear数目不相同)

由图知:自动档的gear要小于手动档的gear.p-value<0.05,拒绝H0,接收H1.

样例输出了一个警告信息,此次卡方检验的结果可能不正确,这是因为列联表的个数小于5。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程网。如有错误或未考虑完全的地方,望不吝赐教。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

R语言-如何实现卡方检验

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

R语言如何实现检验多重共线性的操作

小编给大家分享一下R语言如何实现检验多重共线性的操作,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!函数kappa()df<-data.frame()df_cor=cor(df)kappa(df_cor, exact=T)当
2023-06-14

R语言如何检验数据缺失类型

这篇文章将为大家详细讲解有关R语言如何检验数据缺失类型,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。题目解答由于题目要求需要重复三次类似的操作,故首先载入所需要的包,构造生成数据的函数以及绘图的函数:li
2023-06-25

R语言如何实现LASSO回归

小编给大家分享一下R语言如何实现LASSO回归,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!Lasso回归又称为套索回归,是Robert Tibshirani于1
2023-06-09

R语言如何实现2048游戏

小编给大家分享一下R语言如何实现2048游戏,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!2048 是一款益智游戏,只需要用方向键让两两相同的数字碰撞就会诞生一个
2023-06-14

R语言如何实现数据输入

这篇文章将为大家详细讲解有关R语言如何实现数据输入,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。首先,数据输入最直接最直观的方法就是键盘输入,在上面几篇都已经讲到,利用c创建向量,利用matrix创建矩阵
2023-06-14

R语言如何实现随机森林

这篇文章主要为大家展示了“R语言如何实现随机森林”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“R语言如何实现随机森林”这篇文章吧。随机森林算法介绍算法介绍:简单的说,随机森林就是用随机的方式建立
2023-06-20

Python如何实现MK检验

本篇内容介绍了“Python如何实现MK检验”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!MK检验:时间序列进行检测,并找出突变点,本文参考
2023-06-22

R语言如何实现支持向量机SVM

这篇文章给大家分享的是有关R语言如何实现支持向量机SVM的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。IRIS数据集简介IRIS数据集中的数据源于1936年费希尔法发表的一篇论文。彼时他收集了三种鸢尾花(分别标记
2023-06-20

R语言如何实现前向逐步回归

这篇文章主要介绍了R语言如何实现前向逐步回归,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。前向逐步回归原理前向逐步回归的过程是:遍历属性的一列子集,选择使模型效果最好的那一列
2023-06-20

如何使用R语言实现自动文摘

今天小编给大家分享的是如何使用R语言实现自动文摘,相信很多人都不太了解,为了让大家更加了解,所以给大家总结了以下内容,一起往下看吧。一定会有所收获的哦。自动文摘(Automatic Summarization)是自然语言处理(NLP)中的一
2023-07-06

R语言逻辑回归、ROC曲线与十折如何实现交叉验证

本篇内容主要讲解“R语言逻辑回归、ROC曲线与十折如何实现交叉验证”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“R语言逻辑回归、ROC曲线与十折如何实现交叉验证”吧!1. 测试集和训练集3、7分
2023-06-08

php如何实现区号检验

本篇内容主要讲解“php如何实现区号检验”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“php如何实现区号检验”吧!php实现区号检验的方法:1、新建一个php文件;2、设置页面的编码格式为utf
2023-07-04

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录