我的编程空间,编程开发者的网络收藏夹
学习永远不晚

【Python】卡方检验

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

【Python】卡方检验

卡方检验是一种用途很广的计数资料的假设检验方法,属于非参数检验范畴。这种检验方法主要用于推断两个总体率之间有无差别、多个总体率之间有无差别、多个样本率之间的多重比较、两个分类变量之间有无关联性和频数分布拟合优度的检验等。

卡方检验的𝐻0是:实际频数与理论频数没有差别。该检验的基本思想是:假设𝐻0成立,基于此前提计算出𝜒2值,它表示观察值与理论值之间的偏离程度。根据𝜒2分布及自由度可以确定在𝐻0成立的情况下获得当前统计量及更极端情况下的概率P。如果P值很小,说明观察值与理论值偏离程度太大,应当拒绝𝐻0,表示资料之间有显著性差异。否则就不能拒绝𝐻0,尚不能认为样本所代表的实际情况和理论假设有差别。

在实际工作中,对于四格表资料,通常规定:

  1. 𝑛≥40且所有的𝑇≥5时,用卡方检验的基本公式;当𝑃≈𝛼时,改用四格表的Fisher确切概率法。

  1. 𝑛≥40但又1≤𝑇≤5时,用四格表资料卡方检验的校正公式。或改用四格表资料的Fisher确切概率法。

  1. 𝑛<40𝑇<1时,用四格表资料的Fisher确切概率法。

  • 基本的卡方检验:stats.chi2_contingency(data,correction=False)

  • 使用Yates校正的卡方检验:stats.chi2_contingency(data,correction=True)

  • Fisher确切概率法:stats.fisher_exact(data,alternative='two-sided')

  • 配对卡方检验(McNemar检验):tbl.mcnemar(data)

1. 基本的卡方检验

某研究者欲比较膳食干预(实验组)和普通健康教育(对照组)对糖尿病患者血糖的控制达标情况,将171例糖尿病患者随机分为两组,干预6个月后结果如下。问两组控制空腹血糖的总体达标率有无差别?

import numpy as npfrom scipy import statsbg=np.array([[30,56],[43,42]])stats.chi2_contingency(bg,correction=False)#参数correction默认为True,表示对数据进行Yates校正。

(4.309367914097781,

0.03790304243911501,

1,

array([[36.71345029, 49.28654971],

[36.28654971, 48.71345029]]))

P=0.038<0.05,可以认为膳食干预组的空腹血糖达标率高于普通健康教育组。

bg_t=np.ones((2,2))for i in [0,1]:    for j in [0,1]:        bg_t[i,j]=bg[i].sum()*bg[:,j].sum()/bg.sum()        ((bg-bg_t)**2/bg_t).sum()

2. 使用Yates校正的卡方检验

某医师欲比较胞磷胆碱与神经节苷脂治疗脑血管疾病的疗效,将78例脑血管疾病患者随机分为两组,结果如下。问两种药物治疗脑血管疾病的有效率是否相等。

data=np.array([[46,6],[18,8]])stats.chi2_contingency(data,correction=True)

(3.144810267857143,

0.07616885892288706,

1,

array([[42.66666667, 9.33333333],

[21.33333333, 4.66666667]]))

P=0.076>0.05,还不能认为两种药物治疗脑血管疾病的有效率不等。

3. Fisher确切概率法

某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例乙肝表面抗原(HBsAg)阳性孕妇随机分为预防注射组和非预防组,结果如下。问两组新生儿的HBV总体感染率有无差别。

data=np.array([[4,18],[5,6]])oddsr,p=stats.fisher_exact(data,alternative='two-sided')#参数alternative有三个值,'two-sided'表示双侧检验,'less'和'greater'表示单侧检验。# fisher_exact()返回两个值:优势比和p值。p

0.12104475057756482

P=0.121>0.05,

还不能认为预防注射与非预防组的新生儿HBV感染率不等。

4. 配对卡方检验(McNemar检验)

某实验室分别用乳胶凝集法和免疫荧光法对58例可疑系统性红斑狼疮患者血清中抗核抗体进行测定,结果如下。问两种方法的检测结果有无差别。

import statsmodels.stats.contingency_tables as tbldata=np.array([[11,12],[2,33]])result=tbl.mcnemar(data)print(result)

pvalue 0.012939453125

statistic 2.0

P=0.0129<0.05,可以认为两种方法的检测结果不同。

5. 卡方分布

卡方分布:n个独立分布(标准正态分布)的变量的平方和服从自由度为n的卡方分布。

即n个独立的标准正态随机变量的总和Y服从具有n个自由度的卡方分布。

import matplotlib.pyplot as pltx1=np.random.normal(0,1,1000000)x2=np.random.normal(0,1,1000000)x3=np.random.normal(0,1,1000000)x4=np.random.normal(0,1,1000000)x5=np.random.normal(0,1,1000000)x6=np.random.normal(0,1,1000000)q1=x1**2    # n=1q2=q1+x2**2 # n=2q3=q2+x3**2 # n=3q4=q3+x4**2 # n=4q5=q4+x5**2 # n=5q6=q5+x6**2 # n=6fig,axs=plt.subplots(2,3,figsize=(14,8))axs[0,0].hist(q1,100)axs[0,0].set_title("n=1")axs[0,1].hist(q2,100)axs[0,1].set_title("n=2")axs[0,2].hist(q3,100)axs[0,2].set_title("n=3")axs[1,0].hist(q4,100)axs[1,0].set_title("n=4")axs[1,1].hist(q5,100)axs[1,1].set_title("n=5")axs[1,2].hist(q6,100)axs[1,2].set_title("n=6")

来源地址:https://blog.csdn.net/missinghead/article/details/128765212

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

【Python】卡方检验

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

python中的卡方检验是什么

本篇内容主要讲解“python中的卡方检验是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“python中的卡方检验是什么”吧!说明1、统计样本的实际观测值与理论推断值之间的偏差程度,实际观测
2023-06-20
2023-08-31

python方差检验的含义及用法

说明 1、方差检验是用来比较两个或多个变量数据的样本,以确定它们之间的差异是简单随机的,或者是由于过程之间的显著统计差异造成的。 2、自变量X是一种离散数据,自变量Y是一种连续数据(x可以是多种类型),如果数据正态分布,方差应齐次。 实例i
2022-06-02

python方差检验的意思是什么

这篇文章主要讲解了“python方差检验的意思是什么”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“python方差检验的意思是什么”吧!说明1、方差检验是用来比较两个或多个变量数据的样本,以
2023-06-20

Python如何实现MK检验

本篇内容介绍了“Python如何实现MK检验”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!MK检验:时间序列进行检测,并找出突变点,本文参考
2023-06-22

利用python进行T检验

引入所需的包from scipy import statsimport numpy as np注:ttest_1samp, ttest_ind, ttest_rel均进行双侧检验 H0:μ=μ0 H1:μ≠μ0单样本T检验-ttest_1s
2023-01-31

python中的T检验是什么

这篇文章主要介绍“python中的T检验是什么”,在日常操作中,相信很多人在python中的T检验是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”python中的T检验是什么”的疑惑有所帮助!接下来,请跟
2023-06-20

python如何检验对象类型

小编给大家分享一下python如何检验对象类型,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!检验对象类型检验对象类型是Python内省功能的一部分。有时,在应用对
2023-06-27

python selenium滑动验证防检测

目标网站:aliexpress(全球速卖通)阿里国际站登录url : https://login.aliexpress.com/ python selenium 输入用户名,密码 拖动滑块验证,因为这个不涉及到缺口,理论上是很简单的配置好s
2023-01-31

windows7检测不到独立显卡解决方案

部分windows7客户体现自己的电脑检测不到独立显卡,这是怎么回事呢?该怎么办?电脑检测不到显卡很大可能是因为你的驱动没装上,或者装上不兼容电脑的驱动,你可以到官网上去下载驱动,也可以直接应用第三方软件去安装。检测不到显卡也有可能是接触不
2023-07-24

Python检验用户输入密码的复杂度

这篇文章主要介绍了Python检验用户输入密码的复杂度,在用户设置密码的时候检测输入的密码大小写数字等,需要的朋友可以参考下
2023-05-14

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录