我的编程空间,编程开发者的网络收藏夹
学习永远不晚

R语言中如何进行多元逻辑回归

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

R语言中如何进行多元逻辑回归

小编给大家分享一下R语言中如何进行多元逻辑回归,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!

如何进行多元逻辑回归

可以使用阶梯函数通过逐步过程确定多元逻辑回归。此函数选择模型以最小化AIC。

通常建议不要盲目地遵循逐步程序,而是要使用拟合统计(AIC,AICc,BIC)比较模型,或者根据生物学或科学上合理的可用变量建立模型。

多元相关是研究潜在自变量之间关系的一种工具。例如,如果两个独立变量彼此相关,可能在最终模型中都不需要这两个变量,但可能有理由选择一个变量而不是另一个变量。

多元相关

创建数值变量的数据框

  Data.num $ Status = as.numeric(Data.num $ Status) Data.num $ Length = as.numeric(Data.num $ Length) Data.num $ Migr = as.numeric(Data.num $ Migr) Data.num $ Insect = as.numeric(Data.num $ Insect) Data.num $ Diet = as.numeric(Data.num $ Diet) Data.num $ Broods = as.numeric(Data.num $ Broods) Data。 num $ Wood = as.numeric(Data.num $ Wood) Data.num $ Upland = as.numeric(Data.num $ Upland) Data.num $ Water = as.numeric(Data.num $ Water) Data.num $ Release = as.numeric(Data.num $ Release) Data.num $ Indiv = as.numeric(Data.num $ Indiv) ###检查新数据框 headtail(Data.num) 1 1 1520 9600.0 1.21 1 12 2 6.0 1 0 0 1 6 29 2 1 1250 5000.0 0.56 1 0 1 6.0 1 0 0 1 10 85 3 1 870 3360.0 0.07 1 0 1 4.0 1 0 0 1 3 8 77 0 170 31.0 0.55 3 12 2 4.0 NA 1 0 0 1 2 78 0 210 36.9 2.00 2 8 2 3.7 1 0 0 1 1 2 79 0 225 106.5 1.20 2 12 2 4.8 2 0 0 0 1 2 ###检查变量之间的相关性 ###这里使用了Spearman相关性

R语言中如何进行多元逻辑回归

多元逻辑回归的例子

在此示例中,数据包含缺失值。在R中缺失值用NA表示。SAS通常会无缝地处理缺失值。虽然这使用户更容易,但可能无法确保用户了解这些缺失值的作用。在某些情况下,R要求用户明确如何处理缺失值。处理多元回归中的缺失值的一种方法是从数据集中删除具有任何缺失值的所有观察值。这是我们在逐步过程之前要做的事情,创建一个名为Data.omit的数据框。但是,当我们创建最终模型时,我们只想排除那些在最终模型中实际包含的变量中具有缺失值的观察。为了测试最终模型的整体p值,绘制最终模型,或使用glm.compare函数,我们将创建一个名为Data.final的数据框,只排除那些观察结果。

尽管二项式和poission系列中的模型应该没问题,但是对于使用某些glm拟合的步骤过程存在一些注意事项。

用逐步回归确定模型

最终模型

summary(model.final)  Coefficients:        Estimate Std. Error z value Pr(>|z|)   (Intercept) -3.5496482 2.0827400 -1.704 0.088322 .  Upland   -4.5484289 2.0712502 -2.196 0.028093 *  Migr    -1.8184049 0.8325702 -2.184 0.028956 *  Mass     0.0019029 0.0007048  2.700 0.006940 ** Indiv    0.0137061 0.0038703  3.541 0.000398 *** Insect    0.2394720 0.1373456  1.744 0.081234 .  Wood     1.8134445 1.3105911  1.384 0.166455

伪R方

$Pseudo.R.squared.for.model.vs.null                Pseudo.R.squared McFadden               0.700475 Cox and Snell (ML)          0.637732 Nagelkerke (Cragg and Uhler)     0.833284

模型总体p值

在最终模型中创建包含变量的数据框,并省略NA。

偏差表分析

Analysis of Deviance Table   Model 1: Status ~ Upland + Migr + Mass + Indiv + Insect + Wood Model 2: Status ~ 1  Resid. Df Resid. Dev Df Deviance Pr(>Chi)   1    63   30.392              2    69   93.351 -6 -62.959 1.125e-11 ***

似然比检验

Likelihood ratio test    #Df LogLik Df Chisq Pr(>Chisq)   1  7 -15.196             2  1 -46.675 -6 62.959 1.125e-11 ***

标准化残差图

R语言中如何进行多元逻辑回归

简单的预测值图

在最终模型中创建包含变量的数据框,并在NA中省略

R语言中如何进行多元逻辑回归

过度离散检验

过度离散是glm的deviance残差相对于自由度较大的情况。这些值显示在模型的摘要中。一个指导原则是,如果deviance残差与剩余自由度的比率超过1.5,则模型过度离散。过度离散表明模型不能很好地拟合数据:解释变量可能无法很好地描述因变量,或者可能无法为这些数据正确指定模型。如果存在过度离散,一种可能的解决方案是 在glm中使用quasibinomial family选项。

Null deviance: 93.351 on 69 degrees of freedom Residual deviance: 30.392 on 63 degrees of freedom deviance /  df.residual   [1] 0.482417

评估模型的替代方法

使用逐步程序的替代或补充是将模型与拟合统计进行比较。我的compare.glm 函数将为glm模型显示AIC,AICc,BIC和伪R平方。使用的模型应该都拟合相同的数据。也就是说,如果数据集中的不同变量包含缺失值,则应该谨慎使用。如果您对使用哪种拟合统计数据没有任何偏好,您希望在最终模型中使用较少的术语,我可能会推荐AICc或BIC。

一系列模型可以与标准的anova 功能进行比较。模型应嵌套在先前模型中或anova函数列表中的下一个模型中; 和模型应该拟合相同的数据。在比较多个回归模型时,通常放宽p值为0.10或0.15。

在以下示例中,使用通过逐步过程选择的模型。请注意,虽然模型9最小化了AIC和AICc,但模型8最小化了BIC。anova结果表明模型8不是对模型7的显着改进。这些结果支持选择模型7,8或9中的任何一个。  

compareGLM(model.1, model.2, model.3, model.4, model.5, model.6,      model.7, model.8, model.9)   $Models  Formula                          1 "Status ~ 1"                        2 "Status ~ Release"                     3 "Status ~ Release + Upland"                 4 "Status ~ Release + Upland + Migr"             5 "Status ~ Release + Upland + Migr + Mass"         6 "Status ~ Release + Upland + Migr + Mass + Indiv"     7 "Status ~ Release + Upland + Migr + Mass + Indiv + Insect" 8 "Status ~ Upland + Migr + Mass + Indiv + Insect"      9 "Status ~ Upland + Migr + Mass + Indiv + Insect + Wood"    $Fit.criteria  Rank Df.res  AIC AICc  BIC McFadden Cox.and.Snell Nagelkerke  p.value 1  1   66 94.34 94.53 98.75  0.0000    0.0000   0.0000    Inf 2  2   65 62.13 62.51 68.74  0.3787    0.3999   0.5401 2.538e-09 3  3   64 56.02 56.67 64.84  0.4684    0.4683   0.6325 3.232e-10 4  4   63 51.63 52.61 62.65  0.5392    0.5167   0.6979 7.363e-11 5  5   62 50.64 52.04 63.87  0.5723    0.5377   0.7263 7.672e-11 6  6   61 49.07 50.97 64.50  0.6118    0.5618   0.7588 5.434e-11 7  7   60 46.42 48.90 64.05  0.6633    0.5912   0.7985 2.177e-11 8  6   61 44.71 46.61 60.14  0.6601    0.5894   0.7961 6.885e-12 9  7   60 44.03 46.51 61.67  0.6897    0.6055   0.8178 7.148e-12  Analysis of Deviance Table   Model 1: Status ~ 1 Model 2: Status ~ Release Model 3: Status ~ Release + Upland Model 4: Status ~ Release + Upland + Migr Model 5: Status ~ Release + Upland + Migr + Mass Model 6: Status ~ Release + Upland + Migr + Mass + Indiv Model 7: Status ~ Release + Upland + Migr + Mass + Indiv + Insect Model 8: Status ~ Upland + Migr + Mass + Indiv + Insect Model 9: Status ~ Upland + Migr + Mass + Indiv + Insect + Wood    Resid. Df Resid. Dev Df Deviance Pr(>Chi)   1    66   90.343             2    65   56.130 1  34.213 4.94e-09 *** 3    64   48.024 1  8.106 0.004412 ** 4    63   41.631 1  6.393 0.011458 *  5    62   38.643 1  2.988 0.083872 .  6    61   35.070 1  3.573 0.058721 .  7    60   30.415 1  4.655 0.030970 *  8    61   30.710 -1  -0.295 0.587066   9    60   28.031 1  2.679 0.101686

看完了这篇文章,相信你对“R语言中如何进行多元逻辑回归”有了一定的了解,如果想了解更多相关知识,欢迎关注编程网行业资讯频道,感谢各位的阅读!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

R语言中如何进行多元逻辑回归

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

R语言中如何进行多元逻辑回归

小编给大家分享一下R语言中如何进行多元逻辑回归,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!如何进行多元逻辑回归可以使用阶梯函数通过逐步过程确定多元逻辑回归。此函数选择模型以最小化AIC。通常建议不要盲目地遵循逐步程序,而
2023-06-08

怎么在R语言中实现逻辑回归

怎么在R语言中实现逻辑回归?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。什么是R语言R语言是用于统计分析、绘图的语言和操作环境,属于GNU系统的一个自由、免费、源代码开放的
2023-06-14

在R语言中如何实现Logistic逻辑回归的操作

这篇文章主要介绍了在R语言中如何实现Logistic逻辑回归的操作,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。什么是R语言R语言是用于统计分析、绘图的语言和操作环境,属于G
2023-06-14

如何在R语言项目中实现多元线性回归

这期内容当中小编将会给大家带来有关如何在R语言项目中实现多元线性回归,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。输入数据先把数据用excel保存为csv格式放在”我的文档”文件夹打开R软件,不用新建,直
2023-06-08

R语言逻辑回归、ROC曲线与十折如何实现交叉验证

本篇内容主要讲解“R语言逻辑回归、ROC曲线与十折如何实现交叉验证”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“R语言逻辑回归、ROC曲线与十折如何实现交叉验证”吧!1. 测试集和训练集3、7分
2023-06-08

R语言多元线性回归是什么及如何实现

这篇文章主要介绍“R语言多元线性回归是什么及如何实现”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“R语言多元线性回归是什么及如何实现”文章能帮助大家解决问题。一、模型简介一元线性回归是一个主要影响因
2023-07-02

如何在R语言中使用Fisher进行判断

如何在R语言中使用Fisher进行判断?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。1. 判别分析与Fisher判别不严谨但是通俗的说法,判别分析(Discriminant
2023-06-14

R语言怎么用均值替换、回归插补及多重插补进行插补的操作

小编给大家分享一下R语言怎么用均值替换、回归插补及多重插补进行插补的操作,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!用均值替换、回归插补及多重插补进行插补# 设
2023-06-14

如何在R语言中对文本文件进行读写

如何在R语言中对文本文件进行读写?相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。具体如下:read.table(file,sep,hesder)#file 文件路径#sep 分隔
2023-06-08

R语言中如何进行地理空间数据分析

在R语言中进行地理空间数据分析通常使用专门的地理空间数据处理包,如sp、rgdal、raster、maptools等。以下是一些常见的地理空间数据分析步骤:读取地理空间数据:使用rgdal包中的函数读取地理空间数据,如shapefile、G
R语言中如何进行地理空间数据分析
2024-04-24

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录