我的编程空间,编程开发者的网络收藏夹
学习永远不晚

R语言逻辑回归深入讲解

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

R语言逻辑回归深入讲解

逻辑回归


> ###############逻辑回归
> setwd("/Users/yaozhilin/Downloads/R_edu/data")
> accepts<-read.csv("accepts.csv")
> names(accepts)
 [1] "application_id" "account_number" "bad_ind"    "vehicle_year"  "vehicle_make" 
 [6] "bankruptcy_ind" "tot_derog"   "tot_tr"     "age_oldest_tr" "tot_open_tr"  
[11] "tot_rev_tr"   "tot_rev_debt"  "tot_rev_line"  "rev_util"    "fico_score"  
[16] "purch_price"  "msrp"      "down_pyt"    "loan_term"   "loan_amt"   
[21] "ltv"      "tot_income"   "veh_mileage"  "used_ind"   
> accepts<-accepts[complete.cases(accepts),]
> select<-sample(1:nrow(accepts),length(accepts$application_id)*0.7)
> train<-accepts[select,]###70%用于建模
> test<-accepts[-select,]###30%用于检测
> attach(train)
> ###用glm(y~x,family=binomial(link="logit"))
> gl<-glm(bad_ind~fico_score,family=binomial(link = "logit"))
> summary(gl)

Call:
glm(formula = bad_ind ~ fico_score, family = binomial(link = "logit"))

Deviance Residuals: 
  Min    1Q  Median    3Q   Max 
-2.0794 -0.6790 -0.4937 -0.3073  2.6028 

Coefficients:
       Estimate Std. Error z value Pr(>|z|)  
(Intercept) 9.049667  0.629120  14.38  <2e-16 ***
fico_score -0.015407  0.000938 -16.43  <2e-16 ***
---
Signif. codes: 0 ‘***' 0.001 ‘**' 0.01 ‘*' 0.05 ‘.' 0.1 ‘ ' 1

(Dispersion parameter for binomial family taken to be 1)

  Null deviance: 2989.2 on 3046 degrees of freedom
Residual deviance: 2665.9 on 3045 degrees of freedom
AIC: 2669.9

Number of Fisher Scoring iterations: 5

多元逻辑回归


> ###多元逻辑回归
> gls<-glm(bad_ind~fico_score+bankruptcy_ind+age_oldest_tr+
+      tot_derog+rev_util+veh_mileage,family = binomial(link = "logit"))
> summary(gls)

Call:
glm(formula = bad_ind ~ fico_score + bankruptcy_ind + age_oldest_tr + 
  tot_derog + rev_util + veh_mileage, family = binomial(link = "logit"))

Deviance Residuals: 
  Min    1Q  Median    3Q   Max 
-2.2646 -0.6743 -0.4647 -0.2630  2.8177 

Coefficients:
         Estimate Std. Error z value Pr(>|z|)  
(Intercept)   8.205e+00 7.433e-01 11.039 < 2e-16 ***
fico_score   -1.338e-02 1.092e-03 -12.260 < 2e-16 ***
bankruptcy_indY -3.771e-01 1.855e-01 -2.033  0.0421 * 
age_oldest_tr  -4.458e-03 6.375e-04 -6.994 2.68e-12 ***
tot_derog    3.012e-02 1.552e-02  1.941  0.0523 . 
rev_util     3.763e-04 5.252e-04  0.717  0.4737  
veh_mileage   2.466e-06 1.381e-06  1.786  0.0741 . 
---
Signif. codes: 0 ‘***' 0.001 ‘**' 0.01 ‘*' 0.05 ‘.' 0.1 ‘ ' 1

(Dispersion parameter for binomial family taken to be 1)

  Null deviance: 2989.2 on 3046 degrees of freedom
Residual deviance: 2601.4 on 3040 degrees of freedom
AIC: 2615.4

Number of Fisher Scoring iterations: 5

> glss<-step(gls,direction = "both")
Start: AIC=2615.35
bad_ind ~ fico_score + bankruptcy_ind + age_oldest_tr + tot_derog + 
  rev_util + veh_mileage

         Df Deviance  AIC
- rev_util    1  2601.9 2613.9
<none>        2601.3 2615.3
- veh_mileage   1  2604.4 2616.4
- tot_derog    1  2605.1 2617.1
- bankruptcy_ind 1  2605.7 2617.7
- age_oldest_tr  1  2655.9 2667.9
- fico_score   1  2763.8 2775.8

Step: AIC=2613.88
bad_ind ~ fico_score + bankruptcy_ind + age_oldest_tr + tot_derog + 
  veh_mileage

         Df Deviance  AIC
<none>        2601.9 2613.9
- veh_mileage   1  2604.9 2614.9
+ rev_util    1  2601.3 2615.3
- tot_derog    1  2605.7 2615.7
- bankruptcy_ind 1  2606.1 2616.1
- age_oldest_tr  1  2656.9 2666.9
- fico_score   1  2773.2 2783.2

> #出来的数据是logit,我们需要转换
> train$pre<-predict(glss,train)
> #出来的数据是logit,我们需要转换
> train$pre<-predict(glss,train)
> summary(train$pre)
  Min. 1st Qu. Median  Mean 3rd Qu.  Max. 
 -4.868 -2.421 -1.671 -1.713 -1.011  2.497 
> train$pre_p<-1/(1+exp(-1*train$pre))
> summary(train$pre_p)
  Min. 1st Qu. Median  Mean 3rd Qu.  Max. 
0.00763 0.08157 0.15823 0.19298 0.26677 0.92395

 #逻辑回归不需要检测扰动项,但需要检测共线性
 > library(car)
 > vif(glss)
 > fico_score bankruptcy_ind age_oldest_tr   tot_derog  veh_mileage 
 >1.271283    1.144846    1.075603    1.423850    1.003616 

到此这篇关于R语言逻辑回归深入讲解的文章就介绍到这了,更多相关R语言逻辑回归内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

R语言逻辑回归深入讲解

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

R语言逻辑回归的示例分析

这篇文章主要介绍R语言逻辑回归的示例分析,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!逻辑回归> ###############逻辑回归> setwd("/Users/yaozhilin/Downloads/R_ed
2023-06-14

怎么在R语言中实现逻辑回归

怎么在R语言中实现逻辑回归?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。什么是R语言R语言是用于统计分析、绘图的语言和操作环境,属于GNU系统的一个自由、免费、源代码开放的
2023-06-14

R语言中如何进行多元逻辑回归

小编给大家分享一下R语言中如何进行多元逻辑回归,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!如何进行多元逻辑回归可以使用阶梯函数通过逐步过程确定多元逻辑回归。此函数选择模型以最小化AIC。通常建议不要盲目地遵循逐步程序,而
2023-06-08

在R语言中如何实现Logistic逻辑回归的操作

这篇文章主要介绍了在R语言中如何实现Logistic逻辑回归的操作,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。什么是R语言R语言是用于统计分析、绘图的语言和操作环境,属于G
2023-06-14

R语言逻辑回归、ROC曲线与十折如何实现交叉验证

本篇内容主要讲解“R语言逻辑回归、ROC曲线与十折如何实现交叉验证”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“R语言逻辑回归、ROC曲线与十折如何实现交叉验证”吧!1. 测试集和训练集3、7分
2023-06-08

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录