我的编程空间,编程开发者的网络收藏夹
学习永远不晚

怎么在R语言中使用caret包比较ROC曲线

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

怎么在R语言中使用caret包比较ROC曲线

这篇文章将为大家详细讲解有关怎么在R语言中使用caret包比较ROC曲线,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

操作

加载对应的包与将训练控制算法设置为10折交叉验证,重复次数为3:

library(ROCR)library(e1071)library("pROC")library(caret)library("pROC")control = trainControl(method = "repaetedcv",   number = 10,   repeats =3,   classProbs = TRUE,   summaryFunction = twoClassSummary)

使用glm在训练数据集上训练一个分类器

glm.model = train(churn ~ .,   data= trainset,   method = "glm",   metric = "ROC",   trControl = control)

使用svm在训练数据集上训练一个分类器

svm.model = train(churn ~ .,   data= trainset,   method = "svmRadial",   metric = "ROC",   trControl = control)

使用rpart函数查看rpart在训练数据集上的运行情况

rpart.model = train(churn ~ .,   data = trainset,   method = "svmRadial",   metric = "ROC",   trControl = control)

使用不同的已经训练好的数据分类预测:

glm.probs = predict(glm.model,testset[,!names(testset) %in% c("churn")],type = "prob")svm.probs = predict(svm.model,testset[,!names(testset) %in% c("churn")],type = "prob")rpart.probs = predict(rpart.model,testset[,!names(testset) %in% c("churn")],type = "prob")

生成每个模型的ROC曲线,将它们绘制在一个图中:

glm.ROC = roc(response = testset[,c("churn")],  predictor = glm.probs$yes,  levels = levels(testset[,c("churn")]))plot(glm.ROC,type = "S",col = "red")svm.ROC = roc(response = testset[,c("churn")],  predictor = svm.probs$yes,  levels = levels(testset[,c("churn")]))plot(svm.ROC,add = TRUE,col = "green")rpart.ROC = roc(response = testset[,c("churn")],  predictor = rpart.probs$yes,  levels = levels(testset[,c("churn")]))plot(rpart.ROC,add = TRUE,col = "blue")

怎么在R语言中使用caret包比较ROC曲线

三种分类器的ROC曲线

说明

将不同的分类模型的ROC曲线绘制在同一个图中进行比较,设置训练过程的控制参数为重复三次的10折交叉验证,模型性能的评估参数为twoClassSummary,然后在使用glm,svm,rpart,三种不同的方法建立分类模型。

从图中可以看出,svm对训练集的预测结果(未调优)是三种分类算法里最好的。

补充:R语言利用caret包比较模型性能差异

说明

我们可以通过重采样的方法得对每一个匹配模型的统计信息,包括ROC曲线,灵敏度与特异度,然后基于这些统计信息来比较不同模型的性能差异。

操作

利用上节的信息,准备好glm分类模型,svm分类模型,rpart分类模型,并存放在glm.model,svm.model,rpart.model。

cv.values = resamples(list(glm = glm.model,svm =svm.model,rpart = rpart.model))> summary(cv.values)Call:summary.resamples(object = cv.values)Models: glm, svm, rpart Number of resamples: 30 ROC   Min. 1st Qu. Median Mean 3rd Qu. Max. NA'sglm 0.7597790 0.7927740 0.8040455 0.8106454 0.8347961 0.8760824 0svm 0.8191998 0.8786439 0.8945208 0.8947360 0.9196775 0.9562556 0rpart 0.6064540 0.7150320 0.7608241 0.7556544 0.8086731 0.8554750 0Sens   Min. 1st Qu. Median Mean 3rd Qu. Max. NA'sglm 0.08823529 0.1764706 0.2058824 0.2124930 0.2516807 0.3235294 0svm 0.44117647 0.5294118 0.5882353 0.5956863 0.6470588 0.7941176 0rpart 0.20000000 0.4117647 0.4705882 0.4787955 0.5514706 0.7352941 0Spec   Min. 1st Qu. Median Mean 3rd Qu. Max. NA'sglm 0.9393939 0.9645119 0.9721581 0.9702721 0.9796954 0.9898477 0svm 0.9494949 0.9695431 0.9771574 0.9755004 0.9847716 0.9898990 0rpart 0.9492386 0.9746193 0.9796954 0.9780359 0.9848485 1.0000000 0

使用dotplot函数绘制重采样在ROC曲线度量中的结果:

dotplot(cv.values,metric = "ROC")

怎么在R语言中使用caret包比较ROC曲线

使用箱线图绘制重采样结果:

bwplot(cv.values,layout=c(3,1))

怎么在R语言中使用caret包比较ROC曲线

关于怎么在R语言中使用caret包比较ROC曲线就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

怎么在R语言中使用caret包比较ROC曲线

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

怎么在R语言中使用caret包比较ROC曲线

这篇文章将为大家详细讲解有关怎么在R语言中使用caret包比较ROC曲线,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。操作加载对应的包与将训练控制算法设置为10折交叉验证,重复次数为3:li
2023-06-14

使用R语言怎么绘制函数曲线图

这期内容当中小编将会给大家带来有关使用R语言怎么绘制函数曲线图,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。R 中 curve() 函数可以绘制函数的图像,代码格式如下:curve(expr, from
2023-06-15

怎么在Docker中使用R语言

这篇文章主要介绍了怎么在Docker中使用R语言的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇怎么在Docker中使用R语言文章都会有所收获,下面我们一起来看看吧。1:轻松开发OpenCPU 系统的旗舰是 Op
2023-06-27

do.call()怎么在R语言中使用

今天就跟大家聊聊有关do.call()怎么在R语言中使用,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。> x1 = 1:10> x2 = 11:20> x3 = 21:30> dat
2023-06-14

怎么在R语言中使用cut()函数

怎么在R语言中使用cut()函数?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。什么是R语言R语言是用于统计分析、绘图的语言和操作环境,属于GNU系统的一个自由、
2023-06-14

怎么在R语言中使用ggplot2画图

怎么在R语言中使用ggplot2画图?相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。使用代码 + theme_bw() + theme(panel.grid.major=elem
2023-06-14

怎么在R语言中使用summary()函数

本篇文章为大家展示了怎么在R语言中使用summary()函数,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。什么是R语言R语言是用于统计分析、绘图的语言和操作环境,属于GNU系统的一个自由、免费、源代
2023-06-14

怎么在R语言中使用dplyr包对数据进行处理

这期内容当中小编将会给大家带来有关怎么在R语言中使用dplyr包对数据进行处理,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。1、数据筛选函数:#可使用filter()函数筛选/查找特定条件的行或者样本#f
2023-06-08

怎么在R语言中使用筛选数据

这期内容当中小编将会给大家带来有关怎么在R语言中使用筛选数据,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。什么是R语言R语言是用于统计分析、绘图的语言和操作环境,属于GNU系统的一个自由、免费、源代码开放
2023-06-14

怎么在R语言中使用数组实例

怎么在R语言中使用数组实例?相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。使用array()函数创建数组。 它使用向量作为输入,并使用dim参数中的值创建数组。例以下示例创建一个
2023-06-14

怎么在R语言中利用xlsx包读写Excel数据

怎么在R语言中利用xlsx包读写Excel数据?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。下载安装xlsx(Rstudio会同步下载并安装rJava, xlsxjars两
2023-06-14

r语言中怎么使用dplyr包进行数据筛选

使用dplyr包进行数据筛选的基本步骤如下:安装并加载dplyr包:首先需要安装dplyr包,并通过library(dplyr)命令加载包。install.packages("dplyr")library(dplyr)使用filter()
r语言中怎么使用dplyr包进行数据筛选
2024-03-06

R语言中怎么使用magrittr包进行管道操作

在R语言中,可以使用magrittr包中的管道操作符%>%来简化数据处理流程。以下是使用magrittr包进行管道操作的示例:# 首先安装并加载magrittr包install.packages("magrittr")library(
R语言中怎么使用magrittr包进行管道操作
2024-03-07

R语言中怎么使用parallel包实现并行计算

要在R语言中使用parallel包实现并行计算,首先要安装并加载parallel包。可以使用以下代码来安装和加载parallel包:install.packages("parallel")library(parallel)接下来,可以使
R语言中怎么使用parallel包实现并行计算
2024-04-03

怎么在Go语言中使用日志包

这篇“怎么在Go语言中使用日志包”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“怎么在Go语言中使用日志包”文章吧。让我们来看
2023-06-30

怎么在R语言中使用density plot进行绘图

这期内容当中小编将会给大家带来有关怎么在R语言中使用density plot进行绘图,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。Step1. 绘图数据的准备首先还是要把你想要绘图的数据调整成R语言可以识
2023-06-08

怎么在R语言数据框中使用负索引

本篇文章给大家分享的是有关怎么在R语言数据框中使用负索引,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。什么是R语言R语言是用于统计分析、绘图的语言和操作环境,属于GNU系统的一
2023-06-14

怎么在R语言中使用ggplot2 修改默认颜色

这期内容当中小编将会给大家带来有关怎么在R语言中使用ggplot2 修改默认颜色,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。1个元素:2个元素(颜色分配顺序为先从左到右,后从上到下):3个元素:4个元素
2023-06-14

怎么在R语言中使用studio实现批量注释

今天就跟大家聊聊有关怎么在R语言中使用studio实现批量注释,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。wins和MAC都有效ctrl + shift + C取消注释同样也是这个
2023-06-14

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录