我的编程空间,编程开发者的网络收藏夹
学习永远不晚

R语言交叉验证的实现代码

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

R语言交叉验证的实现代码

k-折交叉验证

k-折交叉验证(K-fold cross-validation)是交叉验证方法里一种。它是指将样本集分为k份,其中k-1份作为训练数据集,而另外的1份作为验证数据集。用验证集来验证所得分类器或者模型的错误率。一般需要循环k次,直到所有k份数据全部被选择一遍为止。

有关交叉验证的介绍可参考作者另一博文:
http://blog.csdn.net/yawei_liu1688/article/details/79138202

R语言实现

K折交叉验证,随机分组

数据打折-数据分组自编译函数:进行交叉检验首先要对数据分组,数据分组要符合随机且平均的原则


library(plyr)
CVgroup <- function(k,datasize,seed){
 cvlist <- list()
 set.seed(seed)
 n <- rep(1:k,ceiling(datasize/k))[1:datasize]  #将数据分成K份,并生成的完成数据集n
 temp <- sample(n,datasize)  #把n打乱
 x <- 1:k
 dataseq <- 1:datasize
 cvlist <- lapply(x,function(x) dataseq[temp==x]) #dataseq中随机生成k个随机有序数据列
 return(cvlist)
}

k <- 10
datasize <- nrow(iris)
cvlist <- CVgroup(k = k,datasize = datasize,seed = 1206)
cvlist

结果输出示例:

输出示例

K折交叉验证
第一种方法:循环语句写验证


data <- iris
pred <- data.frame()  #存储预测结果
library(plyr)
library(randomForest)
m <- seq(60,500,by = 20) #如果数据量大尽量间隔大点,间隔过小没有实际意义
for(j in m){  #j指的是随机森林的数量
 progress.bar <- create_progress_bar("text") #plyr包中的create_progress_bar函数创建一个进度条,
 progress.bar$init(k)  #设置上面的任务数,几折就是几个任务
 for (i in 1:k){
  train <- data[-cvlist[[i]],] #刚才通过cvgroup生成的函数
  test <- data[cvlist[[i]],]
  model <-randomForest(Sepal.Length~.,data = train,ntree = j)  #建模,ntree=j 指的树数
  prediction <- predict(model,subset(test,select = -Sepal.Length))  #预测
  randomtree <- rep(j,length(prediction))  #随机森林树的数量
  kcross <- rep(i,length(prediction))  #i是第几次循环交叉,共K次
  temp <- data.frame(cbind(subset(test,select = Sepal.Length),prediction,randomtree,kcross))#真实值、预测值、随机森林树数、预测组编号捆绑在一起组成新的数据框tenp
  pred <- rbind(pred,temp)  #temp按行和pred合并
  print(paste("随机森林:",j)) #循环至树数j的随机森林模型
  progress.bar$step() #输出进度条。告知完成了这个任务的百分之几
 }
}

结果输出示例1:

输出示例

结果输出示例2:指标分别为真实值、预测值、随机森林树数、预测组编号

这里写图片描述

第二种方法:apply家族lapply
当测试的循环数较多或单任务耗时较多时,apply家族优势特别明显


data <- iris
library(plyr)
library(randomForest)
k = 10
j <- seq(10,10000,by = 20)  #j树的数量
i <- 1:k  #K折
i <- rep(i,times = length(j))
j <- rep(j,each = k)  #多少折,each多少
x <- cbind(i,j)
cvtest <- function(i,j){
 train <- data[-cvlist[[i]],]
 test <- data[cvlist[[i]],]
 model <- randomForest(Sepal.Length~.,data = train,ntree = j)
 prediction <- predict(model,subset(test,select = -Sepal.Length))
 temp <- data.frame(cbind(subset(test,select = Sepal.Length),prediction))
}

结果输出示例3:指标分别为真实值、预测值、随机森林树数、预测组编号

这里写图片描述


system.time(pred <- mdply(x,cvtest))  

这里写图片描述

mdyly在plyr包中:输出三个指标:“用户”“系统”“流逝”。其中“流逝”应该是这段代码从开始到结束的真正时间。对于一般单线程的程序来说这个时间近似于用户时间和系统时间之和,可以看出共运行了1386秒。

到此这篇关于R语言交叉验证的文章就介绍到这了,更多相关R语言交叉验证的实现代码内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

R语言交叉验证的实现代码

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

R语言逻辑回归、ROC曲线与十折如何实现交叉验证

本篇内容主要讲解“R语言逻辑回归、ROC曲线与十折如何实现交叉验证”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“R语言逻辑回归、ROC曲线与十折如何实现交叉验证”吧!1. 测试集和训练集3、7分
2023-06-08

C++实现验证二叉搜索树代码

本篇内容主要讲解“C++实现验证二叉搜索树代码”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“C++实现验证二叉搜索树代码”吧!验证二叉搜索树Given a binary tree, determ
2023-06-20

怎么在R语言中实现验证及协方差的计算公式

怎么在R语言中实现验证及协方差的计算公式?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。首先附上协方差公式:来设5个样本点:(3,9),(2,7),(4,12),(5,15)
2023-06-15

Python实现身份证号码验证的示例代码

本文介绍了使用Python验证身份证号码的示例代码。代码通过正则表达式匹配格式,计算校验位,并验证校验位来实现验证。利用正则表达式简化了格式验证,并使用列表存储权重和校验位值,便于扩展和维护。此代码适用于Python3.6或更高版本,需定期更新以适应格式变化。
Python实现身份证号码验证的示例代码
2024-04-02

python django 实现验证码的功能实例代码

我也是刚学Python Django不久很多都不懂,所以我现在想一边学习一边记录下来然后大家一起讨论! 验证码功能一开始我在网上找了很多的demo但是我在模仿他们写的时候,发现在我的版本上根本就不能运行起来在前端页面显示的时候是图裂,有可
2022-06-04

Android实现短信验证功能的代码

在我们现在开发APP过程中,当用户注册时,短信验证是必不可少的操作,这里我们就是用一个免费的第三方短信验证SDK-MOP 首先看下效果图 获取AppKey和AppSecret 首先进入官网,登录(没有帐号的自己去注册一个)。鼠标移动到右侧头
2022-06-06

C#实现身份证验证功能的示例代码

这篇文章主要为大家详细介绍了如何利用C#实现身份证验证功能,文中的示例代码讲解详细,对我们学习C#有一定的帮助,感兴趣的小伙伴可以跟随小编一起了解一下
2022-12-20

R语言如何实现检验多重共线性的操作

小编给大家分享一下R语言如何实现检验多重共线性的操作,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!函数kappa()df<-data.frame()df_cor=cor(df)kappa(df_cor, exact=T)当
2023-06-14

Redis实现短信验证码登录的示例代码

目录效果图pom.xmlapplicatoin.ymlRedis配置类controllerserviceImplmapper效果图发送验证码输入手机号、密码以及验证码完成登录操作pom.xml核心依赖
2022-06-13

JavaScript实现登录拼图验证的示例代码

这篇文章主要为大家详细介绍了如何利用JavaScript实现登录拼图验证的功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下
2023-01-11

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录