位置：首页-资讯-后端开发

R语言如何检验数据缺失类型

2023-06-25 14:09

短信预约 -IT技能 免费直播动态提醒

这篇文章将为大家详细讲解有关R语言如何检验数据缺失类型，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。

题目

R语言如何检验数据缺失类型

解答

由于题目要求需要重复三次类似的操作，故首先载入所需要的包，构造生成数据的函数以及绘图的函数：

library(tidyr)    # 绘图所需library(ggplot2)  # 绘图所需# 生成数据GenerateData <- function(a = 0, b = 0, seed = 2018) {  set.seed(seed)  z1 <- rnorm(100)  z2 <- rnorm(100)  z3 <- rnorm(100)  y1 <- 1 + z1  y2 <- 5 + 2 * z1 + z2  u <- a * (y1 - 1) + b * (y2 - 5) + z3  m2 <- 1 * (u < 0)  y2_na <- y2  y2_na[u < 0] <- NA  # y2_na[as.logical(m2)] <- NA  dat_comp <- data.frame(y1 = y1, y2 = y2)  dat_incomp <- data.frame(y1 = y1, y2 = y2_na)  dat_incomp <- na.omit(dat_incomp)  return(list(dat_comp = dat_comp, dat_incomp = dat_incomp))}# 展现缺失出具与未缺失数据的分布情况PlotTwoDistribution <- function(dat) {  p1 <- dat_comp %>%    gather(y1, y2, key = "var", value = "value") %>%    ggplot(aes(x = value)) +    geom_histogram(aes(fill = factor(var), y = ..density..),                   alpha = 0.3, colour = 'black') +    stat_density(geom = 'line', position = 'identity', size = 1.5,                 aes(colour = factor(var))) +    facet_wrap(~ var, ncol = 2) +    labs(y = '直方图与密度曲线', x = '值',         title = '完整无缺失数据', fill = '变量') +    theme(plot.title = element_text(hjust = 0.5)) +    guides(color = FALSE)  p2 <- dat_incomp %>%    gather(y1, y2, key = "var", value = "value") %>%    ggplot(aes(x = value)) +    geom_histogram(aes(fill = factor(var), y = ..density..),                   alpha = 0.3, colour = 'black') +    stat_density(geom = 'line', position = 'identity', size = 1.5,                 aes(colour = factor(var))) +    facet_wrap(~ var, ncol = 2) +    labs(y = '直方图与密度曲线', x = '值',         title = '有缺失数据', fill = '变量') +    theme(plot.title = element_text(hjust = 0.5)) +    guides(color = FALSE)  return(list(p_comp = p1, p_incomp = p2))}

下面考虑三种情况：

1. a = 0, b = 0

a) 生成数据并绘图展示

# 生成数据并查看数据样式dat <- GenerateData(a = 0, b = 0)dat_comp <- dat$dat_compdat_incomp <- dat$dat_incomphead(dat_comp)head(dat_incomp)

# 绘图展示p <- PlotTwoDistribution(dat)p$p_compp$p_incomp

R语言如何检验数据缺失类型

缺失数据与未缺失数据的分布如上图所示。可以发现，对于完整数据与缺失数据之间的 Y1的分布与 Y2的分布与期望相差不大。并且在采用 a=0,b=0这种构造时，从构造的公式可以看出， Y2中样本的缺失情况与 Y1,Y2两者都无关（因为 Z 3 与 Y 1 , Y 2 均独立），所以这种缺失机制是：MCAR。

b) 进行t检验

题设条件中说的是 Y 1 Y_1 Y1的均值,所以考虑完整数据与缺失数据（这里的缺失指的是若 Y 2 Y_2 Y2有缺失， Y 1 Y_1 Y1也会进行相应地缺失处理）

t.test(dat_comp$y1, dat_incomp$y1)

这里进行t检验（其实不是非常严谨，因为不一定满足正态假设），比较缺失与否 Y 1 Y_1 Y1的均值，这里p-value = 0.8334。在显著性水平为0.05的前提下，并不能断言有缺失与无缺失两个 Y 1 Y_1 Y1之间的均值有差异，也就是说其实MCAR, MAR, NMAR三种情况都有可能，并不能断言哪种不可能发生。

2. a = 2, b = 0

a) 生成数据并绘图展示

# 生成数据并查看数据样式dat <- GenerateData(a = 2, b = 0)dat_comp <- dat$dat_compdat_incomp <- dat$dat_incomphead(dat_comp)head(dat_incomp)

# 绘图展示p <- PlotTwoDistribution(dat)p$p_compp$p_incomp

R语言如何检验数据缺失类型

缺失数据与未缺失数据的分布如上图所示。可以发现，两个数据的期望以及分布（无论 Y 1 Y_1 Y1还是 Y 2 Y_2 Y2），整体都有一定差异。在采用 a = 2 , b = 0 a = 2, b = 0 a=2,b=0这种构造时，从构造的公式可以看出， Y 2 Y_2 Y2中样本的缺失情况与 Y 1 Y_1 Y1有关，所以这种缺失机制是：MAR。

b) 进行t检验

t.test(dat_comp$y1, dat_incomp$y1)

R语言如何检验数据缺失类型

3. a = 0, b = 2

a) 生成数据并绘图展示

# 生成数据并查看数据样式dat <- GenerateData(a = 0, b = 2)dat_comp <- dat$dat_compdat_incomp <- dat$dat_incomphead(dat_comp)head(dat_incomp)

# 绘图展示p <- PlotTwoDistribution(dat)p$p_compp$p_incomp

R语言如何检验数据缺失类型

缺失数据与未缺失数据的分布如上图所示。可以发现与上一种情况一样，两个数据的期望以及分布（无论 Y1还是 Y2），整体都有一定差异。在采用 a = 0 , b = 2 这种构造时，从构造的公式可以看出，Y2中样本的缺失情况与 Y2本身有关，所以这种缺失机制是：NMAR。

b) 进行t检验

t.test(dat_comp$y1, dat_incomp$y1)

R语言如何检验数据缺失类型

关于“R语言如何检验数据缺失类型”这篇文章就分享到这里了，希望以上内容可以对大家有一定的帮助，使各位可以学到更多知识，如果觉得文章不错，请把它分享出去让更多的人看到。

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

阅读原文内容投诉

R语言如何检验数据缺失类型

下载Word文档到电脑，方便收藏和打印～

下载Word文档

R语言如何检验数据缺失类型

题目

解答

下面考虑三种情况：

1. a = 0, b = 0

2. a = 2, b = 0

3. a = 0, b = 2

R语言如何检验数据缺失类型

相关文章

猜你喜欢

R语言如何检验数据缺失类型

R语言刷题检验数据缺失类型过程详解

基于R语言 数据检验详解

R语言-如何实现卡方检验

R语言如何实现list类型数据转换

R语言数据类型有哪些

R语言数据类型深入详解

R语言 实现list类型数据转换

R语言中的数据类型有哪些

R语言数据类型知识点总结

R语言学习笔记缺失数据的Bootstrap与Jackknife方法

R语言怎么使用缺失数据的Bootstrap与Jackknife方法

R语言基础数据类型的具体使用

r语言中怎么进行数据类型转换

R语言数据类型和对象深入讲解

R语言中的列表数据类型有哪些

R语言数据类型与相应运算的实现

R语言如何实现检验多重共线性的操作

r语言如何查看数据维度

R语言如何实现数据输入

热门标签

编程热搜

编程资源站

目录

感谢您的提交，我们服务专员将在30分钟内给您回复

基于R语言数据检验详解

R语言实现list类型数据转换