维护者 | Julie Josse, Imke Mayer, Nicholas Tierney, Nathalie Vialaneix |
联系方式 | r-miss-tastic at clementine.wf |
版本 | 2024-01-29 |
网址 | https://CRAN.R-project.org/view=MissingData |
源代码 | https://github.com/cran-task-views/MissingData/ |
贡献 | 欢迎对本任务视图提出建议和改进,可以通过 GitHub 上的问题或拉取请求,或通过电子邮件发送给维护者地址。有关更多详细信息,请参阅 贡献指南。 |
引用 | Julie Josse, Imke Mayer, Nicholas Tierney, Nathalie Vialaneix (2024). CRAN 任务视图:缺失数据。版本 2024-01-29。网址 https://CRAN.R-project.org/view=MissingData。 |
安装 | 可以使用 ctv 包自动安装本任务视图中的包。例如,ctv::install.views("MissingData", coreOnly = TRUE) 安装所有核心包,或 ctv::update.views("MissingData") 安装所有尚未安装和更新的包。有关更多详细信息,请参阅 CRAN 任务视图计划。 |
缺失数据在数据集中非常常见。基础 R 提供了一些选项来处理它们,使用仅涉及观察数据的计算(函数 mean
、var
等中的 na.rm = TRUE
或函数 cov
、cor
等中的 use = complete.obs|na.or.complete|pairwise.complete.obs
)。基础包 stats
还包含泛型函数 na.action
,它提取用于创建对象的 NA
操作的信息。此外,包 ie2misc 包含一个二元运算符 +
,它在处理缺失数据时与原始 +
运算符的行为不同。
这些基本选项得到了 CRAN 上许多包的补充。在本任务视图中,我们重点介绍了最重要的那些包,这些包在一年多前发布,并且定期更新。任务视图按主要主题结构化
除了当前的任务视图之外,这个 关于缺失数据的参考网站 也可能有所帮助。补充信息也可以在 TimeSeries、SpatioTemporal、Survival 和 OfficialStatistics 中找到。请注意,大多数涵盖时间和时空插值以及删失数据的包都没有被缺失数据任务视图覆盖。
如果您认为我们在这个列表中遗漏了一些重要的包,请通过电子邮件联系维护者,或在上面链接的 GitHub 存储库中提交问题或拉取请求。
缺失数据探索
NA
,而 fillr 根据简单的预定义规则填充向量中的缺失值。ampute
函数、simFrame 包(它提供了一个非常通用的模拟框架)或 simglm 包(它在简单和广义线性回归模型中模拟数据和缺失值)来执行评估插补质量的模拟。类似地,imputeTestbench 提供了一个基准来评估单变量时间序列插补。基于似然的方
em.cat
函数),在 mix 中(针对多元混合分类和连续数据的 em.mix
函数)。这些包还为相同模型实现了贝叶斯方法(包括插补和后验步骤)(针对 norm
、cat
和 mix
的 da.
XXX 函数),并且可以在模型参数估计后用于获得插补后的完整数据集或多个插补(针对 norm
、cat
和 mix
的 imp.
XXX 函数)。monomvn 在缺失模式单调的情况下,针对多元正态和学生分布提出了类似的方法。MixtComp
。它可以与 RMixtCompUtilities 结合使用,后者提供各种图形、获取器和实用程序函数。单一插补
hotdeck
)中,并且 FHDI 提供了一个分数版本(使用权重)。StatMatch 也使用热平台插补从外部数据集插补调查。多重插补
上面提到的某些包还可以处理多重插补。
加权方法
特定类型的数据
data.table
框架的时间序列中缺失值描述和插补的基本功能。具体任务
具体应用领域