维护者 | Imke Mayer,Pan Zhao,Noah Greifer,Nick Huntington-Klein,Julie Josse |
联系方式 | imke.mayer at inria.fr |
版本 | 2023-08-04 |
网址 | https://CRAN.R-project.org/view=CausalInference |
源代码 | https://github.com/cran-task-views/CausalInference/ |
贡献 | 欢迎对该任务视图提出建议和改进,可以通过 GitHub 上的问题或拉取请求,或通过电子邮件发送给维护者地址。有关更多详细信息,请参阅 贡献指南。 |
引用 | Imke Mayer, Pan Zhao, Noah Greifer, Nick Huntington-Klein, Julie Josse (2023). CRAN 任务视图:因果推断。版本 2023-08-04。网址 https://CRAN.R-project.org/view=CausalInference. |
安装 | 可以使用 ctv 包自动安装此任务视图中的包。例如,ctv::install.views("CausalInference", coreOnly = TRUE) 安装所有核心包,或 ctv::update.views("CausalInference") 安装所有尚未安装和更新的包。有关更多详细信息,请参阅 CRAN 任务视图计划。 |
因果推断可以看作是统计分析的一个子领域。它被应用于计量经济学、流行病学、教育科学等各个领域。因果推断解决的是关于治疗、干预或政策对给定样本或总体中某些目标的影响的问题。在某些可识别性和模型假设下,因果推断可以通过拟合简单的回归模型或以特定方式组合多个回归模型来进行,这将在后面概述。对于观察数据,必须做出额外的不可检验的假设才能(非参数地)识别因果效应。
没有直接实现标准因果推断设计的 R 基本函数,但 CRAN 上的许多包(或多或少复杂)实现了许多方法,我们将这些方法结构化为主要主题。
某些因果推断方法起源于计量经济学或临床试验等特定领域,并在这些领域中最受欢迎。因此,在某些情况下,我们会参考其他任务视图,更深入地介绍这些方法。更一般地说,在这个任务视图中,我们关注的是使用观察数据的因果分析。
如果您认为我们错过了列表中的一些重要软件包,请联系维护人员。
lm()
和 glm()
中实现,以及在许多更专业的包中实现,例如 fixest、estimatr、CausalGAM(使用广义加性模型)、sampleSelection(Heckman 型样本选择模型的两步法和最大似然估计)、BCEE(二元或连续治疗和结果的贝叶斯因果效应估计)、borrowr(多个可交换数据源的贝叶斯 PATE 估计)、causaldrf(平均因果剂量反应函数)、hdm(具有统一有效置信区间的有效估计量,它假设高维设置的近似稀疏模型)。在固定效应设计中进行估计可以通过 fixest(线性模型和广义线性固定效应模型以及与工具变量相结合)、plm(用于面板数据)和 alpaca(用于高维 k 路固定效应)实现。optweight.svy()
函数)中可用。causal_forest
后跟average_causal_effect
)和causalweight中实现。目标最大似然估计(TMLE,也称为目标最小损失估计)在drtmle、tmle、ctmle(用于具有变量选择的 TMLE)、ltmle(用于纵向数据)和AIPW中可用。DoubleMLIIVM
)中实现。 ivmte 使用边际处理效应为 IV 模型提供一种选择理论解释,从顺从者推断,以估计其他子群体的处理效应。 LARF 使用局部平均响应函数,用于具有二元内生处理和工具的处理效应的 IV 估计。 icsw 使用逆顺从评分加权来估计具有工具变量的平均处理效应。 ivdesc 给出了顺从者、从不接受者和总是接受者子群体的描述性统计。有关 IV 方法的更多详细信息和更长的软件包列表,请参阅 工具变量,位于 计量经济学 任务视图中。此外,causalsens、OVtool、dstat、sensemakr 和 EValue 提供用于敏感性分析(针对未测量的混杂因素、选择偏差、测量误差)的函数,而 ui 实现用于推导不确定性区间和针对缺失数据和未观察到的混杂因素进行敏感性分析的函数。 cobalt 和 tableone 在协变量平衡之前和之后生成平衡表和图,而 confoundr (已归档) 实现针对时变混杂因素的协变量平衡诊断。 WhatIf 提供用于评估重叠和外推的方法。
上面提到的某些包也可以用于异质性治疗效果 (HTE) 估计。
此外,dagitty 提供了定义不同类型的图形模型(cpdags、pdag 等)和识别调整集的方法(还提供了一个基于网络的图形环境:DAGitty)。