CRAN Task View: Causal Inference

Imke Mayer, Pan Zhao, Noah Greifer, Nick Huntington-Klein, Julie Josse

CRAN 任务视图：因果推断

维护者	Imke Mayer，Pan Zhao，Noah Greifer，Nick Huntington-Klein，Julie Josse
联系方式	imke.mayer at inria.fr
版本	2023-08-04
网址	https://CRAN.R-project.org/view=CausalInference
源代码	https://github.com/cran-task-views/CausalInference/
贡献	欢迎对该任务视图提出建议和改进，可以通过 GitHub 上的问题或拉取请求，或通过电子邮件发送给维护者地址。有关更多详细信息，请参阅贡献指南。
引用	Imke Mayer, Pan Zhao, Noah Greifer, Nick Huntington-Klein, Julie Josse (2023). CRAN 任务视图：因果推断。版本 2023-08-04。网址 https://CRAN.R-project.org/view=CausalInference.
安装	可以使用 ctv 包自动安装此任务视图中的包。例如，`ctv::install.views("CausalInference", coreOnly = TRUE)` 安装所有核心包，或 `ctv::update.views("CausalInference")` 安装所有尚未安装和更新的包。有关更多详细信息，请参阅 CRAN 任务视图计划。

概述

因果推断可以看作是统计分析的一个子领域。它被应用于计量经济学、流行病学、教育科学等各个领域。因果推断解决的是关于治疗、干预或政策对给定样本或总体中某些目标的影响的问题。在某些可识别性和模型假设下，因果推断可以通过拟合简单的回归模型或以特定方式组合多个回归模型来进行，这将在后面概述。对于观察数据，必须做出额外的不可检验的假设才能（非参数地）识别因果效应。

没有直接实现标准因果推断设计的 R 基本函数，但 CRAN 上的许多包（或多或少复杂）实现了许多方法，我们将这些方法结构化为主要主题。

实验数据的方法
平均治疗效果估计和其他单变量治疗效果估计
异质性治疗效果估计
策略学习和动态治疗方案
结构方程模型 (SEM)，do-calculus 因果发现
特定类型的数据
特定应用领域

某些因果推断方法起源于计量经济学或临床试验等特定领域，并在这些领域中最受欢迎。因此，在某些情况下，我们会参考其他任务视图，更深入地介绍这些方法。更一般地说，在这个任务视图中，我们关注的是使用观察数据的因果分析。

如果您认为我们错过了列表中的一些重要软件包，请联系维护人员。

随机对照试验 (RCT) 和其他实验数据的分析方法

实验设计的构建在 blocksdesign（用于一般析因处理设计的区组）、BCHM（用于多亚组篮子试验的贝叶斯聚类层次模型设计）、Boptbd（线性混合效应模型下的贝叶斯最优区组设计）、seqDesign（具有时间到事件终点的随机两阶段治疗有效性试验的顺序设计）中实现。许多其他工具和软件包可用于设计实验和临床试验，我们参考 ExperimentalDesign 和 ClinicalTrials CRAN 任务视图。
基于成对比较的检验在 BuyseTest 中提供。
回归模型，其中因果估计量定义为回归模型的系数，在 allestimates 软件包中实现。
RCT 的分析方法在 experiment（各种统计方法）、eefAnalytics（频率论和贝叶斯多级模型）、ipcwswitch（IPW 适应 RCT 中的治疗转换）、idem（包括死亡和缺失）中提供。
后验分析工具在 cjoint（用于调查实验的联合分析）中实现。
两阶段偏好试验的设计和分析在 preference 中实现。
如果出现不符合的情况，rpsftm 使用 g 估计来估计两臂随机对照试验中治疗的因果效应，其中存在不符合且已测量，假设加速失效时间模型且没有未测量的混杂因素。
在SPORTSCausal中实现了针对溢出效应的 RCT 时间序列因果推断模型。
在ThreeArmedTrials中实现了具有活性对照和安慰剂对照的临床非劣效性或优效性试验的设计和分析。

平均治疗效果估计和其他单变量治疗效果估计

因果估计量为回归参数的回归模型在 stats 中的 lm() 和 glm() 中实现，以及在许多更专业的包中实现，例如 fixest、estimatr、CausalGAM（使用广义加性模型）、sampleSelection（Heckman 型样本选择模型的两步法和最大似然估计）、BCEE（二元或连续治疗和结果的贝叶斯因果效应估计）、borrowr（多个可交换数据源的贝叶斯 PATE 估计）、causaldrf（平均因果剂量反应函数）、hdm（具有统一有效置信区间的有效估计量，它假设高维设置的近似稀疏模型）。在固定效应设计中进行估计可以通过 fixest（线性模型和广义线性固定效应模型以及与工具变量相结合）、plm（用于面板数据）和 alpaca（用于高维 k 路固定效应）实现。
在 gfoRmula（也适用于时变治疗和混杂）、EffectLiteR（基于结构方程模型）、endoSwitch（内生切换回归模型的最大似然估计）和 riskRegression（用于有或没有竞争风险的生存结果）包中支持G 运算和其他基于条件结果回归的方法。对于参数模型，G 运算与估计平均边际效应相同，这可以使用 margins、marginaleffects、modelbased 和 stdReg 实现。
匹配方法在MatchIt中实现，它为许多流行的方法提供了包装器，包括倾向得分匹配和子分类，（粗略）精确匹配，完全匹配和基数匹配；更专业的匹配方法在下面的一些包中实现，其中一些依赖于MatchIt。 MatchThem为MatchIt提供了带有多次插补数据的包装器。 Matching执行最近邻和遗传匹配，并实现Abadie和Imbens风格的匹配插补估计量。 optmatch使用网络流执行最佳匹配；其他几个包依赖于相同的基础设施，包括DiPs（具有方向惩罚的近精细匹配），matchMulti（针对聚类数据的最佳匹配），rcbalance和rcbsubset（针对精炼平衡的最佳匹配），approxmatch（针对多类别处理的近似最佳匹配），以及match2C（使用两个标准的最佳匹配）。其他包包括cem（粗略精确匹配），designmatch（使用混合整数规划的基于优化的匹配），stratamatch（大型数据集中的匹配和分层），FLAME（通过学习的加权汉明距离进行几乎精确匹配），PanelMatch（使用时间序列横截面数据的匹配），以及CausalGPS（针对连续处理的广义倾向得分匹配）。
逆倾向性加权（IPW，也称为治疗倾向概率的逆加权，IPTW）方法在WeightIt中实现，该软件包提供了针对二元、多类别、连续和纵向治疗的几种流行加权方法的实现和包装器。MatchThem为 WeightIt 提供了一个包装器，用于处理多重插补数据。PSweight提供了使用 M 估计的倾向得分加权和不确定性估计。clusteredinterference和inferference在干扰的背景下提供加权方法。几个软件包提供了针对各种治疗类型的平衡权重估计的专门方法，这些方法可能涉及也可能不涉及倾向得分：CBPS（针对二元、多类别、连续和纵向治疗的基于广义矩方法的倾向得分估计）、twang和twangContinuous（使用梯度提升机对二元、多类别、连续和纵向治疗进行倾向得分加权）、sbw和optweight（使用二次规划的基于优化的权重），以及ebal（熵平衡）。mvGPS使用 WeightIt 的基础设施估计多变量治疗的权重。匹配调整的间接比较是倾向得分加权的一种变体，当仅对某些组可用单位级数据时，它在maic、maicChecks和optweight（使用optweight.svy()函数）中可用。
双稳健方法涉及治疗模型和结果模型。增强 IPW (AIPW) 在AIPW、PSweight、DoubleML、grf（函数causal_forest后跟average_causal_effect）和causalweight中实现。目标最大似然估计（TMLE，也称为目标最小损失估计）在drtmle、tmle、ctmle（用于具有变量选择的 TMLE）、ltmle（用于纵向数据）和AIPW中可用。
双重差分 方法在 DRDID（双重稳健估计器，提供两种扰动函数估计方法）、bacondecomp（使用 Goodman-Bacon 分解，允许处理时间变化）、did（适用于超过两个时期且处理时间变化的情况）、fixest（Sun & Abraham 估计器）和 qte 中实现。
分位数处理效应 可以使用 qte、Counterfactual 和 grf 包进行估计。
优势比 估计和趋势中的趋势模型的功效计算在 TrendInTrend 中实现。
合成控制 方法在 Synth（使用组方法进行比较案例研究）、microsynth（用于微观和中观数据）和 gsynth（扩展到多个处理单元和可变处理时期）中实现。 tidysynth 提供了一种易于使用的语法来使用合成控制方法。 scpi 使用 lasso、ridge、simplex 和线性约束实现多种合成控制估计器，并构建预测区间。
工具变量 方法在 ivreg、ivmodel、bpbounds（ATE 的非参数界限）、grf、fixest、estimatr 和 DoubleML（函数 DoubleMLIIVM）中实现。 ivmte 使用边际处理效应为 IV 模型提供一种选择理论解释，从顺从者推断，以估计其他子群体的处理效应。 LARF 使用局部平均响应函数，用于具有二元内生处理和工具的处理效应的 IV 估计。 icsw 使用逆顺从评分加权来估计具有工具变量的平均处理效应。 ivdesc 给出了顺从者、从不接受者和总是接受者子群体的描述性统计。有关 IV 方法的更多详细信息和更长的软件包列表，请参阅工具变量，位于计量经济学任务视图中。
中介分析可以使用以下软件包进行：cfma（功能性中介分析）、cit（基于似然的检验）、MultisiteMediation（多站点试验）、DirectEffects（将潜在的中介变量固定到特定值时的控制直接效应）、medflex（自然效应模型）。causalweight 和 twangMediation 实现中介的加权估计量。mediation 和 cfdecomp 实现识别、推断，mediation 还提供因果中介效应的敏感性分析。paths 使用插补方法来估计路径特异性因果效应，以及一组偏差公式来进行敏感性分析。regmedint 实现基于回归的分析，其中包含治疗-中介交互项。gma 对时间序列执行 Granger 中介分析。bmem 提供几种不同的方法来处理缺失数据情况下的中介分析（列表删除/成对删除、多重插补、两阶段最大似然）以及中介分析的功效分析。
在干预下，可以使用 inferference 通过逆概率加权 (IPW) 估计量来实现因果效应估计，netchain 通过链图模型来近似完整纵向数据投影到观察数据上的集体结果。
乘法交互模型的诊断和可视化在 interflex 中实现。
InvariantCausalPrediction 提供因果效应的置信区间，使用在不同实验或环境条件下（具有隐藏变量）收集的数据，对非线性模型的扩展在 nonlinearICP 中实现。
回归间断设计 (RDD) 方法在 rdrobust 中实现（提供稳健的置信区间构建和带宽选择）。在计量经济学任务视图中的回归间断设计中可以找到更详细的 RDD 方法包列表。

此外，causalsens、OVtool、dstat、sensemakr 和 EValue 提供用于敏感性分析（针对未测量的混杂因素、选择偏差、测量误差）的函数，而 ui 实现用于推导不确定性区间和针对缺失数据和未观察到的混杂因素进行敏感性分析的函数。 cobalt 和 tableone 在协变量平衡之前和之后生成平衡表和图，而 confoundr (已归档) 实现针对时变混杂因素的协变量平衡诊断。 WhatIf 提供用于评估重叠和外推的方法。

异质性治疗效果估计

上面提到的某些包也可以用于异质性治疗效果 (HTE) 估计。

贝叶斯方法用于个体因果效应估计在 bartCause 中可用（基于贝叶斯加性回归树）。
费舍尔方法用于异质性的总体检验，并将总体治疗效果异质性分解为协变量解释的系统成分和特质成分，在 hettx 中实现。
有效治疗或人群子集选择利用治疗效果异质性在 FindIt 和 grf 中实现。后一个包使用属性中包含缺失值的方法支持缺失协变量值。此外，包 subdetect 提供了针对具有增强治疗效果的亚组存在的检验。
其他用于个性化因果预测的方法由 EffectTreat（利用基于相关性的表达式）提供，而用于随机数据的方法由 evalITR（它还允许定义预算约束）和 SortedEffects（针对排序因果效应和分类分析的估计和推断方法）提供。
stepp 提供诊断图来探索治疗-协变量交互作用，适用于来自临床试验两个或多个治疗组的连续、二元和计数数据，适用于生存或广义线性模型。

策略学习和动态治疗方案

最佳动态治疗方案 (DTR) 的估计在 DynTxRegime 中实现（Q 学习、交互式 Q 学习、加权学习和基于增强逆概率加权估计量和逆概率加权估计量的价值搜索方法）；基于边际分位数、边际均值和均值绝对差的方法在 quantoptr 中实现，以及用于分位数最优治疗方案的双重稳健方法）。lmtp 还提供针对修改后的治疗策略、动态治疗方案（和静态干预）的双重稳健因果效应估计。 DTRreg 提出了不同的方法，如 G 估计、动态加权 OLS 和 Q 学习，以及几种方差估计方法，它可以处理生存结果和连续治疗变量。 QTOCen 提供从删失数据中估计均值和分位数最优治疗方案的方法。 ITRLearn (已归档) 实现最大最小投影学习，用于推荐有意义且可靠的个性化治疗方案，以及用于估计组间对比函数的 Q 学习和 A 学习。 simml 和 simsl 分别为实验数据和观察数据提供具有多个链接的单指标模型。 personalized 实现从观察数据和随机数据中估计个性化治疗规则的方法，可以选择变量选择和基于梯度提升的估计，以及结果模型增强（用于连续、二元、计数和时间到事件结果）。
具有变量选择的 DTR 估计由 ITRLearn (已归档) 实现最大最小投影学习，用于推荐有意义且可靠的个性化治疗方案，以及用于估计组间对比函数的 Q 学习和 A 学习。 ITRSelect (已归档) 实现顺序优势选择和惩罚 A 学习，用于在单阶段或多阶段研究中选择最优个性化（动态）治疗方案中的重要变量。 OTRselect 实现了一种惩罚回归方法，该方法可以同时估计最优治疗策略并识别对删失或未删失连续响应的重要变量。 DTRlearn2 提供 Q 学习和结果加权学习方法，通过惩罚进行变量选择。
对于顺序、多赋值、随机化试验 (SMART)，smartsizer 提供了一套工具来确定识别最佳 DTR 所需的样本量；DTRlearn2 还实现了从 SMART 中估计一般 K 阶段 DTR 的估计器。

结构方程模型 (SEM)，do-calculus 因果发现

可识别性由 causaleffect 和 dosearch 解决，它们提供了算法来决定因果效应是否可识别（非参数可识别性），以及由 CausalQueries 计算给定因果模型的任意估计量。 SEMID 实现了基于 SEM 的例程来检查线性 SEM 的可识别性或不可识别性。 causaloptim 使用符号线性优化器为用户定义的 DAG、查询和约束提供严格的界限。
因果结构学习可以通过 pcalg 中的函数实现：PC，用于没有隐藏变量的观察数据，FCI 和 RFCI，用于有隐藏变量的观察数据，以及 GIES，用于没有隐藏变量的观察数据和干预数据的混合；pcalg 还允许使用图形模型进行因果推断（IDA 算法、广义后门准则 - GBC、广义调整准则 - GAC）。还可以整合背景知识。许多针对一般和特定图形模型的算法和方法都存在，我们参考 GraphicalModels 和 Psychometrics CRAN 任务视图以获得全面的概述。
因果效应的估计可以在 CIEE 中使用从 DAG 推导出的估计方程，以及在 InvariantCausalPrediction 中使用从条件独立性检验推导出的调整集，这些检验利用了跨环境的因果不变性。
因果网络估计在 CompareCausalNetworks 中实现。
generalCorr 计算广义相关性、偏相关性和可能的因果路径。

此外，dagitty 提供了定义不同类型的图形模型（cpdags、pdag 等）和识别调整集的方法（还提供了一个基于网络的图形环境：DAGitty）。

特定类型的数据

纵向数据/时间序列和删失数据：时间序列的因果效应估计在 CausalImpact（使用贝叶斯方法）和 CausalMBSTS（用于多元响应）中实现。
GWAS 和 SNP：CKAT 实现了基于核的方法来联合检验一组 SNP 的遗传主效应和基因-治疗交互效应。
示例数据集，用于运行因果推断教科书中的常见示例问题，可以通过 causaldata 包访问。
加权、双模和纵向网络分析在 tnet 中实现。

特定应用领域

行为改变科学使用在 behaviorchange 中实现的专门分析和可视化工具。
使用来自 bhm（用于生物标志物-治疗效果）的工具可以评估生物标志物并估计治疗-生物标志物效应。
定性比较分析类型方法在 cna 中实现。
孟德尔随机化方法用于检查与某些基因相关的因果效应，在 MendelianRandomization、mr.raps（使用稳健调整的轮廓评分进行两样本孟德尔随机化，使用汇总统计数据）、MRPC（使用孟德尔随机化原理的 PC 算法）中实现。
遗传系统中的因果推断方法利用数量性状基因座 (QTL) 基因型来推断表型之间的因果关系：在 qtlnet 中实现了同时推断因果图和遗传结构（非循环和循环）的功能。
tools4uplift 上升建模旨在预测行动（如营销活动）对特定个人的因果影响。
巧合分析通过配置比较方法由 cna 提供。

CRAN 包

核心	cobalt、dagitty、fixest、Matching、MatchIt、mediation、pcalg、PSweight、riskRegression、tmle、WeightIt.
常规	AIPW, allestimates, alpaca, approxmatch, bacondecomp, bartCause, BCEE, BCHM, behaviorchange, bhm, blocksdesign, bmem, Boptbd, borrowr, bpbounds, BuyseTest, causaldata, causaldrf, causaleffect, CausalGAM, CausalGPS, CausalImpact, CausalMBSTS, causaloptim, CausalQueries, causalsens, causalweight, CBPS, cem, cfdecomp, cfma, CIEE, cit, cjoint, CKAT, clusteredinterference, cna, CompareCausalNetworks, Counterfactual, ctmle, designmatch, did, DiPs, DirectEffects, dosearch, DoubleML, DRDID, drtmle, dstat, DTRlearn2, DTRreg, DynTxRegime, ebal, eefAnalytics, EffectLiteR, EffectTreat, endoSwitch, estimatr, evalITR, EValue, experiment, FindIt, FLAME, generalCorr, gfoRmula, gma, grf, gsynth, hdm, hettx, icsw, idem, inferference, interflex, InvariantCausalPrediction, ipcwswitch, ivdesc, ivmodel, ivmte, ivreg, LARF, lmtp, ltmle, maic, maicChecks, marginaleffects, margins, match2C, matchMulti, MatchThem, medflex, MendelianRandomization, microsynth, modelbased, mr.raps, MRPC, MultisiteMediation, mvGPS, netchain, nonlinearICP, optmatch, optweight, OTRselect, OVtool, PanelMatch, paths, personalized, plm, preference, qte, qtlnet, QTOCen, quantoptr, rcbalance, rcbsubset, rdrobust, regmedint, rpsftm, sampleSelection, sbw, scpi, SEMID, sensemakr, seqDesign, simml, simsl, smartsizer, SortedEffects, SPORTSCausal, stdReg, stepp, stratamatch, subdetect, Synth, tableone, ThreeArmedTrials, tidysynth, tnet, tools4uplift, TrendInTrend, twang, twangContinuous, twangMediation, ui, WhatIf.
已归档	confoundr，ITRLearn，ITRSelect。

其他资源

CRAN 任务视图：ClinicalTrials
CRAN 任务视图：Econometrics
CRAN 任务视图：ExperimentalDesign
CRAN 任务视图：GraphicalModels
CRAN 任务视图：Psychometrics