CRAN Task View: Analysis of Ecological and Environmental Data

Gavin L. Simpson

CRAN 任务视图：生态和环境数据分析

维护者	Gavin L. Simpson
联系方式	ucfagls at gmail.com
版本	2023-12-18
URL	https://CRAN.R-project.org/view=Environmetrics
源代码	https://github.com/cran-task-views/Environmetrics/
贡献	欢迎对本任务视图提出建议和改进，可以通过 GitHub 上的问题或拉取请求，或通过电子邮件发送给维护者。有关更多详细信息，请参阅贡献指南。
引用	Gavin L. Simpson (2023). CRAN 任务视图：生态和环境数据分析。版本 2023-12-18。URL https://CRAN.R-project.org/view=Environmetrics。
安装	可以使用 ctv 包自动安装此任务视图中的包。例如，`ctv::install.views("Environmetrics", coreOnly = TRUE)` 安装所有核心包，或 `ctv::update.views("Environmetrics")` 安装所有尚未安装和更新的包。有关更多详细信息，请参阅 CRAN 任务视图计划。

简介

本任务视图包含有关使用 R 分析生态和环境数据的相关信息。

R 的基本版本附带了大量函数，可用于环境统计领域。此功能由 CRAN 提供的大量包补充，这些包提供了专业方法，例如排序和聚类分析技术。本任务视图简要概述了可用的包，按主题或分析类型分组。作为 R 在环境和生态数据分析中流行的证明，统计软件杂志在 2007 年出版了特刊。

对环境统计感兴趣的人应该参考空间视图。补充信息也可在聚类和时空任务视图中找到。

如果您对添加或改进有任何意见或建议，请与维护者联系，或在上面链接的 GitHub 存储库中提交问题或拉取请求。

下面列出了可用的包和函数，按分析类型分组。

通用包

这些软件包具有通用性，在环境统计学领域具有广泛的适用性。

软件包 EnvStats 是 Steven Millard 开发的 S-PLUS 模块 EnvironmentalStats 的继任者。一本以书籍形式呈现的用户指南已经发布。

对物种响应和其他数据的建模

分析物种响应曲线或对其他数据进行建模通常涉及将标准统计模型拟合到生态数据，包括简单（多元）回归、广义线性模型 (GLM)、扩展回归（例如广义最小二乘 [GLS]）、广义加性模型 (GAM) 和混合效应模型等。

R 的基本安装提供了 lm() 和 glm() 分别用于拟合线性模型和广义线性模型。
广义最小二乘以及线性与非线性混合效应模型扩展了简单回归模型，以解释观测样本中的聚类、异质性和相关性。软件包 nlme 提供了用于拟合这些模型的函数。该软件包由 Pinheiro & Bates (2000) S 和 S-PLUS 中的混合效应模型，Springer，纽约提供支持。一种更新的混合效应模型方法，它还拟合广义线性混合模型 (GLMM) 和广义非线性混合模型 (GNLMM)，由 lme4 软件包提供，尽管这目前是测试版软件，并且尚不允许误差结构中的相关性。
推荐的软件包 mgcv 通过广义交叉验证拟合 GAM 和广义加性混合模型 (GAMM)，并进行自动平滑度选择。 mgcv 的作者还撰写了一本配套专著，Wood (2017) 广义加性模型；R 入门 第二版。Chapman Hall/CRC，它有一个配套软件包 gamair。
或者，软件包 gam 提供了 S-PLUS 函数 gam() 的实现，其中包括 LOESS 平滑。
可以使用 MASS 软件包中的 Bill Venables 和 Brian Ripley 的 polr() 拟合序数响应的比例优势模型。
GLM 中的负二项式族用于对计数数据中的过度分散进行建模，可在 MASS 中使用。
过度分散计数和比例的模型
- 软件包 pscl 还包含几个用于处理过度分散计数数据的函数。泊松或负二项式分布适用于零膨胀模型和障碍模型。
- aod 提供了一套函数来分析过度分散的计数或比例，以及用于计算例如 AIC、AICc、Akaike 权重的实用函数。
在 segmented 包和 strucchange 包中分别很好地处理了参数模型中的变化点和结构变化检测。 segmented 在 R 新闻文章中进行了讨论。

基于树的模型

基于树的模型在生态学中越来越广泛地使用，特别是由于它们能够将灵活的模型拟合到复杂的数据集，以及树结构的简单直观的输出。集成方法，如装袋、提升和随机森林，被提倡用于改进基于树的模型的预测，并提供回归模型或分类器中不确定性的信息。

单变量树

遵循 CART 书中的思想，用于回归、分类和生存分析的树结构模型在

推荐的包 rpart 中实现
party 提供了条件推理树的实现，它将树结构回归模型嵌入到定义明确的条件推理程序理论中

多变量树

多变量树在

包 party 中也能够处理多变量响应。

树的集成

树的集成技术

Breiman 和 Cutler 的随机森林方法在 randomForest 中实现，提供基于使用随机输入的树林的分类和回归
包 ipred 提供了用于改进分类、回归和生存问题的预测模型的函数。

包 maptree 中提供了用于可视化树的图形工具。

包 mda 和 earth 实现多元自适应回归样条 (MARS)，这是一种技术，它提供了比回归树中使用的分段常数函数更灵活的基于树的回归方法。

排序

R 和附加包提供了广泛的排序方法，其中许多是专门的技术，特别适合物种数据的分析。两个主要的包是 ade4 和 vegan。 ade4 源于法国“数据分析”学派的传统，并基于对偶图的使用。 vegan 遵循 Mark Hill、Cajo ter Braak 等人的方法，尽管其实现更接近 Legendre & Legendre (1988) 的《数值生态学，第二版英文版》，Elsevier。当两个包提供重复的功能时，用户应该选择最适合其背景的框架。

主成分分析 (PCA) 可通过 prcomp() 函数获得。rda()（在包 vegan 中）、pca()（在包 labdsv 中）和 dudi.pca()（在包 ade4 中）提供了更多面向生态的实现。
冗余分析 (RDA) 可通过 vegan 中的 rda() 和 ade4 中的 pcaiv() 获得。
典型对应分析 (CCA) 在 vegan 和 ade4 中的 cca() 中实现。
去趋势对应分析 (DCA) 在 vegan 中的 decorana() 中实现。
主坐标分析 (PCO) 在 ade4 中的 dudi.pco()、labdsv 中的 pco()、ecodist 中的 pco() 和包 MASS 中的 cmdscale() 中实现。
非度量多维尺度 (NMDS) 由包 MASS 中的 isoMDS() 和包 ecodist 中的 nmds() 提供。nmds() 是 isoMDS() 的包装函数，也由包 labdsv 提供。 vegan 为 isoMDS() 提供辅助函数 metaMDS()，实现算法的随机启动和 NMDS 结果的标准化缩放。 vegan 在 metaMDS() 中采用的方法是生态数据推荐的方法。
惯性分析可以通过 ade4 中的 coinertia() 和 mcoa() 获得。
共对应分析用于关联两个生态物种数据矩阵，可在 cocorresp 中获得。
典型相关分析 (CCoA - 不要与上面的 CCA 混淆) 可在标准包 stats 中的 cancor() 中获得。
Procrustes 旋转可在 vegan 中的 procrustes() 和 ade4 中的 procuste() 中获得，vegan 和 ade4 都提供函数来测试排序配置之间关联的显著性（通过 Procrustes 旋转评估），使用置换/随机化和蒙特卡罗方法。
约束主坐标分析 (CAP)，在 vegan 中的 capscale() 中实现，拟合与 RDA 和 CCA 类似的约束排序模型，但使用任何差异系数。
模糊集排序 (FSO) 是 CCA/RDA 和 CAP 的替代方法，可在包 fso 中获得。 fso 补充了 Dave Roberts 最近发表在《生态学》杂志上的关于模糊集的论文（2008 年，多维模糊集排序的统计分析。生态学 89(5), 1246-1260）。

基于模型的多元分析

基于模型的多元方法遵循典型的统计建模原理，但针对多元响应。基于模型的排序方法降低了模型组件（通常是随机效应协方差矩阵的预测器效应）的维数，因此它们与排序方法（排序）和回归（例如，信息标准和残差诊断）共享特征。因此，它需要指定响应分布和链接函数，而不是差异度量。与“经典”排序方法不同，通常需要在拟合模型之前先验地指定排序轴的数量。以下包具有不同的特征和功能，但大多数支持创建排序。

VGAM 包实现了基于固定效应的排序。排序图使用 biplot() 或 lvplot() 函数构建。实现的排序方法包括，
- 使用rcim()或grc()函数进行无约束排序。grc()实现Goodman的RC关联模型，而rcim()则一般拟合行-列交互模型。
- 使用rrvglm()函数进行线性响应的约束排序。
- 约束二次排序（CQO；以前称为典型高斯排序（CGO）），它是典型对应分析（CCA）的极大似然估计替代方法，由二次降秩向量GLM拟合，使用cqo()函数。
- 约束加性排序（CAO），是CQO对灵活响应曲线的扩展，使用cao()函数。
mvabund不执行排序，而是根据GLM原理拟合多元模型，可能具有物种的残差相关结构。这是使用manylm()、manyglm()、traitglm()和manyany()函数实现的。coefplot()函数绘制物种对预测变量的响应及其置信区间，并且可以通过anova()函数使用重采样策略进行假设检验。
boral代表“贝叶斯排序和回归分析”，它在贝叶斯框架中使用潜在变量公式拟合联合物种分布模型（JSDM），其中模型通过R2jags拟合。该包支持残差和无约束排序，可能具有空间结构的潜在变量，以及堆叠模型（即GLM），具有站点随机效应。可以拟合具有不同类型物种观测值的模型，例如，将二元数据和计数数据组合到一个模型中。对于功能性状，boral拟合四角模型。Boral允许通过随机搜索变量选择进行自动变量选择，即使用尖峰和板先验。由于boral仅使用一个MCMC链拟合模型，因此可能难以评估模型的收敛性，尽管可以使用Geweke诊断统计量来帮助评估。可以使用lvsplot()函数可视化排序。
Hmsc在贝叶斯框架中使用潜在变量公式拟合联合物种分布模型（JSDM），用于正态响应、二元响应和计数。 “HMSC”代表“物种群落的层次模型”，因此该包允许拟合多元响应的层次模型。其主要函数是Hmsc()，可以使用biPlot()函数可视化潜在变量。它具有许多不同的工具，包括为不同采样级别分别制定模型、包含空间效应、包含其他随机效应、根据系统发育结构物种对环境预测变量的响应或分层建模物种与预测变量的关联的选项。HMSC从数据中确定潜在变量的数量，因此不需要指定这些数量。
gllvm 使用 TMB 为各种响应拟合潜在变量模型，用于排序和 JSDM 目的，并具有随机效应，速度相对较快。其主要函数 gllvm() 允许拟合无约束、约束和并发排序。与 VGAM 不同，无约束排序基于随机效应公式。约束排序支持固定效应和随机效应公式。并发排序根据定义始终包含随机效应，但也支持作为具有随机斜率的完全随机效应规范。还支持具有潜在变量和随机斜率的第四角模型。排序可以使用 ordiplot() 函数可视化，该函数还允许可视化站点分数的统计不确定性。
ecoCopula 使用主要函数 cgr() 和 cord() 使用高斯 copula 方法拟合多元模型。这两个函数首先需要拟合一个辅助模型，从中提取残差，然后包将其拟合到其方法中。cgr() 拟合一个图形模型，其目的是可视化物种的成对关联。可以使用 plot() 方法可视化生成的网络图。cord() 函数使用高斯 copula 拟合基于模型的排序，可以使用 plot(, biplot = TRUE) 可视化。没有统计不确定性的估计可用。
glmmTMB 使用 TMB 通用地拟合随机效应模型，因此可以拟合具有附加随机效应的基于模型的无约束排序。其主要函数是 glmmTMB()，基于模型的排序使用模型中的 rr() 协方差结构拟合。目前没有可视化排序的函数。
sjSDM 将 JSDM 拟合到高斯、伯努利或泊松响应，但不是使用潜在变量公式，而是使用弹性网络惩罚方法。因此，它不是一种基于模型的排序方法。它允许包含空间效应，以及其他一些扩展。它允许使用 CPU 和 GPU 资源进行计算，这使得它成为一种非常快速的拟合方法，可以很好地扩展到大型数据集。
gjam 在贝叶斯框架中将广义联合属性模型拟合到各种响应类型。该包可以在事后使用 PCA 或 NMDS 进行排序，并通过设置 gjam() 中协方差矩阵的参数来执行降维，但没有能力拟合基于模型的排序。可以拟合性状响应模型，并在模型中包含采样努力的度量。可以拟合具有不同类型物种观测的模型，并包含一些额外的随机效应来解释观测的聚类。输出可以使用 gjamPlot() 或排序 gjamOrdination() 绘制。
spOccupancy 适合单物种和多物种响应的占用模型，可用于拟合考虑不完美检测的 JSDM。

差异系数

许多生态分析都是从样本之间差异矩阵开始的。人们付出了大量努力来制定适用于生态数据的各种差异系数。R 和各种贡献包中提供了一些更有用的系数。

生成成对差异的平方、对称矩阵的标准函数包括

标准包 stats 中的 dist()
推荐包 cluster 中的 daisy()
vegan 中的 vegdist()
labdsv 中的 dsvdis()
amap 中的 Dist()
ecodist 中的 distance()
ade4 中的一套函数

包 analogue 中的函数 distance() 可用于计算一个矩阵的样本与另一个矩阵的样本之间的差异。相同的函数可用于生成成对差异矩阵，尽管上面列出的其他函数更快。distance() 也可用于根据 Gower 系数生成混合数据（二元、序数/名义和连续变量的混合）的矩阵。包 cluster 中的函数 daisy() 为混合模式数据提供了比 distance() 更快的 Gower 系数实现，如果需要标准差异矩阵。包 FD 中的函数 gowdis() 也计算 Gower 系数并实现对序数变量的扩展。

聚类分析

聚类分析旨在识别多变量数据集中的样本组。人们已经提出了解决这个问题的多种方法，但主要技术是层次聚类分析、分区方法（如 k 均值）和有限混合模型或基于模型的聚类。在机器学习文献中，聚类分析是一种无监督学习问题。

Cluster 任务视图提供了对可用聚类分析方法以及适当的 R 函数和包的更详细讨论。

层次聚类分析

hclust() 在标准包 stats 中
推荐包 cluster 提供了用于聚类分析的函数，这些函数遵循 Kaufman 和 Rousseeuw (1990) 在《数据中的分组：聚类分析入门》一书中描述的方法，Wiley，纽约
hcluster() 在 amap 中
pvclust 是一个用于评估层次聚类分析中不确定性的包。它提供了近似无偏的 *p* 值以及引导 *p* 值。

划分方法

kmeans() 在 stats 中提供了 *k* 均值聚类
cmeans() 在 e1071 中实现了 *k* 均值算法的模糊版本
推荐包 cluster 还提供了用于各种划分方法的函数。

混合模型和基于模型的聚类分析

mclust 和 flexmix 提供了基于模型的聚类分析的实现。
prabclus 通过计算距离的 MDS 并将最大似然高斯混合聚类应用于 MDS 点，对物种存在-不存在矩阵对象进行聚类。维护者 Christian Hennig 的网站包含一些在生态学背景下使用 prabclus 的出版物，特别是 Hausdorf & Hennig (2007; Oikos 116 (2007), 818-828 )。

生态学理论

越来越多的包和书籍专注于使用 R 进行理论生态模型。

vegan 提供了与生态学理论相关的广泛功能，例如多样性指数（包括“所谓的”希尔数 [例如希尔 N ² ] 和稀释）、等级丰度图、费舍尔对数级数、折棍模型、哈贝尔丰度模型等。
untb 提供了用于生物多样性数据的实用程序集合，包括在哈贝尔的统一中性生物多样性理论下模拟生态漂移，以及计算各种诊断信息，例如普雷斯顿曲线。
包 BiodiversityR 提供了用于生物多样性和群落生态学分析的 GUI。
函数 betadiver() 在 vegan 中实现了 Koleff 等人 (2003; 动物生态学杂志 72(3), 367-382 ) 中回顾的所有多样性指数。betadiver() 还提供了一个 plot 方法来生成 Koleff 等人 (2003) 中发现的共现频率三角形图。
函数betadisper()，也在 vegan 中，实现了 Marti Anderson 的基于距离的多元离散度同质性检验（PERMDISP，PERMDISP2），这是 Levene 检验的多元类似物（Anderson 2006；Biometrics 62, 245-253 ）。Anderson 等人（2006；Ecology Letters 9(6), 683-693 ）展示了这种方法在测量 beta 多样性方面的应用。
FD 包从多个性状计算几种功能多样性指标。

种群动态

本节涉及通过允许不完全检测的方法估计种群参数（种群规模、密度、存活概率、栖息地占用率等）。许多这些方法使用标记动物的数据，这些数据被称为“捕获-再捕获”、“标记-再捕获”或“捕获-标记-再捕获”数据。

Rcapture 拟合对数线性模型以估计捕获-再捕获数据中的种群规模和存活率，如 Baillargeon 和 Rivest (2007) 所述。
secr 估计给定来自陷阱、被动 DNA 采样、自动相机、录音机等的时空明确捕获-再捕获数据的种群密度。模型通过最大似然法拟合。检测函数可以是半正态、指数、累积伽马等。可以拟合密度表面。密度和检测参数的协变量通过公式指定。
unmarked 拟合受不完全检测影响的物种的发生和丰度的分层模型。示例包括单季和多季占用模型、二项式混合模型和分层距离抽样模型。数据可以来自调查方法，例如时间重复计数、移除抽样、双观察者抽样和距离抽样。控制状态和观察过程的参数可以建模为协变量的函数。
包 RMark 为 MARK 包提供了一个基于公式的 R 接口，该包拟合各种捕获-再捕获模型。有关更多详细信息，请参阅 RMark 网站和 NOAA 报告 (PDF)。
包 marked 提供了一个用于处理标记-再捕获数据和分析的框架。 marked 可以通过最大似然法拟合 Cormack-Jolly-Seber (CJS) 和 Jolly-Seber (JS) 模型，以及通过 MCMC 拟合 CJS 模型。CJS 模型的最大似然估计可以通过 R 或通过与自动微分模型构建器软件的链接获得。包的描述已发表在《生态与进化方法》杂志上。
mrds 将检测函数拟合到点和线样带距离抽样调查数据（用于单观察者和双观察者调查）。可以使用 Horvitz-Thompson 型估计量估计丰度。
Distance 是一个更简单的接口，用于 mrds 用于单观察者距离抽样调查。
dsm 将密度表面模型拟合到空间参考的距离抽样数据。计数数据使用通过 mrds 或 Distance 拟合的检测函数模型进行校正。空间模型的构建方式与 mgcv 相同。
singleRcapture 提供了使用单源捕获-再捕获方法估计难以到达种群规模的方法。它实现了零截断、零一截断、零截断一膨胀和一膨胀零截断计数回归模型，以及 Chao 和 Zelterman 模型。它提供了拟合评估函数、诊断图和四种估计种群规模方差的方法。

包 secr 也可以用来模拟来自相应模型的数据。

另请参见 SpatioTemporal 任务视图，了解在移动对象、轨迹下对动物跟踪数据的分析。

对种群增长率进行建模

包 popbio 可用于构建和分析年龄或阶段特异性矩阵种群模型。

环境时间序列

R 中的时间序列对象使用 ts() 函数创建，但请参见下面的 tseries 或 zoo 以获取替代方案。
标准包 stats 中的 ar() 和 arima() 函数提供了经典的时间序列功能，用于自回归 (AR)、移动平均 (MA)、自回归移动平均 (ARMA) 和积分 ARMA (ARIMA) 模型。
forecast 包提供了方法和工具，用于显示和分析单变量时间序列预测，包括通过状态空间模型的指数平滑和自动 ARIMA 建模。
dse (已归档) 包提供了各种更高级的估计方法和多元时间序列分析。
包 tseries 和 zoo 提供了对时间序列数据的通用处理和分析。
可以使用包 zoo 以及包 tseries 中的 irts() 来处理不规则时间序列。
pastecs 提供专门针对时空生态序列分析的功能。
strucchange 允许测试、确定和监控线性回归关系中的结构变化。
检测时间序列数据中的变化点 - 请参见上面的 segmented。
surveillance 包实现了统计方法，用于对计数、比例和分类数据的时序进行建模和变化点检测。重点是计数数据时序中的疫情检测。
包 dynlm 提供了一个方便的接口，通过普通最小二乘法拟合时间序列回归。
包 dyn 提供了一种与 dynlm 不同的方法，它允许将时间序列数据与任何以 lm 风格编写的回归函数一起使用，例如 lm()、glm()、loess()、rlm() 和 lqs()（来自 MASS）、randomForest()（包 randomForest）、rq()（包 quantreg）等等，同时保留时间序列信息。
openair 提供了许多工具来分析、解释和理解空气污染时间序列数据。
bReeze 包是广泛使用的分析、可视化和解释风数据的集合。风能资源分析随后可以与风力涡轮机的特性相结合，以估计潜在的能量产量。
Rbeast 包提供了一种贝叶斯模型平均方法，用于将时间序列分解为突变、趋势和季节性，可用于变化点检测、时间序列分解和非线性趋势分析。

此外，可以在 TimeSeries 任务视图中找到有关时间序列分析可用包的更完整描述。

空间数据分析

请参阅 Spatial CRAN 任务视图，了解 R 中空间分析的概述。

极值

ismev 提供了极值统计模型的功能，并且是 Coles (2001) 极值统计建模导论，Springer，纽约的支持软件。其他用于极值理论的包包括

evir
evd
evdbayes，提供了一种基于贝叶斯方法的极值理论方法
extRemes

有关更多信息，请参见 ExtremeValue 任务视图。

系统发育和进化

专门针对系统发育和进化数据分析的软件包包括

用户可能还会对 Paradis (2006) 的《用 R 分析系统发育和进化》，Springer，纽约感兴趣，该书是 Springer 的 “使用 R！”丛书中的一本。

土壤科学

现在有几个软件包可用于实现 R 函数，这些函数用于土壤学中广泛使用的方法和方法。

soiltexture 提供了用于土壤质地图、分类和转换的函数。
aqp 包含与土壤资源建模、土壤分类、土壤剖面聚合和可视化相关的算法集合。
R-Forge.R-project.org 上的土壤水项目提供了软件包，这些软件包提供了土壤水分保持函数、土壤水力传导率函数和土壤传递函数，以根据易于获得的土壤特性估计其参数。该项目包含两个软件包：soilwaterfun 和 soilwaterptf。

水文学和海洋学

越来越多的软件包可用于实现专门与水文学和海洋学领域相关的方法。另请参见极值和气候学部分以了解相关软件包。

topmodel 是一组水文函数，包括 TOPMODEL 水文模型的 R 实现，该模型基于 Keith Beven 1995 年的 FORTRAN 版本。新功能正在作为 R-Forge 上的 RHydro 软件包的一部分开发。
软件包 seacarb 提供了用于计算海水碳酸盐系统参数的函数。
Stephen Sefick 的 StreamMetabolism 软件包包含用于计算河流代谢特征的函数，例如 GPP、NDM 和 R，这些特征来自单站昼夜氧气曲线。
软件包 oce 支持海洋数据的分析，包括 ADP 测量、CTD 测量、断面数据、海平面时间序列和海岸线文件。
The nsRFA package provides a collection of statistical tools for objective (non-supervised) applications of the Regional Frequency Analysis methods in hydrology.
The boussinesq package is a collection of functions implementing the one-dimensional Boussinesq Equation (ground-water).
rtop is a package for geostatistical interpolation of data with irregular spatial support such as runoff related data or data from administrative units.
A related package is qualV which provides quantitative and qualitative criteria to compare models with data and to measure similarity of patterns

气候学

几个与气候学领域相关的软件包。

seas implements a number of functions for analysis and graphics of seasonal data.
RMAWGEN is a set of S3 and S4 functions for spatial multi-site stochastic generation of daily time series of temperature and precipitation making use of Vector Autoregressive Models.

古生态学和地层数据

现在有几个软件包提供专门的功能来导入、分析和绘制古生态数据。

包括加权平均 (WA)、现代模拟技术 (MAT)、局部加权 WA 和最大似然 (也称为高斯逻辑) 回归 (GLR) 的传递函数模型由 rioja 和 analogue 软件包提供。
常见、遗留、古数据格式的导入由软件包 vegan（康奈尔格式）提供。
可以使用 analogue 中的 Stratiplot() 函数以及 rioja 软件包中的 strat.plot() 和 strat.plot.simple 函数绘制地层数据图。还可以参考 tidypaleo 软件包，它提供使用 ggplot() 生成地层图的工具。博客文章由 tidypaleo 软件包的维护者 Dewey Dunnington 撰写，展示了如何使用该软件包创建地层图。
analogue 为开发和解释 MAT 传递函数模型提供了广泛的支持，包括 ROC 曲线分析。通过 prcurve() 函数支持地层数据的摘要。

其他软件包

还有其他几个相关的 R 贡献软件包，它们不适合归类到好的标题下。

Andrew Robinson 的 equivalence 软件包提供了一些统计检验和图形，用于评估等效性检验。此类检验将相似性作为备择假设，而不是零假设。该软件包包含用于执行等效性的双边单尾 t 检验 (TOST) 和配对 t 检验的函数。
Thomas Petzoldt 的 simecol 软件包提供了一个面向对象的框架和工具，用于在 R 中模拟生态（和其他）动态系统。有关更多信息，请参见 simecol 网站和 R 新闻文章。
用于循环统计的函数可以在 CircStats 和 circular 中找到。
e1071 软件包提供用于潜在类别分析、短时傅里叶变换、模糊聚类、支持向量机、最短路径计算、袋装聚类、朴素贝叶斯分类器等的函数。
pgirmess 软件包提供了一套用于生态学数据分析的杂项函数。
mefa 提供用于处理和报告生态学和生物地理学中多变量计数数据的函数。
模型的敏感性分析由 sensitivity 软件包提供。 sensitivity 包含用于模型输出的因子筛选和全局敏感性分析的函数集合。
用于分析相干性、边界聚集和周转的函数，遵循 Leibold 和 Mikkelson (2002) 的基于模式的元群落分析，在 metacom 软件包中提供。
通过非交叉和非参数回归分位数实现的生长曲线估计在 quantregGrowth 软件包中实现。一篇支持性论文是 Muggeo 等人 (2013)。
siplab 软件包提供了一个 R 平台，用于试验空间显式个体为基础的植被模型。一篇支持性论文是 García, O. (2014)。
PMCMRplus 提供用于连续或至少基于区间的变量的参数和非参数多对一和全对多重比较程序。该软件包提供了涉及成对多重比较的各种测试的实现。

CRAN 包

核心	ade4，cluster，labdsv，MASS，mgcv，vegan。
常规	amap, analogue, aod, ape, aqp, BiodiversityR, boral, boussinesq, bReeze, CircStats, circular, cocorresp, Distance, dsm, dyn, dynlm, e1071, earth, ecoCopula, ecodist, EnvStats, equivalence, evd, evdbayes, evir, extRemes, FD, flexmix, forecast, fso, gam, gamair, gjam, gllvm, glmmTMB, Hmsc, ipred, ismev, lme4, maptree, marked, mclust, mda, mefa, metacom, mrds, mvabund, nlme, nsRFA, oce, openair, ouch, party, pastecs, pgirmess, PMCMRplus, popbio, prabclus, pscl, pvclust, qualV, quantreg, quantregGrowth, R2jags, randomForest, Rbeast, Rcapture, rioja, RMark, RMAWGEN, rpart, rtop, seacarb, seas, secr, segmented, sensitivity, simecol, singleRcapture, siplab, sjSDM, soiltexture, spOccupancy, StreamMetabolism, strucchange, surveillance, TMB, topmodel, tseries, unmarked, untb, VGAM, zoo.
已归档	dse.

其他资源

CRAN 任务视图：Cluster
CRAN 任务视图：ExtremeValue
CRAN 任务视图：Spatial
CRAN 任务视图：SpatioTemporal
CRAN 任务视图：TimeSeries
R-Forge 项目：RHydro
R-Forge 项目：soilwaterfun
R-Forge 项目：soilwaterptf
GitHub 项目：tidypaleo