CRAN 任务视图:生态和环境数据分析

维护者Gavin L. Simpson
联系方式ucfagls at gmail.com
版本2023-12-18
URLhttps://CRAN.R-project.org/view=Environmetrics
源代码https://github.com/cran-task-views/Environmetrics/
贡献欢迎对本任务视图提出建议和改进,可以通过 GitHub 上的问题或拉取请求,或通过电子邮件发送给维护者。有关更多详细信息,请参阅 贡献指南
引用Gavin L. Simpson (2023). CRAN 任务视图:生态和环境数据分析。版本 2023-12-18。URL https://CRAN.R-project.org/view=Environmetrics。
安装可以使用 ctv 包自动安装此任务视图中的包。例如,ctv::install.views("Environmetrics", coreOnly = TRUE) 安装所有核心包,或 ctv::update.views("Environmetrics") 安装所有尚未安装和更新的包。有关更多详细信息,请参阅 CRAN 任务视图计划

简介

本任务视图包含有关使用 R 分析生态和环境数据的相关信息。

R 的基本版本附带了大量函数,可用于环境统计领域。此功能由 CRAN 提供的大量包补充,这些包提供了专业方法,例如排序和聚类分析技术。本任务视图简要概述了可用的包,按主题或分析类型分组。作为 R 在环境和生态数据分析中流行的证明,统计软件杂志在 2007 年出版了 特刊

对环境统计感兴趣的人应该参考 空间 视图。补充信息也可在 聚类时空 任务视图中找到。

如果您对添加或改进有任何意见或建议,请与维护者联系,或在上面链接的 GitHub 存储库中提交问题或拉取请求。

下面列出了可用的包和函数,按分析类型分组。

通用包

这些软件包具有通用性,在环境统计学领域具有广泛的适用性。

对物种响应和其他数据的建模

分析物种响应曲线或对其他数据进行建模通常涉及将标准统计模型拟合到生态数据,包括简单(多元)回归、广义线性模型 (GLM)、扩展回归(例如广义最小二乘 [GLS])、广义加性模型 (GAM) 和混合效应模型等。

基于树的模型

基于树的模型在生态学中越来越广泛地使用,特别是由于它们能够将灵活的模型拟合到复杂的数据集,以及树结构的简单直观的输出。 集成方法,如装袋、提升和随机森林,被提倡用于改进基于树的模型的预测,并提供回归模型或分类器中不确定性的信息。

单变量树

遵循 CART 书中的思想,用于回归、分类和生存分析的树结构模型在

多变量树

多变量树在

树的集成

树的集成技术

maptree 中提供了用于可视化树的图形工具。

mdaearth 实现多元自适应回归样条 (MARS),这是一种技术,它提供了比回归树中使用的分段常数函数更灵活的基于树的回归方法。

排序

R 和附加包提供了广泛的排序方法,其中许多是专门的技术,特别适合物种数据的分析。两个主要的包是 ade4veganade4 源于法国“数据分析”学派的传统,并基于对偶图的使用。 vegan 遵循 Mark Hill、Cajo ter Braak 等人的方法,尽管其实现更接近 Legendre & Legendre (1988) 的《数值生态学,第二版英文版》,Elsevier。当两个包提供重复的功能时,用户应该选择最适合其背景的框架。

基于模型的多元分析

基于模型的多元方法遵循典型的统计建模原理,但针对多元响应。基于模型的排序方法降低了模型组件(通常是随机效应协方差矩阵的预测器效应)的维数,因此它们与排序方法(排序)和回归(例如,信息标准和残差诊断)共享特征。因此,它需要指定响应分布和链接函数,而不是差异度量。与“经典”排序方法不同,通常需要在拟合模型之前先验地指定排序轴的数量。以下包具有不同的特征和功能,但大多数支持创建排序。

差异系数

许多生态分析都是从样本之间差异矩阵开始的。人们付出了大量努力来制定适用于生态数据的各种差异系数。R 和各种贡献包中提供了一些更有用的系数。

生成成对差异的平方、对称矩阵的标准函数包括

analogue 中的函数 distance() 可用于计算一个矩阵的样本与另一个矩阵的样本之间的差异。相同的函数可用于生成成对差异矩阵,尽管上面列出的其他函数更快。distance() 也可用于根据 Gower 系数生成混合数据(二元、序数/名义和连续变量的混合)的矩阵。包 cluster 中的函数 daisy() 为混合模式数据提供了比 distance() 更快的 Gower 系数实现,如果需要标准差异矩阵。包 FD 中的函数 gowdis() 也计算 Gower 系数并实现对序数变量的扩展。

聚类分析

聚类分析旨在识别多变量数据集中的样本组。人们已经提出了解决这个问题的多种方法,但主要技术是层次聚类分析、分区方法(如 k 均值)和有限混合模型或基于模型的聚类。在机器学习文献中,聚类分析是一种无监督学习问题。

Cluster 任务视图提供了对可用聚类分析方法以及适当的 R 函数和包的更详细讨论。

层次聚类分析

划分方法

混合模型和基于模型的聚类分析

生态学理论

越来越多的包和书籍专注于使用 R 进行理论生态模型。

种群动态

本节涉及通过允许不完全检测的方法估计种群参数(种群规模、密度、存活概率、栖息地占用率等)。许多这些方法使用标记动物的数据,这些数据被称为“捕获-再捕获”、“标记-再捕获”或“捕获-标记-再捕获”数据。

secr 也可以用来模拟来自相应模型的数据。

另请参见 SpatioTemporal 任务视图,了解在移动对象、轨迹下对动物跟踪数据的分析。

对种群增长率进行建模

环境时间序列

此外,可以在 TimeSeries 任务视图中找到有关时间序列分析可用包的更完整描述。

空间数据分析

请参阅 Spatial CRAN 任务视图,了解 R 中空间分析的概述。

极值

ismev 提供了极值统计模型的功能,并且是 Coles (2001) 极值统计建模导论,Springer,纽约的支持软件。其他用于极值理论的包包括

有关更多信息,请参见 ExtremeValue 任务视图。

系统发育和进化

专门针对系统发育和进化数据分析的软件包包括

用户可能还会对 Paradis (2006) 的《用 R 分析系统发育和进化》,Springer,纽约感兴趣,该书是 Springer 的 “使用 R!”丛书 中的一本。

土壤科学

现在有几个软件包可用于实现 R 函数,这些函数用于土壤学中广泛使用的方法和方法。

水文学和海洋学

越来越多的软件包可用于实现专门与水文学和海洋学领域相关的方法。另请参见 极值气候学 部分以了解相关软件包。

气候学

几个与气候学领域相关的软件包。

古生态学和地层数据

现在有几个软件包提供专门的功能来导入、分析和绘制古生态数据。

其他软件包

还有其他几个相关的 R 贡献软件包,它们不适合归类到好的标题下。

CRAN 包

核心ade4clusterlabdsvMASSmgcvvegan
常规amap, analogue, aod, ape, aqp, BiodiversityR, boral, boussinesq, bReeze, CircStats, circular, cocorresp, Distance, dsm, dyn, dynlm, e1071, earth, ecoCopula, ecodist, EnvStats, equivalence, evd, evdbayes, evir, extRemes, FD, flexmix, forecast, fso, gam, gamair, gjam, gllvm, glmmTMB, Hmsc, ipred, ismev, lme4, maptree, marked, mclust, mda, mefa, metacom, mrds, mvabund, nlme, nsRFA, oce, openair, ouch, party, pastecs, pgirmess, PMCMRplus, popbio, prabclus, pscl, pvclust, qualV, quantreg, quantregGrowth, R2jags, randomForest, Rbeast, Rcapture, rioja, RMark, RMAWGEN, rpart, rtop, seacarb, seas, secr, segmented, sensitivity, simecol, singleRcapture, siplab, sjSDM, soiltexture, spOccupancy, StreamMetabolism, strucchange, surveillance, TMB, topmodel, tseries, unmarked, untb, VGAM, zoo.
已归档dse.

相关链接

其他资源