维护者 | Gavin L. Simpson |
联系方式 | ucfagls at gmail.com |
版本 | 2023-12-18 |
URL | https://CRAN.R-project.org/view=Environmetrics |
源代码 | https://github.com/cran-task-views/Environmetrics/ |
贡献 | 欢迎对本任务视图提出建议和改进,可以通过 GitHub 上的问题或拉取请求,或通过电子邮件发送给维护者。有关更多详细信息,请参阅 贡献指南。 |
引用 | Gavin L. Simpson (2023). CRAN 任务视图:生态和环境数据分析。版本 2023-12-18。URL https://CRAN.R-project.org/view=Environmetrics。 |
安装 | 可以使用 ctv 包自动安装此任务视图中的包。例如,ctv::install.views("Environmetrics", coreOnly = TRUE) 安装所有核心包,或 ctv::update.views("Environmetrics") 安装所有尚未安装和更新的包。有关更多详细信息,请参阅 CRAN 任务视图计划。 |
本任务视图包含有关使用 R 分析生态和环境数据的相关信息。
R 的基本版本附带了大量函数,可用于环境统计领域。此功能由 CRAN 提供的大量包补充,这些包提供了专业方法,例如排序和聚类分析技术。本任务视图简要概述了可用的包,按主题或分析类型分组。作为 R 在环境和生态数据分析中流行的证明,统计软件杂志在 2007 年出版了 特刊。
对环境统计感兴趣的人应该参考 空间 视图。补充信息也可在 聚类 和 时空 任务视图中找到。
如果您对添加或改进有任何意见或建议,请与维护者联系,或在上面链接的 GitHub 存储库中提交问题或拉取请求。
下面列出了可用的包和函数,按分析类型分组。
这些软件包具有通用性,在环境统计学领域具有广泛的适用性。
分析物种响应曲线或对其他数据进行建模通常涉及将标准统计模型拟合到生态数据,包括简单(多元)回归、广义线性模型 (GLM)、扩展回归(例如广义最小二乘 [GLS])、广义加性模型 (GAM) 和混合效应模型等。
lm()
和 glm()
分别用于拟合线性模型和广义线性模型。gam()
的实现,其中包括 LOESS 平滑。polr()
拟合序数响应的比例优势模型。基于树的模型在生态学中越来越广泛地使用,特别是由于它们能够将灵活的模型拟合到复杂的数据集,以及树结构的简单直观的输出。 集成方法,如装袋、提升和随机森林,被提倡用于改进基于树的模型的预测,并提供回归模型或分类器中不确定性的信息。
遵循 CART 书中的思想,用于回归、分类和生存分析的树结构模型在
多变量树在
树的集成技术
包 maptree 中提供了用于可视化树的图形工具。
包 mda 和 earth 实现多元自适应回归样条 (MARS),这是一种技术,它提供了比回归树中使用的分段常数函数更灵活的基于树的回归方法。
R 和附加包提供了广泛的排序方法,其中许多是专门的技术,特别适合物种数据的分析。两个主要的包是 ade4 和 vegan。 ade4 源于法国“数据分析”学派的传统,并基于对偶图的使用。 vegan 遵循 Mark Hill、Cajo ter Braak 等人的方法,尽管其实现更接近 Legendre & Legendre (1988) 的《数值生态学,第二版英文版》,Elsevier。当两个包提供重复的功能时,用户应该选择最适合其背景的框架。
prcomp()
函数获得。rda()
(在包 vegan 中)、pca()
(在包 labdsv 中)和 dudi.pca()
(在包 ade4 中)提供了更多面向生态的实现。rda()
和 ade4 中的 pcaiv()
获得。cca()
中实现。decorana()
中实现。dudi.pco()
、labdsv 中的 pco()
、ecodist 中的 pco()
和包 MASS 中的 cmdscale()
中实现。isoMDS()
和包 ecodist 中的 nmds()
提供。nmds()
是 isoMDS()
的包装函数,也由包 labdsv 提供。 vegan 为 isoMDS()
提供辅助函数 metaMDS()
,实现算法的随机启动和 NMDS 结果的标准化缩放。 vegan 在 metaMDS()
中采用的方法是生态数据推荐的方法。coinertia()
和 mcoa()
获得。cancor()
中获得。procrustes()
和 ade4 中的 procuste()
中获得,vegan 和 ade4 都提供函数来测试排序配置之间关联的显著性(通过 Procrustes 旋转评估),使用置换/随机化和蒙特卡罗方法。capscale()
中实现,拟合与 RDA 和 CCA 类似的约束排序模型,但使用任何差异系数。基于模型的多元方法遵循典型的统计建模原理,但针对多元响应。基于模型的排序方法降低了模型组件(通常是随机效应协方差矩阵的预测器效应)的维数,因此它们与排序方法(排序)和回归(例如,信息标准和残差诊断)共享特征。因此,它需要指定响应分布和链接函数,而不是差异度量。与“经典”排序方法不同,通常需要在拟合模型之前先验地指定排序轴的数量。以下包具有不同的特征和功能,但大多数支持创建排序。
biplot()
或 lvplot()
函数构建。实现的排序方法包括,rcim()
或grc()
函数进行无约束排序。grc()
实现Goodman的RC关联模型,而rcim()
则一般拟合行-列交互模型。rrvglm()
函数进行线性响应的约束排序。cqo()
函数。cao()
函数。manylm()
、manyglm()
、traitglm()
和manyany()
函数实现的。coefplot()
函数绘制物种对预测变量的响应及其置信区间,并且可以通过anova()
函数使用重采样策略进行假设检验。lvsplot()
函数可视化排序。Hmsc()
,可以使用biPlot()
函数可视化潜在变量。它具有许多不同的工具,包括为不同采样级别分别制定模型、包含空间效应、包含其他随机效应、根据系统发育结构物种对环境预测变量的响应或分层建模物种与预测变量的关联的选项。HMSC从数据中确定潜在变量的数量,因此不需要指定这些数量。gllvm()
允许拟合无约束、约束和并发排序。与 VGAM 不同,无约束排序基于随机效应公式。约束排序支持固定效应和随机效应公式。并发排序根据定义始终包含随机效应,但也支持作为具有随机斜率的完全随机效应规范。还支持具有潜在变量和随机斜率的第四角模型。排序可以使用 ordiplot()
函数可视化,该函数还允许可视化站点分数的统计不确定性。cgr()
和 cord()
使用高斯 copula 方法拟合多元模型。这两个函数首先需要拟合一个辅助模型,从中提取残差,然后包将其拟合到其方法中。cgr()
拟合一个图形模型,其目的是可视化物种的成对关联。可以使用 plot()
方法可视化生成的网络图。cord()
函数使用高斯 copula 拟合基于模型的排序,可以使用 plot(, biplot = TRUE)
可视化。没有统计不确定性的估计可用。glmmTMB()
,基于模型的排序使用模型中的 rr()
协方差结构拟合。目前没有可视化排序的函数。gjam()
中协方差矩阵的参数来执行降维,但没有能力拟合基于模型的排序。可以拟合性状响应模型,并在模型中包含采样努力的度量。可以拟合具有不同类型物种观测的模型,并包含一些额外的随机效应来解释观测的聚类。输出可以使用 gjamPlot()
或排序 gjamOrdination()
绘制。许多生态分析都是从样本之间差异矩阵开始的。人们付出了大量努力来制定适用于生态数据的各种差异系数。R 和各种贡献包中提供了一些更有用的系数。
生成成对差异的平方、对称矩阵的标准函数包括
dist()
daisy()
vegdist()
dsvdis()
Dist()
distance()
包 analogue 中的函数 distance()
可用于计算一个矩阵的样本与另一个矩阵的样本之间的差异。相同的函数可用于生成成对差异矩阵,尽管上面列出的其他函数更快。distance()
也可用于根据 Gower 系数生成混合数据(二元、序数/名义和连续变量的混合)的矩阵。包 cluster 中的函数 daisy()
为混合模式数据提供了比 distance()
更快的 Gower 系数实现,如果需要标准差异矩阵。包 FD 中的函数 gowdis()
也计算 Gower 系数并实现对序数变量的扩展。
聚类分析旨在识别多变量数据集中的样本组。人们已经提出了解决这个问题的多种方法,但主要技术是层次聚类分析、分区方法(如 k 均值)和有限混合模型或基于模型的聚类。在机器学习文献中,聚类分析是一种无监督学习问题。
Cluster 任务视图提供了对可用聚类分析方法以及适当的 R 函数和包的更详细讨论。
层次聚类分析
hclust()
在标准包 stats 中hcluster()
在 amap 中划分方法
混合模型和基于模型的聚类分析
越来越多的包和书籍专注于使用 R 进行理论生态模型。
betadiver()
在 vegan 中实现了 Koleff 等人 (2003; 动物生态学杂志 72(3), 367-382 ) 中回顾的所有多样性指数。betadiver()
还提供了一个 plot
方法来生成 Koleff 等人 (2003) 中发现的共现频率三角形图。betadisper()
,也在 vegan 中,实现了 Marti Anderson 的基于距离的多元离散度同质性检验(PERMDISP,PERMDISP2),这是 Levene 检验的多元类似物(Anderson 2006;Biometrics 62, 245-253 )。Anderson 等人(2006;Ecology Letters 9(6), 683-693 )展示了这种方法在测量 beta 多样性方面的应用。本节涉及通过允许不完全检测的方法估计种群参数(种群规模、密度、存活概率、栖息地占用率等)。许多这些方法使用标记动物的数据,这些数据被称为“捕获-再捕获”、“标记-再捕获”或“捕获-标记-再捕获”数据。
包 secr 也可以用来模拟来自相应模型的数据。
另请参见 SpatioTemporal 任务视图,了解在移动对象、轨迹下对动物跟踪数据的分析。
ts()
函数创建,但请参见下面的 tseries 或 zoo 以获取替代方案。ar()
和 arima()
函数提供了经典的时间序列功能,用于自回归 (AR)、移动平均 (MA)、自回归移动平均 (ARMA) 和积分 ARMA (ARIMA) 模型。irts()
来处理不规则时间序列。lm
风格编写的回归函数一起使用,例如 lm()
、glm()
、loess()
、rlm()
和 lqs()
(来自 MASS)、randomForest()
(包 randomForest)、rq()
(包 quantreg)等等,同时保留时间序列信息。此外,可以在 TimeSeries 任务视图中找到有关时间序列分析可用包的更完整描述。
请参阅 Spatial CRAN 任务视图,了解 R 中空间分析的概述。
ismev 提供了极值统计模型的功能,并且是 Coles (2001) 极值统计建模导论,Springer,纽约的支持软件。其他用于极值理论的包包括
有关更多信息,请参见 ExtremeValue 任务视图。
专门针对系统发育和进化数据分析的软件包包括
用户可能还会对 Paradis (2006) 的《用 R 分析系统发育和进化》,Springer,纽约感兴趣,该书是 Springer 的 “使用 R!”丛书 中的一本。
现在有几个软件包可用于实现 R 函数,这些函数用于土壤学中广泛使用的方法和方法。
越来越多的软件包可用于实现专门与水文学和海洋学领域相关的方法。另请参见 极值 和 气候学 部分以了解相关软件包。
几个与气候学领域相关的软件包。
现在有几个软件包提供专门的功能来导入、分析和绘制古生态数据。
Stratiplot()
函数以及 rioja 软件包中的 strat.plot()
和 strat.plot.simple
函数绘制地层数据图。还可以参考 tidypaleo 软件包,它提供使用 ggplot()
生成地层图的工具。博客文章 由 tidypaleo 软件包的维护者 Dewey Dunnington 撰写,展示了如何使用该软件包创建地层图。prcurve()
函数支持地层数据的摘要。还有其他几个相关的 R 贡献软件包,它们不适合归类到好的标题下。
核心 | ade4,cluster,labdsv,MASS,mgcv,vegan。 |
常规 | amap, analogue, aod, ape, aqp, BiodiversityR, boral, boussinesq, bReeze, CircStats, circular, cocorresp, Distance, dsm, dyn, dynlm, e1071, earth, ecoCopula, ecodist, EnvStats, equivalence, evd, evdbayes, evir, extRemes, FD, flexmix, forecast, fso, gam, gamair, gjam, gllvm, glmmTMB, Hmsc, ipred, ismev, lme4, maptree, marked, mclust, mda, mefa, metacom, mrds, mvabund, nlme, nsRFA, oce, openair, ouch, party, pastecs, pgirmess, PMCMRplus, popbio, prabclus, pscl, pvclust, qualV, quantreg, quantregGrowth, R2jags, randomForest, Rbeast, Rcapture, rioja, RMark, RMAWGEN, rpart, rtop, seacarb, seas, secr, segmented, sensitivity, simecol, singleRcapture, siplab, sjSDM, soiltexture, spOccupancy, StreamMetabolism, strucchange, surveillance, TMB, topmodel, tseries, unmarked, untb, VGAM, zoo. |
已归档 | dse. |