精选 | 2017年11月R新包推荐
一. 文档概述
11月份,在R官方(CRAN)共计发布了237个新包,本文选摘了40个R包,包含以下几个类别:计算方法、数据、数据科学、科学、社会科学、工具及可视化等,其余包大家可登录CRAN自行查看,希望有助于大家的学习,感谢大家对R语言中文社区的支持!
二. 详细介绍
1. 计算方法
1)CVXR v0.94-4: 实现了一种面向对象建模语言,用于规范的凸规划(DCP),允许用户制定和解决凸优化问题.
2)PreciseSums v0.1: 实现了Kahan(1965) 和Neumaier(1974)的summation算法.
2. 数据
1)ballr v0.1.1: 提供数据接口/函数获取篮球站点数据(basketball-reference.com)
2)biofiles v1.0.0: 提供函数来解析GenBank / GenPept记录到本机R对象,访问和操作序列、注释信息.
3)ipumsr v0.1.1: 支持用户从IPUMS(世界人口微观共享数据库)导入人口普查、调查和地理数据,在R中进行处理、可视化等操作.
4)proPubBills v0.1: 对ProPublica API进行封装,可以通过该包进行相关操作.(ProPublica是一家针对美国社会公共兴趣进行调查报道的独立非营利机构)
5)Rpolyhedra v0.1.0: 包含142个多面体数据库,从PHD文件中获取R6对象,并提供rgl 可视化功能.
6)voteogram v0.2.0: 支持从ProPublica检索美国国会投票数据,同时使用ggplot2进行可视化展示,创建投票统计图和主题.
3. 数据科学
1)imbalance v0.1.1: 提供了多种算法处理不平衡数据集(重点推荐).
2)intrinsicdimension v1.1.0: 为评估数据集的内在维度实现了多种方法,该问题出现在 Johnsson等人的论述中.
3)ppclust v0.1.0: 实现分区数据集的概率聚类算法,包括Fuzzy C-Means (Bezdek, 1974), Possibilistic C-Means (Krishnapuram & Keller, 1993)等.
4)textrank v0.2.0: 实现textrank算法,这是文本的Pagerank算法的扩展.
5)TrajDataMining v0.1.4: 包含一组用于轨迹数据准备的方法,如过滤、压缩和聚类,以及轨迹模式的发现.
4. 科学
1)benthos v1.3-4: 为分析海洋底栖生物数据,提供数据预处理工具和生物多样性度量工具.
2)nlmixr v0.9.0-1: 在药物动力学和药效学中,提供了常见的弹性剂量信息的微分方程非线性混合效应模型的拟合和比较函数.
3)PCRedux v0.2.5-1: 提供了提取聚合酶链反应(qPCR)放大曲线数据的功能.
Clustering via Hausdorff distance
4)PDN v0.1.0: 通过Cabrera等人的论文(2016),提供建立病人水平网络的工具来预测医疗结果.
5)Rraven v1.0.0: 提供一种工具来交换R和Raven声音分析软件之间的数据.
6)spew v1.3.0: 提供用于生成合成人口和生态系统的工具.
5. 社会科学
1)EvolutionaryGames v0.1.0: 提供一组工具来说明进化博弈理论的核心概念,如进化稳定性、各种进化动力学,可用于教学和学术研究.
6. 统计学
1)[bang(https://CRAN.R-project.org/package=bang)] v1.0.0: 提供了一些简单通用模型的贝叶斯分析函数,不使用马尔可夫链蒙特卡洛(MCMC)方法,如Gibbs抽样.
2)beast v1.0: 给出了多元时间序列中变化点的贝叶斯估计方法.
3)CorShrink v0.1.1: 提供函数来执行相关/协方差矩阵的自适应收缩,在关联的Fisher z变换之前使用混合模型.
4)dvmisc v1.1.1: 提供基础R函数的更快版本(例如,平均值、标准偏差、协方差、加权平均值),主要是用c++编写.
5)inlabru v2.1.2: 通过INLA包,使用集成嵌套拉普拉斯逼近进行空间建模,并实现了对单变量和空间点过程建模中,实现对数高斯Cox过程.
6)outbreaker2 v1.0-0: 允许用户利用流行病学和遗传信息重建疾病暴发.
7)probout v1.0: 提供函数来估计多变量数值数据的非监督离群概率,并通过非参数离群统计量进行观测.
8)quokar v0.1.0: 为分位数回归模型提供诊断方法,包括检测有影响的观测值、鲁棒距离法、广义库克距离、平均后验概率和kullback - leibler散度方法.
Robust Distance-Residual Plot 9)tidyposterior v0.0.1: 这个令人难忘的命名包实现了一个Bayesian方法来检验模型之间的差异,目的是为了回答这个问题:“当考虑重新采样的结果时,模型之间的区别是真实的吗?”这些方法与Benavoli等人(2017)所描述的方法相似.
10)trialr v0.0.1: 提供一个贝叶斯临床试验设计的展示,在RStan包和R中实现,同时包含第一次在R中实现的一些设计 (例如:EffTox’ by Thall & Cook (2004).
11)tvReg v0.2.1: 针对独立的和相关的方程,提供了时间变系数拟合方程的函数.
7. 工具
1)cli v1.0.0: 实现了一套旨在构建具有吸引力的命令行界面的工具.
2)float v0.1-1: 扩展了R的线性代数功能,包括32位浮点(单精度)数据.
3)mudata2 v1.0.0: 提供易于组织和可视化时空数据的功能和数据结构.
4)rhub v1/0.2: 为R-Hub提供了一个接口,该系统由R联盟发起.
8. 可视化
1)ALEPlot v1.0: 在黑箱监督学习模型中,提供了可视化个体预测变量的主要影响和二阶交互影响的功能
2)dbplot v0.1.1: 利用dplyr包处理数据库内的图形计算功能.
3)ggalluvial v0.5.0: 使用ggplot2的stat和geom图层,展示冲积图以及可视化多个数据类型派生的关联结构.
4)shinyaframe v1.0.1: 使用户能够在基于web的虚拟现实体验中获得R数据,用于沉浸式、跨平台的数据可视化.
5)tactile v0.1.0: lattice包的扩展,提供新的高级函数、现有函数的方法、面板函数和主题.
附注:本文由黄小伟翻译,限于个人水平,如有错误,欢迎批评指正!