精选 | 2018年3月R新包推荐
作者:Joseph Rickert
翻译:黄小伟,先后从事游戏、社交及金融数据研究及应用,目前就职网易杭州
2018年3月份,共有约200个R新包收录于CRAN,本文选摘了其中40个新包加以功能简述,主要包括:计算方法、数据、数据科学、科学、统计、时间序列、工具和可视化等。希望有助于大家的学习!
一. 计算方法
1. dynprog: 提供将递归快速转换为动态编程算法的工具。
2. fmlogcondens: 实现了多元对数凹函数族最大似然估计的快速求解。
3. knor: 提供对knor的访问,用于计算k-means算法。
二. 数据
1. daymetr: 提供Daymet气候数据的编程接口,并支持相关分析。
2. NOAAWeather: 提供从所有NOAA站点检索实时天气数据的功能,并支持绘制时间序列、箱线图、热图和地理空间图等图形。
3. ppitables: 提供部分国家的相关数据,以确定基于其PPI(贫困概率指数)的贫困家庭可能性,同时提供了创新扶贫行动的相关资料。
4. usfertilizer: 提供了美国各个县在1945年至2012年,所使用肥料、氮和磷的统计数据。
三. 数据科学
1. greybox: 基于偏相关性的信息标准,实现模型选择和组合的工具。
2. h2o4gpu: 实现H2O4GPU的接口,这是一组用于机器学习算法的GPU解算器。
3. iml: 提供了部分具备可解释性的方法,用于分析机器学习模型的行为和预测结果。包括特征重要性、局部依赖图、Shapley值和树替代模型等。
4. iTOP: 提供函数来推断不同数据集之间的拓扑结构关系,该方法是基于RV系数的扩展。
5. onnx: 实现了ONNX的接口(the Open Neural Network Exchange),为机器学习模型提供了一种开源的格式。
6. rcqp: 实现基于CWB软件的语料库查询协议功能,这是一组用于管理和查询大型文本语料库的开源工具。
四. 政治科学
1. coalitions: 根据调查结果数据,利用MCMC方法计算联盟大多数的概率。
五. 科学
1. diagmeta: 采用Steinhauser等人2016年提出的方法,对诊断精度研究进行荟萃分析。
2. NetworkExtinction: 提供了模拟食物链中物种灭绝的功能,并分析了Dunne等人所描述的连锁效应。
3. foreSIGHT: 提供工具来创建水文气候场景、压力测试、可视化等系统,用于气候变化影响的评估。
4. PINSPlus: 根据Nguyen等人2017年提出的方法,提供了一种扰动聚类方法,将疾病的数据和分类整合到不同亚型。
六. 统计
1. chandwich: 根据Chandler和Bate在2007年提出的方法,提供了使用参数协方差矩阵的稳健三明治估计量,调整独立对数似然函数。
2. ciuupi: 当存在不确定的先验信息时,提供函数来计算具有iid正态误差和已知方差的线性回归参数组合的置信区间。
3. CoxPhLb: 利用Cox模型用于分析右截断、长度偏差数据。包括模型拟合和检验、平稳性假设检验等。
4. cutpointr: 提供函数来估计、优化二进制分类任务中指定度量标准的切点,并使用自助法来验证性能。
5. fcr: 提供了部分函数,用于功能并发回归中的动态预测问题,并对函数:pffr()进行了扩展。
6. ggdag: 基于DAGitty web工具,提供对有序的非循环图的整理、分析和绘图功能。
7. hdme: 对于广义线性模型的误差度量提供了部分函数,包括套索(L1惩罚)、广义矩阵不确定性选择器等。
8. joineRmeta: 扩展了Henderson等人2000年提出的联合模型,包括多元研究、元分析案例等。
9. rare: 借助Yan和Bien在2018年提出的交替方向法,构建了基于树的套索正则化的线性模型。
七. 时间序列
1. rMEA: 提供读取、可视化和输出双变量运动能量时间序列的工具。
2. tsfknn: 提供使用最近邻回归预测时间序列的功能。
3. spGARCH: 提供了部分功能,用于分析空间和时空自回归条件异位、空间ARCH类型过程的模拟、spARCH模型参数的准极大似然估计等问题。
八. 工具
1. base2grob: 提供了一个函数将基础绘图函数对象转化为grob对象,并与grid系统兼容。
2. cranly: 提供用于清理、组织、总结和可视化CRAN包信息的功能,以及构建包指示网络(依赖、导入、建议、增强)和协作网络的功能。
3. osrmr: 对OSRM(Open Source Routing Machine)API实现了封装。
4. fasterize: 对raster包的函数:rasterize()提供了一个快速的简单替换,它采用sf类型对象和Wylie等人在1967年提出的扫描线算法(scan line algorithm)。
5. jsr223: 提供了一个高质量的集成,使得在R中方便的调用Java对象,同时提供了统一的接口,可以在R中方便的调用其他编程语言,诸如Groovy、JS、Ruby等。
九. 可视化
1. clustree: 随着分辨率的增加,提供函数来生成聚类树可视化展示。
2. datamaps: 在RStudio、Shiny app等环境中,创建具有气泡和圆弧的交互式轮廓图,其中坐标和区域名称可由用户自主设定。
3. funnelR: 提供为比例数据创建漏斗图的功能,并支持用户定义的基准、置信范围和估计方法。
4. nVennR: 为Perez-Silva等人2018年提出的nVenn算法提供一个调用接口。
5. smovie: 使用rpanel包创建交互式动画,帮助学生理解统计概念。
说明:限于个人水平,错误在所难免,欢迎批评指正,多交流学习!
链接:https://rviews.rstudio.com/2018/04/30/march-2018-top-40-new-package-picks/