快讯 |2017年8月R新包推荐
2017年8月份,有180个新包在CRAN发布,略少于前几个月。本文节选了其中部分R新包,包含7个类别:数据、机器学习、综合类、科学、统计学、工具及可视化等。以下主要针对各个包的主要功能特性进行说明,希望有助于大家的学习。
一. 数据相关
1. edgarWebR v0.1.1: 提供访问和分析美国证券交易委员会的实时提交信息的方法,包括公司和基金文件以及相关的元数据.
2. forwards v0.1.0: 提供了由Forwards调查获取的匿名数据,目前提供了useR! 2016参会者的数据集,以下是关于参会者数据的展示:
3. GeoMongo v1.0.1: 提供了利用PyMongo库中的相关方法对GeoJson数据进行初始化、插入、访问等操作.
4. Rnightlights v0.1.2: 提供了接口,支持从美国国家海洋和气象管理局的免费数据库下载相关区域统计数据.
5. Knoema v0.1.7: 支持访问Knoema(互联网上最大的公共数据和统计数据集合之一),获取来自大量数据源的时间序列数据.
6. rwalkr v0.3.1: 支持以规范的数据格式,获取墨尔本行人数据.
7. vegetable v0.1.0: 提供从植被图数据库中导入和操作数据的功能,特别是在涡轮增增器中存储的数据.
二. 机器学习
1. partitionComparison v0.2.2: 为比较同一组对象的两个分区提供了一些度量(不同、距离/度量、相关、熵).
2. spm v1.0.0: 介绍了用于空间预测建模的地理统计和机器学习方法的混合方法.
三. 综合类
1. LearnGeom v1.0: 提供学习和教学基本平面几何的功能,目的是帮助有少量编程技能的年轻学生.
四. 科学
1. PGRdup v0.2.3.2: 提供部分功能,以帮助识别植物遗传资源收集中可能存在的或可能的重复.
2. snpReady v0.9.3: 提供清洁、总结和准备基因组数据集的功能,以基因组选择和基因组关联分析,并估计种群遗传参数.
五. 统计
1. blink v0.1.0: 实现了在Steorts中执行模型,该模型执行用于分类和文本数据的Bayesian实体解析,用于用户定义的任何距离函数.
2. cholera v0.2.1: 约翰·斯诺的1854年伦敦霍乱爆发的地图,初始数据来自Rusty Dodson和Waldo Tobler 1992年的《雪花地图数字化》,这些数据已经不可用,但是现在可以通过HistData包直接获取.
3. drtmle v1.0.0: 针对一致性和渐近正态范得拉的一致性和因果效应,提供了针对反事实的最低基于损失的估计.
4. esvis v0.1.0: 提供多种方法来估计和可视化影响大小的分配差异,重点是评估两个或多个分布之间的差异,而不是单个点.
5. fuser v1.0.0: 提供跨异构子组的高维惩罚回归函数,相关模型在 Dondelinger and Mukherjee中有详细描述.
6. gamlss.spatial v1.3.4: 为适应高斯马尔可夫随机场域的位置尺度和形状算法提供了合适的函数.
7. INLAutils v0.0.4: 提供了一些函数,支持利用隐含高斯马尔可夫随机场(GMRF)的新的统计推断方法来求解模型.
8. missRanger v1.0.0: 提供了由Stekhoven和Buehlmann引入的混合类型数据集的MissForest算法的实现.
9. naniar v0.1.0: 提供了部分数据结构和函数,便于进行缺失值可视化.
10. powdist v0.1.3: 提供密度、分布和分位数函数,以及由功率和反转功率分布随机抽取的函数.
11. skpr v0.35.1: 它是一个开源的实验套件设计,用于生成和评估R的最优设计.
六. 工具
1. blastula v0.1: 允许用户编写并发送HTML电子邮件消息,在一系列电子邮件客户端和设备大小中呈现。消息是使用Markdown和一个文本插值系统组成的,允许在消息主体内注入评估的R代码.
2. blogdown v0.1:支持使用Markdown书写博客和网页.
3. cetcolor v0.1.0: 提供了一本由Peter Kovesi所描述的视觉上一致的彩色地图.
4. googledrive v0.1.1: 请参阅google drive网站,了解如何开始打包的示例和说明.
5. pointblank v0.1: 提供系列函数验证和处理本地数据框文件,可以是tibble对象 、csv文件、MySQL表等.
6. reqres v0.2.0: 提供功能,以方便解析HTTP请求、创建适当的响应以及处理与HTTP交换工作相关的管理.
7. rmapzen v0.3.3: 提供Mapzen 接口,支持地理搜索和地理编码、等时计算和矢量数据绘制地图.
8. spelling v1.0: 针对常见的文档,提供文档格式拼写检查,包括latex文件、markdown等.
9. writexl v0.2: 提供了基于 libxlsxwriter的方便的,轻量级的数据框到xlsx的转换工具.
七. 可视化
1. billboarder v0.0.3: 提供了htmlwidgets
到 billboard.js的接口,基于D3 v4+ ,图形类型包括线型图、条形图、饼图等.
2. cdparcoord v1.0.0: 提供了针对大型数据集和缺失值的分辨率绘制并行坐标的函数.
3.gggenes v0.2.0: 提供了ggplot2 的几何对象和帮助函数,用于绘制基因箭头地图.
4.quickplot v0.1.1: 提供一个高级绘图系统,使用“网格”图形来构建,对速度和模块性进行了优化.
5. treemapify v2.3.2: 提供ggplot2 的几何对象,用于绘制树形图.
附注:本文由黄小伟翻译,如有错误之处,请见谅并告知,互相交流学习!