ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
100 stars 28 forks source link

精选| 2021年6月R新包推荐(第55期) #1133

Closed ixxmu closed 3 years ago

ixxmu commented 3 years ago

https://mp.weixin.qq.com/s/FAIxzpyiVTfMj0LxSAE_Pg

github-actions[bot] commented 3 years ago

精选| 2021年6月R新包推荐(第55期) by 生信宝典

翻译:黄小伟,资深大数据分析从业者。目前就职杭州有赞数据分析团队!

知乎专栏:中国R语言社区、R语言中文社区 |26,000+关注、150万+阅读
知乎圈子:数据分析圈|11,000+加入
岗位招聘:急招|高级数据分析师、数据分析专家

2021年6月,197个R新包收录于CRAN(2021年5月份收录205个),累计收录约19,285个R包!此次选摘了40个R包(10个类别),分布结构如下:

一. 计算方法

1. disordR: 提供用于操作以任意顺序存储的关联映射值的工具.
2. ICvectorfields: 提供使用数字图像相关技术将光栅格式的空间、密度数据时间序列转换为人口流动矢量场的功能.

3. rim: 提供计算机代数系统 Maxima 的接口,其中包括从 R 中运行 Maxima 命令、在 LaTeX 和 MathML 以及 R Markdown 中生成输出.

二. 数据

1. PlanetNICFI: 提供使用 Planet Mosaics API 下载、处理来自挪威国际气候和森林倡议的 Planet NICFI 卫星图像的功能.

2. rgovcan: 支持对加拿大开放政府门户网站提供的数据和其他资源的访问.
3. wcde: 提供维特根斯坦人力资本数据浏览器的接口.


三. 金融

1. etrm: 提供在能源交易和风险管理中执行核心任务的功能,包括计算具有流量的电力和天然气合同的最大平滑度远期价格曲线,如 Benth 等人所述 (2007) 和 Black (1976) 中描述的远期市场价格风险管理的投资组合保险交易策略.
2. mshap: 根据 Matthews & Hartman (2021) 提出的使用 Lundberg 等人中描述的 TreeSHAP 算法的建议,提供在two-part模型上计算 mSHAP 值的函数.

四. 基因组学

1. harmony: 实现 Korsunsky 等人描述的用于单细胞整合的The Harmony Algorithm (2019).


五. 机器学习

1. AutoScore: 实施可解释的机器学习框架,以自动开发预定义结果的临床评分模型.
2. daiR: 为 Google Cloud Services Document AI API 实现一个接口,并带有用于输出文件解析和文本重建的附加工具.

3. luz: 实现 Torch 的高级接口,提供实用程序以减少常见任务所需的代码量,抽象出 Torch 细节并使相同的代码在 CPU 和 GPU 上工作.
4. mcboost: 实现多校准提升和多精度提升,以对机器学习模型的预测进行多校准.
5. RFpredInterval: 使用随机森林和提升森林实现各种预测区间方法.

六. 医药领域

1. aldvmm: 适用于健康状态效用调整有限因变量混合模型,即正态分布的有限混合.

2. clinDataReview: 提供创建交互式表格、列表和图表以及相关报告的功能,以便在临床试验环境中进行探索性分析.

3. clinUtils: 提供实用功能以辅助导入、探索和报告临床数据以及 SDTM 和 ADaM 格式的数据集.
4. inTextSummaryTable: 提供为 TLF 的临床数据创建汇总统计表或计数表的功能。这些表格可以导出为 MS Word 格式的临床研究报告的文本表格或演示文稿的 MS PowerPoint 格式,或作为交互式表格.

5. patientProfilesVis: 提供创建患者特定配置文件可视化的功能,用于临床试验期间的探索、诊断或监测目的,可显示实验室测量值、ECG 数据、生命体征、不良事件等参数的演变.

6. RHRT: 提供扫描早发性心室复合体的 RR 间期数据并参数化和绘制由此产生的心率湍流的方法.

7. visR: 提供基于图形原理生成具有合理默认值的临床图形和表格的功能,如 Vandemeulebroecke 等人所述(2018 年),Vandemeulebroecke 等人 (2019) 和莫里斯等人 (2019).


七. 统计领域

1. admix: 实现了几种方法来估计与双组分混合模型相关的未知量,其中两个组分可以属于任何分布.
2. ahMLE: 实现了拟合Additive Hazards Model的方法,包括最大似然法和 Aalen 估计Additive Hazards Model的方法.
3. bayesrules: 提供用于在线贝叶斯规则手册中的分析和可视化的数据集和函数.

4. dbglm: 支持在中等规模的数据集上拟合广义线性模型,方法:获取初始样本并在内存中拟合,然后评估数据库中完整数据的得分函数.
5. fasano.franceschini.test: 实施 Fasano & Franceschini (1987) 中定义的二维 Kolmogorov-Smirnov (KS) two-sample检验.

6. flatness: 提供 S3 类、绘图函数、指数和测试来分析直方图的平坦度,包括 Jolliffe & Primo (2008) 中引入的平坦度测试函数、Wilks (2019) 中描述的平坦度指数,及 Benjamini 和 Hochberg 中描述的多重假设过程 (1995).
7. outlierensembles: 提供用于检测异常值和异常的集成函数,包括基于 Kandanaarachchi (2021) 中描述的项目响应理论的新方法和 Schubert 等人描述的方法(2012),蒋等人(2017 年)以及 Aggarwal 和 Sathe(2015 年).

8. susieR: 如 Wang 等人 (2020) 所述,基于单效应总和模型实现线性回归中的变量选择方法。迭代贝叶斯逐步选择算法允许将模型拟合到具有数千个样本和数十万个变量的大型数据集.

八. 时间序列

1. psdr: 提供在给定时间序列数据的情况下,生成、比较功率谱密度图及比较多组时间序列主要频率的函数.

2. proteus: 基于不同分布,实现了一种用于时间特征分析的序列间变分模型.


九. 应用工具

1. archive: 实现与 libarchive 的绑定,这是一个多格式存档和压缩库,它为许多存档格式提供连接和直接提取,包括 tar、ZIP、7-zip、RAR、CAB 和压缩格式,包括 gzip、bzip2、compress、lzma 和 xz.
2. pasadr: 实现了 Aoudi 等人 (2018)中描述的异常检测方法.
3. recogito: 提供与 recogito 和 annotorious 库的 htmlwidgets 绑定,以注释图像中感兴趣的文本和区域.
4. rextendr: 提供从 R 编译和加载 Rust 代码的函数以及帮助函数来创建使用 Rust 代码的 R 包.
5. shinymeta: 提供用于捕获Shiny应用程序中的逻辑并将其公开为可在Shiny外部运行的代码(例如,从R控制台)的工具。还提供了将代码和结果捆绑到最终用户的工具.


十. 可视化

1. dynplot: 提供将单个细胞轨迹可视化为图形或树状图的函数.

2. gridpattern: 提供网格抓取以使用各种图案填充用户定义的绘图区域,包括基于几何和图像的图案,并支持自定义用户定义的图案.

3. netplot: 实现了一个图形可视化引擎,该引擎强调美感,同时提供默认参数,产生开箱即用的可视化效果.

4. NGLVieweR: 实现 NGL.js 的 htmlwidgets 接口,使用户能够在 R 和 Shiny 应用程序中可视化蛋白质数据库 PDBand 结构文件并与之交互.

5. precisePlacement: 提供一系列工具,可以更轻松地将元素放置在 R 图中您想要的位置.

说明:限于个人水平,错误之处难免,烦请批评指正,共同交流~
https://rviews.rstudio.com/2021/07/26/june-2021-top-40-new-cran-packages/


往期精品(点击图片直达文字对应教程)

机器学习

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集