cosname / cosx.org

统计之都主站
https://cosx.org
MIT License
266 stars 241 forks source link

统计月读(2021年6-7月) #948

Closed Ryanna-github closed 3 years ago

Ryanna-github commented 3 years ago

请回复 issue 进行文章推荐与招聘投稿,内容须与统计/数据科学相关,是否采纳取决于编辑部意见。

文章推荐包括学术论文、博客、书籍、教程或软件等的推荐,如果是英文文章在月报发布后自动作为翻译备选文章。

招聘主要面向学术界与工业界的招聘信息发布且岗位要与统计/数据科学相关。

文章推荐格式如下:

推荐语:(几句话就可以,可长可短,有态度不严肃)

推荐人:(建议用真名)

链接:(论文建议给doi,其余给链接)

招聘信息格式如下:

岗位介绍:(例如博士生、博后、xx公司软件工程师等)

工作地点:(具体到城市)

联系方式:(网站链接或邮箱)

Ryanna-github commented 3 years ago

推荐语:通常情况下,我们总相信大样本意味着准确,但在论文 More Data Can Hurt for Linear Regression: Sample-wise Double Descent 作者发现对于参数过量的回归模型,会得到有悖于常理的结果,链接的文章用 R 给出了论文实验的复现。

推荐人:任焱

链接:https://iyarlin.github.io/2021/05/23/sample_wise_double_descent_results_reproduction/

MelodyRen1998 commented 3 years ago

推荐语:[GooglyPlusPlus2021]() 是一个包含了丰富数据与图表类型的交互可视化 Shiny App,最新一版的更新包括了:

推荐人:任怡萌

链接:https://gigadom.in/2021/05/29/googlyplusplus2021-is-now-fully-interactive/

jueyun commented 3 years ago

推荐语:CRAN在2021年4月收录了179个R包,作者从计算方法、数据、基因组学、机器学习、数学、医学、网络、运筹学、统计学、时间序列、公用事业和可视化这12个类别中,选出了排名“前40“的R包,并对其中几个R包进行了简单的介绍。

推荐人:操懿

链接:https://rviews.rstudio.com/2021/05/25/april-2021-top-40-new-cran-packages/

rucwyf commented 3 years ago

推荐语:谢大大介绍了在R Markdown中如何使用knitr重复使用代码块和块选项,更多关于R Markdown的“骚操作”可阅读他的作品Rmarkdown-Cookbook

推荐人:王祎帆

链接:https://yihui.org/en/2021/05/knitr-reuse/

yufree commented 3 years ago

推荐语:这是一本R语言处理流行病学数据的电子书,大流行开始后很多人被动科普了流行病学模型,而这本书几乎覆盖了从基础入门、可视化、shiny、生存分析等所有相关主题,虽然流病领域主流还是用SAS。

推荐人:于淼

链接:https://epirhandbook.com

yufree commented 3 years ago

推荐语:R-Universe 可以用来构建自定义版的 CRAN,可用来发布软件与文档,这是一篇教程。

推荐人:于淼

链接:https://ropensci.org/blog/2021/06/22/setup-runiverse/

Ryanna-github commented 3 years ago

推荐语:R 中 ggplot2 包绘图可以满足大多数场景的需要,但是如果对细节有更多的要求还需要一些技巧,不妨跟着这篇文章看看最开始的简单柱状图是如何被改造的。

推荐人:任焱

链接:https://jcarroll.com.au/2021/07/02/improving-a-visualization/

yufree commented 3 years ago

推荐语:Introduction to Modern Statistics 的电子书,侧重基于仿真模拟的探索性数据分析,适合非统计但需要统计分析的专业的人阅读入门。

推荐人:于淼

链接:https://openintro-ims.netlify.app/index.html

MelodyRen1998 commented 3 years ago

推荐语:如何在一个字符串中插入新的字符串?作者提供了一种与 Python 中实现方法对应的 R 语言实现方法,通过自定义函数cat_v,实现字符串的新值插入功能。更多有用的、有趣的函数可以去 Useless_R_function repository 中挖掘。

推荐人:任怡萌

链接:https://tomaztsql.wordpress.com/2021/07/09/little-useless-useful-r-functions-inserting-variable-values-into-strings/

jueyun commented 3 years ago

推荐语:作者看到了一张用ppt绘制,描述流媒体市场份额的柱状图。他尝试用R复现了这张柱状图,并在原有图片的基础上进行了一定的改进,绘制了形式更丰富的图。

推荐人:操懿

链接:https://jcarroll.com.au/2021/07/02/improving-a-visualization/

YueeXiang commented 3 years ago

推荐语:如果你像我一样看到一个【可能】有用的github仓库就想fork下来,那你的github空间可能已经很拥挤了。多数fork下来的仓库积灰数年,真正需要的仓库却无法快速找到,却也不想逐一清理删除。而本文介绍的gh包则是批量删除仓库的利器,简单的一行命令,空间瞬间整洁。

推荐人:向悦

链接:https://www.jumpingrivers.com/blog/github-clean-remove-forks/

JinhuaSu commented 3 years ago

推荐语:当你需要认真写一个R包时,两个必读的文档是Advanced R和R package。但当你在遇到传参问题时会发现tidy dots这个概念,官网文档提供的list2、exec和do.call有时候可能并不能帮你让一个用户提供的函数(比如雅克比矩阵)很好的支持!!!args_list,这时候几个函数和包可能帮到你(1)mget (2) list2env (3)ellipsis包。链接是一篇介绍ellipsis的博客。

推荐人:苏锦华

链接:https://www.r-bloggers.com/2015/02/r-three-dots-ellipsis/

yufree commented 3 years ago

推荐语:科研作图从最早boxplot到可以展示分布的violin 图与ridgeline 图,现在又出了 raincloud 图,其背后的逻辑就是更多关注统计估计中的不确定性,ggdist 包是对这个问题一个不错的总结与可视化方案。

推荐人:于淼

链接:https://mjskay.github.io/ggdist/

LingrenKong commented 3 years ago

推荐语:Rstudio的网站里面有一个专门的Cheatsheets(速查表)总结页面,包含了Rstudio的以及其他用户贡献的速查表,这样就不用自己去搜集不同R包的速查表了。

推荐人:孔令仁

链接:https://www.rstudio.com/resources/cheatsheets/