cosname / cosx.org

统计之都主站
https://cosx.org
MIT License
262 stars 239 forks source link

统计月读(2023年8-9月) #1111

Closed Ryanna-github closed 9 months ago

Ryanna-github commented 11 months ago

请回复 issue 进行文章推荐与招聘投稿,内容须与统计/数据科学相关,是否采纳取决于编辑部意见。

文章推荐包括学术论文、博客、书籍、教程或软件等的推荐,如果是英文文章在月报发布后自动作为翻译备选文章。

招聘主要面向学术界与工业界的招聘信息发布且岗位要与统计/数据科学相关。

文章推荐格式如下:

推荐语:(几句话就可以,可长可短,有态度不严肃)

推荐人:(建议用真名)

链接:(论文建议给doi,其余给链接)

招聘信息格式如下:

岗位介绍:(例如博士生、博后、xx公司软件工程师等)

工作地点:(具体到城市)

联系方式:(网站链接或邮箱)

LingrenKong commented 11 months ago

推荐语:一份简短有趣的博客,结合R代码与画图,介绍了对数变换在涉及右偏分布的实际数据回归模型中的应用

推荐人:孔令仁

链接:http://freerangestats.info/blog/2023/07/30/log-transforms

XiangyunHuang commented 11 months ago

推荐语:plot2 包扩展 base R 的 plot() 函数功能,实现自动分组、添加图例。如果不是很熟悉 base R 绘图系统,推荐使用该 R 包,绘图会比较方便。

推荐人:黄湘云

链接: https://github.com/grantmcdermott/plot2

Ryanna-github commented 10 months ago

推荐语:有时候程序报一些莫名其妙的错可能是因为命名问题,比如设置 n 为样本量原本是很正常的想法,但是有可能和 dplyr 中的 n() 函数同名而导致错误。写代码时候应该注意类似的命名问题,文章里也提供了检查代码是否包含有这种不好的变量名的方法。

推荐人:任焱

链接:https://www.rostrum.blog/2023/08/19/find-bad-names/

zsh6sleepy commented 10 months ago

推荐语:推荐一篇麦肯锡的 “The economic potential of generative AI: The next productivity frontier”

推荐人:朱书慧

链接:https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-economic-potential-of-generative-ai-the-next-productivity-frontier

SungManhin commented 10 months ago

推荐语:在 R 中使用时间序列模型预测真实世界的欧元兑土耳其里拉的汇率变化,通过管道流轻松实现了对多种不同模型的比较。

推荐人:宋文轩

链接:https://datageeek.com/2023/08/23/time-series-forecasting-by-comparing-many-models-eur-try-rates/

Ryanna-github commented 10 months ago

推荐语:r 中用 dplyr 处理数据真的比 python 的 pandas 好用太多,但是当其他大多数操作都是使用 python 完成时语言来回切换总是很麻烦,一些数据中间处理过程可能会重复,python 中 Dplython 包可以很好解决这个问题,import 后可以用 R 的语法和处理逻辑对 pd.DataFrame 操作,舒服很多。

推荐人:任焱

链接:https://www.kaggle.com/code/dataraj/dplyr-in-python-r-style-coding-in-python

XiangyunHuang commented 10 months ago

推荐语:频率派中的岭回归和 Lasso 回归与贝叶斯派中指定特定先验分布后的回归模型之间存在等价性。作者基于glmnet 和 rstan 等 R 包,在一个真实数据集上做了探索、分析。

推荐人:黄湘云

链接: http://haines-lab.com/post/2019-05-06-on-the-equivalency-between-the-lasso-ridge-regression-and-specific-bayesian-priors/on-the-equivalency-between-the-lasso-ridge-regression-and-specific-bayesian-priors/

MelodyRen1998 commented 9 months ago

推荐语:谢大几天前发布了一篇新的博客,介绍了一个轻量级 HTML 幻灯片框架——Snap Slides。这个工具使用了 CSS Scroll Snap 技术,使得 HTML 页面中的系列元素(比如章节)在滚动时依次迅速向顶端”对齐“(类似手机上翻照片的效果),从而实现将连续的页面变成一系列的“幻灯片”。具体的技术细节参见 博客内容,R 里面 markdown 包中的 vignette 可以作为这个幻灯片框架的演示和文档:vignette('slides', package = 'markdown')

推荐人:任怡萌

链接:https://yihui.org/en/2023/09/snap-slides/

rucwyf commented 9 months ago

推荐语:一篇有关利用Stan分析全球UFO目击报告的文章,并提供了相应的R代码和可视化结果。Stan是基于MCMC算法拟合贝叶斯模型,相关数据可以在这里下载。

推荐人:王祎帆

链接:https://www.jumpingrivers.com/blog/ufo-counts-in-stan-bayesian-r/

TheHiddenObserver commented 9 months ago

推荐语:学过概率论的老师和同学们都知道,独立正态分布的和仍然是正态分布。但是有多少人思考过,如果两个独立的随机变量求和是正态的,那么这两个随机变量会有什么样的性质呢?Levy曾经做出猜想这两个随机变量也是正态分布,最终在1936年被Cramer完成证明。证明的过程中用到了一些整函数的性质,对相关理论感兴趣的可以欣赏一下这个证明。

推荐人:林子谦

链接:https://doi.org/10.1007/BF01180430 (原文为德语,英文版可参考William Feller的教材Probability Theory and Its Applications Vol2,链接为 https://www.wiley.com/en-gb/An+Introduction+to+Probability+Theory+and+Its+Applications%2C+Volume+2%2C+2nd+Edition-p-9780471257097