cosname / cosx.org

统计之都主站
https://cosx.org
MIT License
262 stars 239 forks source link

统计月读(2023年12月) #1120

Open Ryanna-github opened 8 months ago

Ryanna-github commented 8 months ago

请回复 issue 进行文章推荐与招聘投稿,内容须与统计/数据科学相关,是否采纳取决于编辑部意见。

文章推荐包括学术论文、博客、书籍、教程或软件等的推荐,如果是英文文章在月报发布后自动作为翻译备选文章。

招聘主要面向学术界与工业界的招聘信息发布且岗位要与统计/数据科学相关。

文章推荐格式如下:

推荐语:(几句话就可以,可长可短,有态度不严肃)

推荐人:(建议用真名)

链接:(论文建议给doi,其余给链接)

招聘信息格式如下:

岗位介绍:(例如博士生、博后、xx公司软件工程师等)

工作地点:(具体到城市)

联系方式:(网站链接或邮箱)

Ryanna-github commented 7 months ago

推荐语:想做甘特图,在线网页看上去效果很好很完善但是真的用起来结果一团糟,发现 mermaid.js 很适合用代码形式绘制流程图甘特图等图表,在 R 中使用 DiagrammeR 包即可直接调用。

推荐人:任焱

链接:https://www.rdocumentation.org/packages/DiagrammeR/versions/1.0.10/topics/mermaid

plumberDong commented 7 months ago

推荐语:当样本缺乏代表性时,基于已知人口学特征进行事后分层(post-stratification)加权是常用技巧。但如果具体层次的样本量很少,该层点估计会面临较大误差。对此,可以利用多层模型的shrinkage特性,获得每层更稳健的点估计,然后再加权汇总。

推荐人:董书昊

链接(两篇文章):

  1. https://www.monicaalexander.com/posts/2019-08-07-mrp/
  2. https://marginaleffects.com/vignettes/mrp.html
LingrenKong commented 7 months ago

推荐语:R语言书籍的推荐,附有介绍和免费获取电子版的链接

推荐人:孔令仁

链接:https://oscarbaruffa.com/the-10-most-popular-r-books-of-2023/

zsh6sleepy commented 7 months ago

推荐语:推荐R包MIDAS,可用于混频数据回归

推荐人:朱书慧

链接:Ghysels, E., Kvedaras, V., & Zemlys, V. (2016). Mixed Frequency Data Sampling Regression Models: The R Package midasr. Journal of Statistical Software, 72(4), 1–35. https://doi.org/10.18637/jss.v072.i04

SungManhin commented 7 months ago

推荐语:gspcr 用于广义线性模型的有监督 PCA,可以支持连续型、离散型和二分类型的结局变量。想做使用有监督 PCA 的逻辑回归时发现的,是最近才上传的一个包。

推荐人:宋文轩

链接:https://cran.r-project.org/web/packages/gspcr/index.html

Ryanna-github commented 7 months ago

推荐语:LLM 如何切实帮助 R coder,chattr 只是在 R 内部提供了 ChatGPT 接口,gptstudio 更像一个内置工具。文章还从改善 http 请求效率(使用 SSEparser 包)的角度对上述 API 做了改进,值得一读。

推荐人:任焱

链接:https://samuelenrique.com/posts/2023-12-14-launching-sseparser/

Ryanna-github commented 7 months ago

推荐语:看不懂别人的代码一定要用用这个小工具,可以解释多种代码,会从代码结构,可能出现的bug,修改建议等等进行分析。

推荐人:任焱

链接:https://codepal.ai/code-explainer/r

kzymiao commented 7 months ago

推荐语:因果推断与机器学习结合方法的python包,里面包含的方法很多,比如DML、DRL、正交随机树等,讲解也很细致,很实用~

推荐人:孔子怡

链接:https://econml.azurewebsites.net/spec/estimation/dml.html#what-is-it

rucwyf commented 7 months ago

推荐语:一个经典结论的再现。由于上学通常会卡年龄(比如加拿大会卡在当年1月1日),在低年级时,体育队里往往大部分人会是同一年级中更早出生的那批人(发育了更长的时间)。例如在加拿大,体育队中年初出生的人较多,但也可能是因为更多的人本身就出生在年初。作者拿加拿大人口数据和NHL中加拿大球员的出生数据进行了研究,即对比两个分布是否相同。发现相比正常出生情况,NHL中的确有更多的加拿大人在年初出生。

推荐人:王祎帆

链接:https://jlaw.netlify.app/2023/12/04/are-birth-dates-still-destiny-for-canadian-nhl-players/