cosname / cosx.org

统计之都主站
https://cosx.org
MIT License
262 stars 239 forks source link

统计月读(11月) #1078

Closed Ryanna-github closed 1 year ago

Ryanna-github commented 1 year ago

请回复 issue 进行文章推荐与招聘投稿,内容须与统计/数据科学相关,是否采纳取决于编辑部意见。

文章推荐包括学术论文、博客、书籍、教程或软件等的推荐,如果是英文文章在月报发布后自动作为翻译备选文章。

招聘主要面向学术界与工业界的招聘信息发布且岗位要与统计/数据科学相关。

文章推荐格式如下:

推荐语:(几句话就可以,可长可短,有态度不严肃)

推荐人:(建议用真名)

链接:(论文建议给doi,其余给链接)

招聘信息格式如下:

岗位介绍:(例如博士生、博后、xx公司软件工程师等)

工作地点:(具体到城市)

联系方式:(网站链接或邮箱)

LingrenKong commented 1 year ago

推荐语:shiny 现在有 Python 版本了,这是一篇 Python 中使用 shiny 的教程

推荐人:孔令仁

链接:https://appsilon.com/shiny-for-python-introduction/

Ryanna-github commented 1 year ago

推荐语:和机器人聊聊天活就干了。

推荐人:任焱

链接:https://github.com/isinaltinkaya/gptchatteR

XiangyunHuang commented 1 year ago

推荐语:介绍条形图和箱线图的种种替代,在描述数据分布方面,数据量少时可以考虑展示原始数据,在数据量多时,可以考虑岭线图、提琴图等,ggdist 包提供许多一步到位的函数实现。Cédric Scherer 的这篇文章质量非常高,值得一读,还有配套的幻灯片和讲解视频。

推荐人:黄湘云

链接: https://z3tt.github.io/beyond-bar-and-box-plots/

SungManhin commented 1 year ago

推荐语:lterpalettefinder 包提供从给定图片中提取颜色的功能,可用于构造与已有的颜色风格相统一的统计图形。

推荐人:宋文轩

链接:https://cran.r-project.org/web/packages/lterpalettefinder/index.html

LingrenKong commented 1 year ago

推荐语:一篇很有深度的短文,讲解了Python中NotImplementedNotImpementedError使用的场景和区别。

推荐人:孔令仁

链接:https://s16h.medium.com/pythons-notimplemented-type-2d720137bf41

zsh6sleepy commented 1 year ago

推荐语:这篇经典文献是合成控制方法的开山之作。为研究巴斯克地区的恐怖活动对经济的影响,Abadie and Gardeazabal (2003)提出通过选取适当的权重,对其他地区进行线性组合,来合成一个在各经济特征上与巴斯克地区更为相似的“合成控制地区”作为对照,从而对恐怖活动对巴斯克经济的影响进行统计推断。结果表明,在20世纪60年代末恐怖主义爆发后,巴斯克的人均GDP相对于没有恐怖主义的合成控制地区下降了约10个百分点。 推荐人:朱书慧 文章信息:Abadie, A. and Gardeazabal, J. 2003. Economic Costs of Conflict: A Case Study of the Basque Country. American Economic Review 链接:https://xueshu.baidu.com/usercenter/paper/show?paperid=b9b8a6f807b94ecb62740fef1f4ff6c7&site=xueshu_se&hitarticle=1&sc_from=pku doi:10.2139/ssrn.293120

rucwyf commented 1 year ago

推荐语:最近 ChatGPT 大火,再介绍一个相关的内容。可以用 ChatGPT 在 R 中创造并分析数据集,并且帮我们修正 bug,感觉利用 ChatGPT 来做大作业的未来越来越近了。

推荐人:王祎帆

链接:https://blog.ephorie.de/chatgpt-can-create-datasets-program-in-r-and-when-it-makes-an-error-it-can-fix-that-too

LingrenKong commented 1 year ago

推荐语:一些统计概念的交互可视化,对于理解基础概念可能有很好的帮助。

推荐人:孔令仁

链接:https://rpsychologist.com/viz

liangjiehao commented 1 year ago

推荐语:关于“稳定分布”的定义和一些有趣应用:1)根据正态分布为2范数稳定分布,从直观上理解中心极限定理。2)根据不同范数下的稳定分布,通过采样Sketching Matrix实现降维,从而快速近似估计超高维向量的范数,可用于设计局部灵敏哈希算法(Locality Sensitive Hashing)

推荐人:梁杰昊

链接:

MelodyRen1998 commented 1 year ago

推荐语:这篇博客介绍了在时间序列预测任务中纳入预测区间的一个想法,可以更好地刻画时序预测中的不确定性,并且这个目标使用 scikit-learn 库就可以完成。

推荐人:任怡萌

链接:https://towardsdatascience.com/time-series-forecasting-with-conformal-prediction-intervals-scikit-learn-is-all-you-need-4b68143a027a

YueeXiang commented 1 year ago

推荐语:偏差和方差的权衡是机器学习的核心问题,这篇博客提供了理解偏差-方差权衡的贝叶斯视角。

推荐人:向悦

链接:https://towardsdatascience.com/understanding-bias-variance-trade-off-from-a-bayesian-perspective-6c31645fcaa9

SungManhin commented 1 year ago

推荐语:#30DayMapChallenge 一位数据科学家参与的 30 天地图绘制挑战:每天以一个特定主题绘制地图,其中绝大部分精美的地图都是由 R 绘制而成,展现了 R 可视化的魅力。我个人最喜欢的一张图来自 Day 24 (Fantasy) 。

推荐人:宋文轩

链接:https://github.com/nrennie/30DayMapChallenge/tree/main/2022

JinhuaSu commented 1 year ago

推荐语:开源3D打印机VORON2.4的采购清单,照着链接在淘宝,1688上买,可以在2500以内搞定250mm长宽高的可打印ABS材料的FDM打印机。 image

推荐人:苏锦华

链接:https://docs.qq.com/sheet/DYnVpeVNUTHFTaHdw?tab=BB08J2

JinhuaSu commented 1 year ago

推荐语:Krock dawn补丁可以在linux系统上让你绕开检查系统,用wine玩原神。已经用显卡服务器成功部署基于WebRTC的云电脑,用VR头显玩linux版原神。

推荐人:苏锦华

链接:For your own sake: Please do not share this project in public.

yufree commented 1 year ago

推荐语: flowingdata 2022年评选的最佳可视化项目,比较有意思的是《华盛顿邮报》做的选区高尔夫球游戏(马里兰第三选区简直是噩梦)、电厂难题选择投票还有北极的碳排放。

推荐人:于淼

链接:https://flowingdata.com/2022/12/29/best-of-2022/

zhaohaojiao commented 1 year ago

推荐语:借着世界杯的浪潮,考古发现了一篇有一丝丝好玩的论文,用网络分析对瓜瓜(瓜迪奥拉)梦三巴萨tiki taka战术的做了一些探索,分析了球员之间交互的复杂网络的一些特征,肯定了瓜瓜战术(梦三巴萨)的独特性[狗头]。

推荐人:赵昊蛟

链接:https://doi.org/10.1038/s41598-019-49969-2