Closed ixxmu closed 2 years ago
小编阅读到一篇发表在《Nature machine intelligence》的论文,名为“An interpretable mortality prediction model for COVID-19 patients” [1]。
论文作者共分析了485例新冠病人的临床数据,包括基本信息,症状的严重程度,血液样本和实验室检查,如肝功能,肾功能,凝血功能,电解质与炎症因子。
根据受试者的预后(生存/死亡)建立了一个准确度达90%的single-tree XGBoost的预测模型,见下图:
决策树,因它的简洁易懂并且同时具备不错的预测准确性而深受研究者喜欢。
我们今天的任务就是作出类似上图的决策树。
马上进入操作部分!
install.packages("treeheatr")
library(treeheatr)
summary(iris)
在下面的作图中,Species将作为因变量,其他变量作为预测变量(predictors)。
制作决策树:
heat_tree(iris, target_lab = "Species")
heat_tree()根据默认的参数筛选出两个最重要的变量(Petal.Width和Petal.Length)从而建立了这颗“树”。根据两个变量的数值大小进行Species的分类(classification)或诊断(diagnosis)。
heat_tree(iris, target_lab = "Species",
target_cols = c("red", "royalblue1", "palegreen3")) # 修改颜色
heat_tree(iris, target_lab = "Species",
show_all_feats = TRUE)
heat_tree(iris, target_lab = "Species",
panel_space = 0.03) # 调整组别间的距离
heat_tree(iris, target_lab = "Species",
show = "tree-only") # 只显示决策树
好啦,今天的内容就到这里。
如果有帮助,记得分享给需要的人!
1. An interpretable mortality prediction model for COVID-19 patients, nature machine intelligence.
2. treeheatr: an R package for interpretable decision tree visualizations, Bioinformatics.
https://mp.weixin.qq.com/s/QqXUBaSEU2W5D6WmsuGlng