ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
122 stars 30 forks source link

R中循环处理多组间相关性分析 #4174

Closed ixxmu closed 11 months ago

ixxmu commented 11 months ago

https://mp.weixin.qq.com/s/kvjTt0D08KZ49WwE5hcgPw

ixxmu commented 11 months ago

R中循环处理多组间相关性分析 by R语言数据分析指南

欢迎关注R语言数据分析指南

本节来回答VIP会员群一个朋友的问题,内容主要围绕按分组拆分数据两两之间进行相关性分析后绘图,其难点主要在于数据清洗,小编使用tidyverse及循环来整理函数,整个过程仅参考。希望对各位观众老爷能有所帮助。「数据代码已经整合上传到2023VIP交流群」,加群的观众老爷可自行下载,有需要的朋友可关注文末介绍加入VIP交流群。

关于永久群内容的说明

给予长期支持我们的忠实读者们一个特别待遇:凡是购买过小编2022年或2023年VIP会员文档的朋友们,「将自动获得2024年及以后更新的绘图文档代码,无需额外付费。」目前这两年的会员文档已累记卖出1500+,质量方面各位无需担忧。简要概括就是只要购买任意1年的会员内容,2024及后期公众号所更新的绘图文档均会在已经加入的会员群内分享。

加载R包

library(tidyverse)
library(readxl)
library(psych)
library(reshape2)
library(magrittr)

导入数据

df1 <- read_excel("env.xlsx") %>% 
  mutate(group=ID) %>% 
  mutate(group = str_replace_all(group, "[0-9]""")) %>% 
  select(-ID) %>% 
  group_by(group) %>% 
  nest()

df2 <- read_excel("SOC.xlsx") %>% 
  mutate(group=ID) %>% 
  mutate(group = str_replace_all(group, "[0-9]""")) %>%
  select(-ID) %>% 
  group_by(group) %>% 
  nest()

循环整合数据

# 初始化一个空的数据框来存储结果
results_df <- data.frame(group = character(),
                         cor = numeric(),
                         pvalue = numeric(),
                         stringsAsFactors = FALSE)

# 循环处理每一对数据集
for (i in 1:5) {
  pp <- corr.test(df1$data[[i]], df2$data[[i]], method = "pearson", adjust = "fdr")
  results_df <- rbind(results_df, data.frame(
    group = paste0("cor", i),
    cor = pp$r,
    pvalue = pp$p,
    stringsAsFactors = FALSE
  ))
}

数据可视化

results_df %>% set_colnames(c("group","rvalue","pvalue")) %>% 
  rownames_to_column(var="env") %>% 
  mutate(env = str_replace_all(env, "[0-9]""")) %>%
  mutate(p_signif=symnum(pvalue, corr = FALSE, na = FALSE,  
                         cutpoints = c(0, 0.001, 0.01, 0.05, 0.1, 1), 
                         symbols = c("***""**""*"""" "))) %>% 
  
  ggplot(aes(group,env,fill=rvalue))+
  geom_tile()+
  geom_text(aes(label=p_signif),
            size=6,color="white",hjust=0.5,vjust=0.5)+
  labs(x=NULL,y=NULL)+
  scale_color_gradientn(colours = rev(RColorBrewer::brewer.pal(3,"RdBu")))+
  scale_fill_gradientn(colours = rev(RColorBrewer::brewer.pal(3,"RdBu")))+
  scale_y_discrete(expand=c(0,0))+
  scale_x_discrete(expand=c(0,0)) +
  theme(axis.text.x=element_text(angle =0,hjust =1,vjust =0.5,
                                 color="black",size = 8),
        axis.text.y=element_text(color="black",size =8),
        axis.ticks= element_blank(),
        panel.spacing.y = unit(0,"cm"),
        plot.background = element_blank(),
        panel.background = element_blank(),
        legend.title = element_blank())+
  scale_size(range=c(1,10),guide=NULL)+
  guides(fill=guide_colorbar(direction="vertical",reverse=F,barwidth=unit(.5,"cm"),
                             barheight=unit(8,"cm")))

本节介绍到此结束,有需要学习数据可视化的朋友,欢迎到小编的「淘宝店铺」 「R语言数据分析指南」下单购买,内容主要包括各种「高分论文的图表分析复现以及一些个性化图表的绘制」均包含数据+代码;

购买后微信发小编订单截图即邀请进新的会员交流群,无论购买那一年的会员文档都将获取「2024年及以后更新的绘图文档」,早买早享受,需要了解更多信息的朋友欢迎淘宝店铺交流咨询。

淘宝店铺(有需要欢迎关注)

关注下方公众号下回更新不迷路