ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
122 stars 30 forks source link

假如你不喜欢最新版的Seurat包的单细胞理念 #4093

Closed ixxmu closed 11 months ago

ixxmu commented 11 months ago

https://mp.weixin.qq.com/s/F03vWYgtS9JmQq4D4TyQWw

ixxmu commented 11 months ago

假如你不喜欢最新版的Seurat包的单细胞理念 by 生信技能树

毫无疑问,Seurat流程是目前单细胞转录组数据分析的主流,但是我们在过去的五年都熟悉了它的V4版本的代码架构,在R语言的cran官网可以看到其历史更新情况:

  • https://cran.r-project.org/src/contrib/Archive/Seurat/

最近三年都是V4的版本:

[   ] Seurat_4.0.0.tar.gz 2021-01-30 01:00 1.4M  
[   ] Seurat_4.0.1.tar.gz 2021-03-18 07:30 1.4M  
[   ] Seurat_4.0.2.tar.gz 2021-05-21 00:00 1.4M  
[   ] Seurat_4.0.3.tar.gz 2021-06-10 23:20 1.4M  
[   ] Seurat_4.0.4.tar.gz 2021-08-20 21:10 1.4M  
[   ] Seurat_4.0.5.tar.gz 2021-10-17 22:30 1.4M  
[   ] Seurat_4.0.6.tar.gz 2021-12-16 18:00 1.4M  
[   ] Seurat_4.1.0.tar.gz 2022-01-14 19:32 1.4M  
[   ] Seurat_4.1.1.tar.gz 2022-05-02 07:40 1.4M  
[   ] Seurat_4.2.0.tar.gz 2022-09-22 00:50 1.4M  
[   ] Seurat_4.2.1.tar.gz 2022-11-08 01:00 1.4M    
[   ] Seurat_4.3.0.tar.gz 2022-11-19 00:30 1.4M  
[   ] Seurat_4.4.0.tar.gz 2023-09-28 10:50 1.5M  

我们依赖于这个V4的版本的Seurat流程做出来了大量的公共数据集的单细胞转录组降维聚类分群流程,100多个公共单细胞数据集全部的处理,链接:https://pan.baidu.com/s/1MzfqW07P9ZqEA_URQ6rLbA?pwd=3heo

但是最近其官方版本成为了V5,链接是:https://cran.r-project.org/web/packages/Seurat/index.html

Version: 5.0.0
Depends: R (≥ 4.0.0), methods, SeuratObject (≥ 5.0.0)
Imports: cluster, cowplot, fastDummies, fitdistrplus, future,  
Published: 2023-11-04

Package source: Seurat_5.0.0.tar.gz
Windows binaries: r-devel: Seurat_5.0.0.zip, r-release: Seurat_5.0.0.zip, r-oldrel: Seurat_5.0.0.zip

同时还升级了 SeuratObject 也是V5了,这样的话如果新人开始学单细胞转录组技术分析流程,使用默认的安装代码,就默认安装了V5版本的SeuratObject 和Seurat,非常可怕!!!

  • Seurat的默认的安装代码是从CRAN安装:
# 1 directly download from CRAN
# mirror for cran: 
options(repos="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"

install.packages("Seurat", repos="https://mirrors.ustc.edu.cn/CRAN/")
install.packages("Seurat")
library(Seurat)

这个SeuratObject 是Seurat的底层,所以必须一起弄:

  • https://cran.r-project.org/web/packages/SeuratObject/index.html
  • https://cran.r-project.org/src/contrib/Archive/SeuratObject/

而且可以看到都是V4版本,都是它的旧版本

[   ] SeuratObject_4.0.0.tar.gz 2021-01-15 09:50 146K  
[   ] SeuratObject_4.0.1.tar.gz 2021-05-08 06:50 145K  
[   ] SeuratObject_4.0.2.tar.gz 2021-06-09 11:20 145K  
[   ] SeuratObject_4.0.3.tar.gz 2021-11-10 23:20 148K  
[   ] SeuratObject_4.0.4.tar.gz 2021-11-23 21:00 149K  
[   ] SeuratObject_4.1.0.tar.gz 2022-05-01 16:40 184K  
[   ] SeuratObject_4.1.1.tar.gz 2022-08-29 21:50 190K  
[   ] SeuratObject_4.1.2.tar.gz 2022-09-20 18:30 190K  
[   ] SeuratObject_4.1.3.tar.gz 2022-11-07 19:50 185K  
[   ] SeuratObject_4.1.4.tar.gz 2023-09-27 00:30 186K  

首先卸载你默认安装的V5版本的SeuratObject 和Seurat

记住:卸载之前一定要重启你的r语言或者rstudio,或者保证你的当前环境下没有加载SeuratObject 和Seurat。

然后就可以简单的使用代码去卸载你默认安装的V5版本的SeuratObject 和Seurat:

remove.packages(“SeuratObject”)
remove.packages(“Seurat”)

如果你有rstudio软件,也可以在界面自己操作鼠标去卸载两个包。

然后安装旧版本的SeuratObject 和Seurat

  • 安装旧版本的SeuratObject 和Seurat需要首先拿到网页链接地址,然后从网页安装
# 4 download from URL

packageurl <- "https://cran.r-project.org/src/contrib/Archive/SeuratObject/SeuratObject_4.1.4.tar.gz" 
install.packages(packageurl, repos=NULL, type="source")

packageurl <- "https://cran.r-project.org/src/contrib/Archive/Seurat/Seurat_4.4.0.tar.gz" 
install.packages(packageurl, repos=NULL, type="source")

上面的代码一定要记住顺序哦,而且, 如果他们安装的过程中有依赖包的缺失,就需要自己主动先安装那些缺失的包哈!

目前没有看到一定要用最新版Seurat的理由

本来呢以为这个  pseudobulking (AggregateExpression())  是最新版才有的,详见:https://satijalab.org/seurat/articles/de_vignette

实际上,我之前也分享了:单细胞层面的表达量差异分析到底如何做,提到了pseudobulks方法,而且给出来了多种代码实现方式,详见:单细胞差异分析之pseudobulk的3种实现方法

如果你确实感兴趣,也欢迎读一下官方文档:https://satijalab.org/seurat/articles/essential_commands

我们就不代劳了,要不然到时候大家又批评我们是github文档翻译器。。。。

  • Standard Seurat workflow
  • Seurat Object Data Access
    • Cell, feature, and layer names
    • Identity class labels
    • Cell metadata
    • Expression data (stored as layers in Seurat v5)
    • Dimensional reductions
    • FetchData
  • Subsetting and merging
    • Subset Seurat objects
    • Split layers
    • Split objects
    • Merge objects (without integration)
    • Merge objects (with integration)
  • Pseudobulk analysis
  • Visualization in Seurat
  • Multi-Assay Features
  • Additional resources

文末友情宣传

强烈建议你推荐给身边的博士后以及年轻生物学PI,多一点数据认知,让他们的科研上一个台阶: