MGI-tech-bioinformatics / DNBelab_C_Series_HT_scRNA-analysis-software

An open source and flexible pipeline to analysis high-throughput DNBelab C Series single-cell RNA datasets
MIT License
52 stars 20 forks source link

华大单细胞分析工具输入数据问题 #48

Closed Zjianglin closed 6 months ago

Zjianglin commented 6 months ago

开发者您好, 我从文章和github上看到关于华大DNBelab C4单细胞测序数据分析有几种描述,主要是PISA+STAR[DNBelab_C_Series_HT_scRNA-analysis-software](https://github.com/MGI-tech-bioinformatics/DNBelab_C_Series_HT_scRNA-analysis-software),后者也就是dnb4ctools;还有一个[DNBelab_C_Series_scRNA-analysis-software](https://github.com/MGI-tech-bioinformatics/DNBelab_C_Series_scRNA-analysis-software). 这几个工具/流程的输入数据并不完全相同:

  1. 参照PISA教程(Vignette1 : Generate gene count matrix for scRNA),需要准备双端测序数据(sample.R1.fq.gzsample.R1.fq.gz)和参考基因组即可.
  2. 参照DNBelab_C_Series_HT_scRNA-analysis-software教程([quick start](https://github.com/MGI-tech-bioinformatics/DNBelab_C_Series_HT_scRNA-analysis-software/blob/version2.0/doc/quickstart.md)),除了参考基因组,需要四个测序数据,分别是cDNA_R1.fastq.gz, cDNA_R2.fastq.gz, oligo2_1.fq.gzoligo2_2.fq.gz.
  3. [DNBelab_C_Series_scRNA-analysis-software](https://github.com/MGI-tech-bioinformatics/DNBelab_C_Series_scRNA-analysis-software)此外这个工具也只需要双端测序数据即可.

请问一下为什么这几个流程的输入差别会比较大, 对于从数据库下载的公开数据(一般只有双端测序数据),是不是意味着只能使用PISA+STAR的流程,但是这个流程自己一步一步跑比较 繁琐,能否直接使用dnbc4tools工具,如果可以,请问应该如何运行呢?谢谢

lishuangshuang0616 commented 6 months ago

DNBelab_C_Series_scRNA-analysis-software教程中的分析数据基于低通量试剂盒,只存在一个文库cDNA文库,DNBelab_C_Series_HT_scRNA-analysis-software基于高通量试剂盒,存在两种文库,cDNA和oligo文库。PISA教程为处理cDNA数据。如果文章中只提供了单个文库数据,无法使用dnbc4tools来分析。

Zjianglin commented 6 months ago

谢谢回复.那针对文献提供的只有单个样本文库的双端测序数据,使用PISA+STARDNBelab_C_Series_scRNA-analysis-software教程流程理论上结果是否应该是一样的呢?

lishuangshuang0616 commented 6 months ago

是一样的,DNBelab_C_Series_scRNA-analysis-software软件很久未更新过,建议将STAR与PISA更新到文献说明的版本

Zjianglin commented 6 months ago

好的,那是否意味着对于DNBelab C4低通量试剂盒测序数据(仅有一个双端测序reads)的推荐使用PISA+STAR流程,而对于具有cDNA文库和oligo文库的高通量试剂盒测序数据(两对双端测序reads)的只能用dnbc4tools工具包进行预处理? 当前dnbc4tools确实简单方便,我只是问一下

lishuangshuang0616 commented 6 months ago

Yes, the high-throughput version has a cell barcode merging step, and there is no way to process oligo data simply using STAR+PISA.

Zjianglin commented 6 months ago

Thanks for your nice reply