Closed L1angyan closed 2 years ago
你好,
分情况,如果是UMI文库,计算gene expression实际上是就是算umi的diversity,因此此时是否dedup并没有差异。对于没有umi的文库,是根据reads数来统计基因表达量(如smartseq2),此时是建议去重复的。
除了计算gene expression,单细胞文库也可以用来call变异等应用,此时rmdup这个工具去除PCR重复就是有用的。因此PISA rmdup并不是针对特定的某个文库,只是根据应用来判断是否要需要去除PCR重复。
太棒了,解释得非常清楚,谢谢^_^
您好,我在用PISA分析DNBelab C4平台的单细胞RNAseq数据。 我看manual中,
Quickly start
部分后面还有对细胞和分子进行去重复的操作,请问这是必需的吗?理论上PCR重复应该有相同的UMI,它们应该早在PISA corr
这一步就被去除了。# Deduplicate BAM file for each cell
$ PISA rmdup -tags CB corr.bam -o rmdup.bam -nw
# Deduplicate BAM file for each molecular
$ PISA rmdup -tags CB,UR corr.bam -o rmdup1.bam -nw
难道rmdup
是为一些reads上没有UMI的单细胞平台设计的吗? 希望得到您的解答。^_^