dieterich-lab / DCC

DCC uses output from the STAR read mapper to systematically detect back-splice junctions in next-generation sequencing data. DCC applies a series of filters and integrates data across replicate sets to arrive at a precise list of circRNA candidates.
https://dieterichlab.org/software/
GNU General Public License v3.0
36 stars 20 forks source link

Do you have SJ.out.tab files in your sample folder #60

Closed prince26121991 closed 5 years ago

prince26121991 commented 5 years ago

When I am running Circtools with detect module everything goes smoothly but suddenly it stops everytime with same error Do you have SJ.out.tab files in your sample folder? DCC cannot find it. This the folder structure from where I am running it: . ├── bam_files ├── CircCoordinates ├── CircRNACount ├── CircSkipJunctions ├── DCC-2019-01-02_2251.log ├── Homo_sapiens.GRCh38.94.gtf ├── Homo_sapiens.GRCh38.dna.fa ├── Homo_sapiens.GRCh38.dna.fa.fai ├── LinearCount ├── mate1 ├── mate2 ├── repeats_track.gtf ├── samplesheet └── _tmp_DCC ├── ci1Chimeric.out.junction.ZKZ00K ├── ci1Chimeric.out.junction.ZKZ00K.circRNA ├── ci1Chimeric.out.junction.ZKZ00K.circRNAmapped ├── ci3Chimeric.out.junction.ABH7GN ├── ci3Chimeric.out.junction.ABH7GN.circRNA ├── ci3Chimeric.out.junction.ABH7GN.circRNAmapped ├── ci4Chimeric.out.junction.HA3TF3 ├── ci4Chimeric.out.junction.HA3TF3.circRNA ├── ci4Chimeric.out.junction.HA3TF3.circRNAmapped ├── co1Chimeric.out.junction.UPUYBH ├── co1Chimeric.out.junction.UPUYBH.circRNA ├── co1Chimeric.out.junction.UPUYBH.circRNAmapped ├── co3Chimeric.out.junction.F3T4F6 ├── co3Chimeric.out.junction.F3T4F6.circRNA ├── co3Chimeric.out.junction.F3T4F6.circRNAmapped ├── co4Chimeric.out.junction.QIBMPA ├── co4Chimeric.out.junction.QIBMPA.circRNA └── co4Chimeric.out.junction.QIBMPA.circRNAmapped

bam_files contains following lines /home/scbb/cdri_data/aaaaaa/star/ci1/ci1Aligned.noS.bam /home/scbb/cdri_data/aaaaaa/star/ci3/ci3Aligned.noS.bam /home/scbb/cdri_data/aaaaaa/star/ci4/ci4Aligned.noS.bam /home/scbb/cdri_data/aaaaaa/star/co1/co1Aligned.noS.bam /home/scbb/cdri_data/aaaaaa/star/co3/co3Aligned.noS.bam /home/scbb/cdri_data/aaaaaa/star/co4/co4Aligned.noS.bam

this is the structure of star directory

. ├── ci1 │   ├── Chimeric.noS.bam │   ├── Chimeric.noS.bam.bai │   ├── ci1Aligned.noS.bam │   ├── ci1Aligned.noS.bam.bai │   ├── ci1Chimeric.out.junction │   ├── header.txt │   ├── Log.final.out │   ├── Log.out │   ├── Log.progress.out │   ├── mate1 │   │   ├── Aligned.noS.bam │   │   ├── Aligned.noS.bam.bai │   │   ├── Chimeric.noS.bam │   │   ├── Chimeric.noS.bam.bai │   │   ├── ci1_1_Chimeric.out.junction │   │   ├── header.txt │   │   ├── Log.final.out │   │   ├── Log.out │   │   ├── Log.progress.out │   │   ├── ReadsPerGene.out.tab │   │   ├── SJ.out.tab │   │   └── Unmapped.out.mate1 │   ├── mate2 │   │   ├── Aligned.noS.bam │   │   ├── Aligned.noS.bam.bai │   │   ├── Chimeric.noS.bam │   │   ├── Chimeric.noS.bam.bai │   │   ├── ci1_2_Chimeric.out.junction │   │   ├── ci1_2_Chimeric.out.junction.fixed │   │   ├── header.txt │   │   ├── Log.final.out │   │   ├── Log.out │   │   ├── Log.progress.out │   │   ├── ReadsPerGene.out.tab │   │   ├── SJ.out.tab │   │   └── Unmapped.out.mate1 │   ├── ReadsPerGene.out.tab │   ├── SJ.out.tab │   ├── Unmapped.out.mate1.gz │   └── Unmapped.out.mate2.gz ├── ci3 │   ├── Chimeric.noS.bam │   ├── Chimeric.noS.bam.bai │   ├── ci3Aligned.noS.bam │   ├── ci3Aligned.noS.bam.bai │   ├── ci3Chimeric.out.junction │   ├── header.txt │   ├── Log.final.out │   ├── Log.out │   ├── Log.progress.out │   ├── mate1 │   │   ├── Aligned.noS.bam │   │   ├── Aligned.noS.bam.bai │   │   ├── Chimeric.noS.bam │   │   ├── Chimeric.noS.bam.bai │   │   ├── ci3_1_Chimeric.out.junction │   │   ├── header.txt │   │   ├── Log.final.out │   │   ├── Log.out │   │   ├── Log.progress.out │   │   ├── ReadsPerGene.out.tab │   │   ├── SJ.out.tab │   │   └── Unmapped.out.mate1 │   ├── mate2 │   │   ├── Aligned.noS.bam │   │   ├── Aligned.noS.bam.bai │   │   ├── Chimeric.noS.bam │   │   ├── Chimeric.noS.bam.bai │   │   ├── ci3_2_Chimeric.out.junction │   │   ├── ci3_2_Chimeric.out.junction.fixed │   │   ├── header.txt │   │   ├── Log.final.out │   │   ├── Log.out │   │   ├── Log.progress.out │   │   ├── ReadsPerGene.out.tab │   │   ├── SJ.out.tab │   │   └── Unmapped.out.mate1 │   ├── ReadsPerGene.out.tab │   ├── SJ.out.tab │   ├── Unmapped.out.mate1.gz │   └── Unmapped.out.mate2.gz ├── ci4 │   ├── Chimeric.noS.bam │   ├── Chimeric.noS.bam.bai │   ├── ci4Aligned.noS.bam │   ├── ci4Aligned.noS.bam.bai │   ├── ci4Chimeric.out.junction │   ├── header.txt │   ├── Log.final.out │   ├── Log.out │   ├── Log.progress.out │   ├── mate1 │   │   ├── Aligned.noS.bam │   │   ├── Aligned.noS.bam.bai │   │   ├── Chimeric.noS.bam │   │   ├── Chimeric.noS.bam.bai │   │   ├── ci4_1_Chimeric.out.junction │   │   ├── header.txt │   │   ├── Log.final.out │   │   ├── Log.out │   │   ├── Log.progress.out │   │   ├── ReadsPerGene.out.tab │   │   ├── SJ.out.tab │   │   └── Unmapped.out.mate1 │   ├── mate2 │   │   ├── Aligned.noS.bam │   │   ├── Aligned.noS.bam.bai │   │   ├── Chimeric.noS.bam │   │   ├── Chimeric.noS.bam.bai │   │   ├── ci4_2_Chimeric.out.junction │   │   ├── ci4_2_Chimeric.out.junction.fixed │   │   ├── header.txt │   │   ├── Log.final.out │   │   ├── Log.out │   │   ├── Log.progress.out │   │   ├── ReadsPerGene.out.tab │   │   ├── SJ.out.tab │   │   └── Unmapped.out.mate1 │   ├── ReadsPerGene.out.tab │   ├── SJ.out.tab │   ├── Unmapped.out.mate1.gz │   └── Unmapped.out.mate2.gz ├── co1 │   ├── Chimeric.noS.bam │   ├── Chimeric.noS.bam.bai │   ├── co1Aligned.noS.bam │   ├── co1Aligned.noS.bam.bai │   ├── co1Chimeric.out.junction │   ├── header.txt │   ├── Log.final.out │   ├── Log.out │   ├── Log.progress.out │   ├── mate1 │   │   ├── Aligned.noS.bam │   │   ├── Aligned.noS.bam.bai │   │   ├── Chimeric.noS.bam │   │   ├── Chimeric.noS.bam.bai │   │   ├── co1_1_Chimeric.out.junction │   │   ├── header.txt │   │   ├── Log.final.out │   │   ├── Log.out │   │   ├── Log.progress.out │   │   ├── ReadsPerGene.out.tab │   │   ├── SJ.out.tab │   │   └── Unmapped.out.mate1 │   ├── mate2 │   │   ├── Aligned.noS.bam │   │   ├── Aligned.noS.bam.bai │   │   ├── Chimeric.noS.bam │   │   ├── Chimeric.noS.bam.bai │   │   ├── co1_2_Chimeric.out.junction │   │   ├── co1_2_Chimeric.out.junction.fixed │   │   ├── header.txt │   │   ├── Log.final.out │   │   ├── Log.out │   │   ├── Log.progress.out │   │   ├── ReadsPerGene.out.tab │   │   ├── SJ.out.tab │   │   └── Unmapped.out.mate1 │   ├── ReadsPerGene.out.tab │   ├── SJ.out.tab │   ├── Unmapped.out.mate1.gz │   └── Unmapped.out.mate2.gz ├── co3 │   ├── Chimeric.noS.bam │   ├── Chimeric.noS.bam.bai │   ├── co3Aligned.noS.bam │   ├── co3Aligned.noS.bam.bai │   ├── co3Chimeric.out.junction │   ├── header.txt │   ├── Log.final.out │   ├── Log.out │   ├── Log.progress.out │   ├── mate1 │   │   ├── Aligned.noS.bam │   │   ├── Aligned.noS.bam.bai │   │   ├── Chimeric.noS.bam │   │   ├── Chimeric.noS.bam.bai │   │   ├── co3_1_Chimeric.out.junction │   │   ├── header.txt │   │   ├── Log.final.out │   │   ├── Log.out │   │   ├── Log.progress.out │   │   ├── ReadsPerGene.out.tab │   │   ├── SJ.out.tab │   │   └── Unmapped.out.mate1 │   ├── mate2 │   │   ├── Aligned.noS.bam │   │   ├── Aligned.noS.bam.bai │   │   ├── Chimeric.noS.bam │   │   ├── Chimeric.noS.bam.bai │   │   ├── co3_2_Chimeric.out.junction │   │   ├── co3_2_Chimeric.out.junction.fixed │   │   ├── header.txt │   │   ├── Log.final.out │   │   ├── Log.out │   │   ├── Log.progress.out │   │   ├── ReadsPerGene.out.tab │   │   ├── SJ.out.tab │   │   └── Unmapped.out.mate1 │   ├── ReadsPerGene.out.tab │   ├── SJ.out.tab │   ├── Unmapped.out.mate1.gz │   └── Unmapped.out.mate2.gz └── co4 ├── Chimeric.noS.bam ├── Chimeric.noS.bam.bai ├── co4Aligned.noS.bam ├── co4Aligned.noS.bam.bai ├── co4Chimeric.out.junction ├── header.txt ├── Log.final.out ├── Log.out ├── Log.progress.out ├── mate1 │   ├── Aligned.noS.bam │   ├── Aligned.noS.bam.bai │   ├── Chimeric.noS.bam │   ├── Chimeric.noS.bam.bai │   ├── co4_1_Chimeric.out.junction │   ├── header.txt │   ├── Log.final.out │   ├── Log.out │   ├── Log.progress.out │   ├── ReadsPerGene.out.tab │   ├── SJ.out.tab │   └── Unmapped.out.mate1 ├── mate2 │   ├── Aligned.noS.bam │   ├── Aligned.noS.bam.bai │   ├── Chimeric.noS.bam │   ├── Chimeric.noS.bam.bai │   ├── co4_2_Chimeric.out.junction │   ├── co4_2_Chimeric.out.junction.fixed │   ├── header.txt │   ├── Log.final.out │   ├── Log.out │   ├── Log.progress.out │   ├── ReadsPerGene.out.tab │   ├── SJ.out.tab │   └── Unmapped.out.mate1 ├── ReadsPerGene.out.tab ├── SJ.out.tab ├── Unmapped.out.mate1.gz └── Unmapped.out.mate2.gz

Each directory has SJ.out.tab in it but still it is not able to detect it, please help

This the command I am running circtools detect @samplesheet -mt1 @mate1 -mt2 @mate2 -B @bam_files -D -R repeats_track.gtf -an Homo_sapiens.GRCh38.94.gtf -Pi -F -M -Nr 5 3 -fg -G -A Homo_sapiens.GRCh38.dna.fa

prince26121991 commented 5 years ago

Problem is solved, Solution: Tutorial manual suggest that, one must not change SJ.out.tab filename, but I look into DCC script, it replaces Chimeric.out.junction with SJ.out.tab. I was using "/home/scbb/cdri_data/aaaaaa/star/ci1/ci1Chimeric.out.junction" in samplesheet, therefore if it replaces Chimeric.out.junction with SJ.out.tab I get "/home/scbb/cdri_data/aaaaaa/star/ci1/ci1SJ.out.tab" . Which is actually not present in my /home/scbb/cdri_data/aaaaaa/star/ci1 directory, because I haven't renamed it as per suggested in manual. But if one is renaming Chimeric.out.junction than one must change SJ.out.tab accordingly with same prefix.