tgen / jetstream_resources

Collection of scripts and README files tracking the source and generation of reference genomes and annotation files
MIT License
3 stars 1 forks source link

Updated build script #1

Closed ryanrichholt closed 5 years ago

ryanrichholt commented 5 years ago

Updated a few things here, and each is included in a separate commit:

Here is the structure I get when I run it:

hg38tgen/
├── gene_model
│   └── ensembl_v95
│       ├── downloads
│       │   └── Homo_sapiens.GRCh38.95.gtf
│       ├── Homo_sapiens.GRCh38.95.ucsc.gtf
│       ├── Homo_sapiens.GRCh38.95.ucsc.transcriptome.fasta
│       ├── README
│       ├── slurm-2220645.out
│       └── tool_resources
│           ├── salmon_0.12.0
│           │   ├── README
│           │   ├── salmon_quasi_75merPlus
│           │   │   ├── duplicate_clusters.tsv
│           │   │   ├── hash.bin
│           │   │   ├── header.json
│           │   │   ├── indexing.log
│           │   │   ├── quasi_index.log
│           │   │   ├── refInfo.json
│           │   │   ├── rsd.bin
│           │   │   ├── sa.bin
│           │   │   ├── txpInfo.bin
│           │   │   └── versionInfo.json
│           │   └── slurm-2220646.out
│           └── star_2.6.1d
│               ├── 100bpReads
│               │   ├── chrLength.txt
│               │   ├── chrNameLength.txt
│               │   ├── chrName.txt
│               │   ├── chrStart.txt
│               │   ├── SA_0
│               │   ├── SA_1
│               │   ├── SA_10
│               │   ├── SA_11
│               │   ├── SA_12
│               │   ├── SA_13
│               │   ├── SA_14
│               │   ├── SA_15
│               │   ├── SA_16
│               │   ├── SA_17
│               │   ├── SA_18
│               │   ├── SA_19
│               │   ├── SA_2
│               │   ├── SA_20
│               │   ├── SA_21
│               │   ├── SA_22
│               │   ├── SA_23
│               │   ├── SA_24
│               │   ├── SA_25
│               │   ├── SA_26
│               │   ├── SA_27
│               │   ├── SA_28
│               │   ├── SA_29
│               │   ├── SA_3
│               │   ├── SA_30
│               │   ├── SA_31
│               │   ├── SA_32
│               │   ├── SA_33
│               │   ├── SA_34
│               │   ├── SA_35
│               │   ├── SA_36
│               │   ├── SA_37
│               │   ├── SA_38
│               │   ├── SA_39
│               │   ├── SA_4
│               │   ├── SA_40
│               │   ├── SA_41
│               │   ├── SA_42
│               │   ├── SA_43
│               │   ├── SA_44
│               │   ├── SA_45
│               │   ├── SA_46
│               │   ├── SA_47
│               │   ├── SA_48
│               │   ├── SA_49
│               │   ├── SA_5
│               │   ├── SA_50
│               │   ├── SA_51
│               │   ├── SA_52
│               │   ├── SA_53
│               │   ├── SA_54
│               │   ├── SA_55
│               │   ├── SA_56
│               │   ├── SA_6
│               │   ├── SA_7
│               │   ├── SA_8
│               │   └── SA_9
│               ├── 150bpReads
│               │   ├── chrLength.txt
│               │   ├── chrNameLength.txt
│               │   ├── chrName.txt
│               │   ├── chrStart.txt
│               │   ├── SA_0
│               │   ├── SA_1
│               │   ├── SA_10
│               │   ├── SA_11
│               │   ├── SA_12
│               │   ├── SA_13
│               │   ├── SA_14
│               │   ├── SA_15
│               │   ├── SA_16
│               │   ├── SA_17
│               │   ├── SA_18
│               │   ├── SA_19
│               │   ├── SA_2
│               │   ├── SA_20
│               │   ├── SA_21
│               │   ├── SA_22
│               │   ├── SA_23
│               │   ├── SA_24
│               │   ├── SA_25
│               │   ├── SA_26
│               │   ├── SA_27
│               │   ├── SA_28
│               │   ├── SA_29
│               │   ├── SA_3
│               │   ├── SA_30
│               │   ├── SA_31
│               │   ├── SA_32
│               │   ├── SA_33
│               │   ├── SA_34
│               │   ├── SA_35
│               │   ├── SA_36
│               │   ├── SA_37
│               │   ├── SA_38
│               │   ├── SA_39
│               │   ├── SA_4
│               │   ├── SA_40
│               │   ├── SA_41
│               │   ├── SA_42
│               │   ├── SA_43
│               │   ├── SA_44
│               │   ├── SA_45
│               │   ├── SA_46
│               │   ├── SA_47
│               │   ├── SA_48
│               │   ├── SA_49
│               │   ├── SA_5
│               │   ├── SA_50
│               │   ├── SA_51
│               │   ├── SA_52
│               │   ├── SA_53
│               │   ├── SA_54
│               │   ├── SA_55
│               │   ├── SA_56
│               │   ├── SA_6
│               │   ├── SA_7
│               │   ├── SA_8
│               │   └── SA_9
│               ├── 75bpReads
│               │   ├── chrLength.txt
│               │   ├── chrNameLength.txt
│               │   ├── chrName.txt
│               │   ├── chrStart.txt
│               │   ├── SA_0
│               │   ├── SA_1
│               │   ├── SA_10
│               │   ├── SA_11
│               │   ├── SA_12
│               │   ├── SA_13
│               │   ├── SA_14
│               │   ├── SA_15
│               │   ├── SA_16
│               │   ├── SA_17
│               │   ├── SA_18
│               │   ├── SA_19
│               │   ├── SA_2
│               │   ├── SA_20
│               │   ├── SA_21
│               │   ├── SA_22
│               │   ├── SA_23
│               │   ├── SA_24
│               │   ├── SA_25
│               │   ├── SA_26
│               │   ├── SA_27
│               │   ├── SA_28
│               │   ├── SA_29
│               │   ├── SA_3
│               │   ├── SA_30
│               │   ├── SA_31
│               │   ├── SA_32
│               │   ├── SA_33
│               │   ├── SA_34
│               │   ├── SA_35
│               │   ├── SA_36
│               │   ├── SA_37
│               │   ├── SA_38
│               │   ├── SA_39
│               │   ├── SA_4
│               │   ├── SA_40
│               │   ├── SA_41
│               │   ├── SA_42
│               │   ├── SA_43
│               │   ├── SA_44
│               │   ├── SA_45
│               │   ├── SA_46
│               │   ├── SA_47
│               │   ├── SA_48
│               │   ├── SA_49
│               │   ├── SA_5
│               │   ├── SA_50
│               │   ├── SA_51
│               │   ├── SA_52
│               │   ├── SA_53
│               │   ├── SA_54
│               │   ├── SA_55
│               │   ├── SA_56
│               │   ├── SA_6
│               │   ├── SA_7
│               │   ├── SA_8
│               │   └── SA_9
│               ├── Log.out
│               ├── README
│               ├── slurm-2220647.out
│               ├── slurm-2220648.out
│               ├── slurm-2220649.out
│               └── _STARtmp
├── genome_reference
│   ├── BWA_FASTA -> GRCh38tgen_decoy_alts_hla.fa
│   ├── downloads
│   │   ├── bwa.kit
│   │   │   ├── bwa
│   │   │   ├── bwa-postalt.js
│   │   │   ├── doc
│   │   │   │   ├── bwa.1
│   │   │   │   ├── NEWS.md
│   │   │   │   ├── README-alt.md
│   │   │   │   └── README.md
│   │   │   ├── fermi2
│   │   │   ├── fermi2.pl
│   │   │   ├── htsbox
│   │   │   ├── k8
│   │   │   ├── README.md
│   │   │   ├── resource-GRCh38
│   │   │   │   ├── hs38DH-extra.fa
│   │   │   │   └── hs38DH.fa.alt
│   │   │   ├── resource-human-HLA
│   │   │   │   ├── HLA-ALT-exons.bed
│   │   │   │   ├── HLA-ALT-idx
│   │   │   │   │   ├── alt_APD.fa.amb
│   │   │   │   │   ├── alt_APD.fa.ann
│   │   │   │   │   ├── alt_APD.fa.bwt
│   │   │   │   │   ├── alt_APD.fa.pac
│   │   │   │   │   ├── alt_APD.fa.sa
│   │   │   │   │   ├── alt_COX.fa.amb
│   │   │   │   │   ├── alt_COX.fa.ann
│   │   │   │   │   ├── alt_COX.fa.bwt
│   │   │   │   │   ├── alt_COX.fa.pac
│   │   │   │   │   ├── alt_COX.fa.sa
│   │   │   │   │   ├── alt_DBB.fa.amb
│   │   │   │   │   ├── alt_DBB.fa.ann
│   │   │   │   │   ├── alt_DBB.fa.bwt
│   │   │   │   │   ├── alt_DBB.fa.pac
│   │   │   │   │   ├── alt_DBB.fa.sa
│   │   │   │   │   ├── alt_MANN.fa.amb
│   │   │   │   │   ├── alt_MANN.fa.ann
│   │   │   │   │   ├── alt_MANN.fa.bwt
│   │   │   │   │   ├── alt_MANN.fa.pac
│   │   │   │   │   ├── alt_MANN.fa.sa
│   │   │   │   │   ├── alt_MCF.fa.amb
│   │   │   │   │   ├── alt_MCF.fa.ann
│   │   │   │   │   ├── alt_MCF.fa.bwt
│   │   │   │   │   ├── alt_MCF.fa.pac
│   │   │   │   │   ├── alt_MCF.fa.sa
│   │   │   │   │   ├── alt_QBL.fa.amb
│   │   │   │   │   ├── alt_QBL.fa.ann
│   │   │   │   │   ├── alt_QBL.fa.bwt
│   │   │   │   │   ├── alt_QBL.fa.pac
│   │   │   │   │   ├── alt_QBL.fa.sa
│   │   │   │   │   ├── alt_SSTO.fa.amb
│   │   │   │   │   ├── alt_SSTO.fa.ann
│   │   │   │   │   ├── alt_SSTO.fa.bwt
│   │   │   │   │   ├── alt_SSTO.fa.pac
│   │   │   │   │   ├── alt_SSTO.fa.sa
│   │   │   │   │   ├── pri_PGF.fa.amb
│   │   │   │   │   ├── pri_PGF.fa.ann
│   │   │   │   │   ├── pri_PGF.fa.bwt
│   │   │   │   │   ├── pri_PGF.fa.pac
│   │   │   │   │   └── pri_PGF.fa.sa
│   │   │   │   ├── HLA-ALT-type.txt
│   │   │   │   └── HLA-CDS.fa
│   │   │   ├── ropebwt2
│   │   │   ├── run-bwamem
│   │   │   ├── run-gen-ref
│   │   │   ├── run-HLA
│   │   │   ├── samblaster
│   │   │   ├── samtools
│   │   │   ├── seqtk
│   │   │   ├── trimadap
│   │   │   ├── typeHLA.js
│   │   │   ├── typeHLA-selctg.js
│   │   │   └── typeHLA.sh
│   │   ├── bwakit-0.7.15_x64-linux.tar.bz2
│   │   ├── bwakit_HLA.fasta
│   │   ├── GCA_000001405.15_GRCh38_full_plus_hs38d1_analysis_set.fna.gz
│   │   ├── GCA_000001405.15_GRCh38_no_alt_plus_hs38d1_analysis_set.fna.gz
│   │   └── README_analysis_sets.txt
│   ├── GRCh38tgen_decoy_alts_hla.dict
│   ├── GRCh38tgen_decoy_alts_hla.fa
│   ├── GRCh38tgen_decoy_alts_hla.fa.fai
│   ├── GRCh38tgen_decoy.dict
│   ├── GRCh38tgen_decoy.fa
│   ├── GRCh38tgen_decoy.fa.fai
│   ├── README
│   └── STAR_FASTA -> GRCh38tgen_decoy.fa
├── README
└── tool_resources
    └── bwa_0.7.17
        ├── GRCh38tgen_decoy_alts_hla.fa -> ../../genome_reference/GRCh38tgen_decoy_alts_hla.fa
        ├── GRCh38tgen_decoy_alts_hla.fa.alt
        ├── GRCh38tgen_decoy_alts_hla.fa.amb
        ├── GRCh38tgen_decoy_alts_hla.fa.ann
        ├── GRCh38tgen_decoy_alts_hla.fa.pac
        ├── README
        └── slurm-2220383.out
PedalheadPHX commented 5 years ago

Merging all changes into master