Implementar paquete GRIDSS (https://github.com/PapenfussLab/gridss). Inicialmente, podemos implementar un módulo que ejecute todos los pasos. Este módulo se programa pensando en hacer un joint analysis, donde incluímos todas las muestras (o al menos, las incluímos por bloques). En el futuro, se puede estudiar implementar los diferentes pasos individuales en módulos separados.
Parámetros
INPUT: Cada archivo bam debe estar específicado individualmente (INPUT=samp1.bam)
ASSEMBLY: archivo para guardar pasos intermedios. Se recomienda que sea igual que OUTPUT
BLACKLIST: archivo bed con regiones problemáticas para descartar.
WORKER_THREADS: número de CPUs usados en la computación. Se debe referenciar en relación a la configuración.
Inputs
tupla id, bam, bai
tupla fasta, fai
Lista archivos índice del alineador
bed file blacklist (opcional)
Outputs
vcf (output con los resultados)
INPUT*.sv.bam (lista de bams con los reads usados para detectar las variantes)
ASSEMBLY*.sv.bam (lista de bams con los reads usados para detectar las variantes)
Descripción del programa
Implementar paquete GRIDSS (https://github.com/PapenfussLab/gridss). Inicialmente, podemos implementar un módulo que ejecute todos los pasos. Este módulo se programa pensando en hacer un joint analysis, donde incluímos todas las muestras (o al menos, las incluímos por bloques). En el futuro, se puede estudiar implementar los diferentes pasos individuales en módulos separados.
Parámetros
INPUT
: Cada archivo bam debe estar específicado individualmente (INPUT=samp1.bam
)ASSEMBLY
: archivo para guardar pasos intermedios. Se recomienda que sea igual queOUTPUT
BLACKLIST
: archivo bed con regiones problemáticas para descartar.WORKER_THREADS
: número de CPUs usados en la computación. Se debe referenciar en relación a la configuración.Inputs
Outputs