CIBERER / GdTBioinfo-nf-cnvs

Pipeline in nextflow to detect structural variants developed at CIBERER
MIT License
2 stars 1 forks source link

[MODULO] R/DeCON #43

Open yocra3 opened 3 years ago

yocra3 commented 3 years ago

Descripción del programa

Implementar script para detectar variantes con el paquete de R DeCON.

NOTA: El paquete DeCON está compuesto por una pipeline con varios pasos. Se puede considerar implementar cada uno de estos pasos en un módulo independiente. En ese caso, se debería hacer un issue por cada paso y este issue pasaría a ser un subworkflow con el conjunto de pasos.

Parámetros

Ninguno (revisar la documentación).

Inputs

Outputs

yocra3 commented 2 months ago

Antes de empezar a implementar, hay que explorar bien como funciona la herramienta, qué se genera en cada paso y como lee el programa los archivos. De manera inicial, se propone dividir crear dos módulos para resolver el issue:

  1. Cálculo de FPKMs. Este script consta de los scripts de DECON ReadInBams.R y IdentifyFailures.R.
  2. Detección de CNVs: scripts makeCNVcalls.R

Los scripts del paso 1 necesitan de todos los bams de un batch de secuenciación. Al implementar en Nextflow, la estructura propuesta es una tupla formada por: meta (id del batch) y bams/bai. Bams/bai a su vez es una lista de tuplas con los bams y los bai. La lista debe tener un tamaño indeterminado, ya que dependerá del numero de muestras del batch.

Hay que comprobar si el paso 2 se puede realizar a nivel de muestra individual. En ese caso, el input sera una tupla formada por: meta (id de la muestra), .Rdata (resultado del paso 1). Si no se puede hacer a nivel de muestra individual, el input será: meta (id del batch), .Rdata (resultado del paso 1).

En ambos casos, se requieren otros archivos de referencia que se pasarán en posiciones del input diferentes.

Finalmente, los scripts de Decon los copiaremos de momento en la carpeta bin del repositorio.