isglobal-brge / recombClust

Clustering of chromosomal subpopulations based on recombination patterns
MIT License
0 stars 1 forks source link

Optimizar la definición de ventanas #4

Open yocra3 opened 3 years ago

yocra3 commented 3 years ago

La implementación actual de computeRecombProbabilities calcula todos los modelos y después agrupa los modelos en ventanas. Aunque esta aproximación puede ser válida para regiones pequeñas, es poco eficiente para regiones grandes. Para regiones grandes, solo un pequeño porcentaje de los modelos se incluyen en cada ventana. No obstante, se tiene que calcular y mantener en memoria todos los modelos para luego definir las ventanas.

Para solventar este issue se proponen dos acciones:

  1. Calcular los ventanas a medida que se tienen los modelos necesarios. Esto reducirá la cantidad de memoria ocupada por los modelos.
  2. Escribir en disco el resultado de las ventanas a medida que se van calculando en un archivo hdf5. Esto reducirá la cantidad de memoria ocupada por las ventanas. Además, permitirá un más fácil procesado de los resultados en pasos posteriores.