Open jbs1009 opened 3 weeks ago
Buenas tardes. Se está estudiando la posibilidad de utilizar las enaBrowserTools para llevar a cabo la extracción automática de los datos necesarios (secuencias .fastq y metadatos asociados a las mismas). A continuación os proporciono un enlace a una guía que estoy consultando para entender cómo funcionan estas herramientas y así poder utilizarlas: --> How to Download Data files from ENA using enaBrowserTools
Se va a revisar la documentación sobre subprocess management en Python para poder prototipar funciones que permitan realizar la extracción de estos datos mediante la ejecución de comandos bash en el cuerpo de las mismas --> subprocess — Subprocess management
Finalmente se ha optado por realizar la extracción de las secuencias con wget y subprocess, como se muestra en el último prototipo de función recogido el notebook correspondiente. Faltaría conseguir extraer los metadatos o información asociada a cada secuencia.
Issue destinado a investigar cómo se pueden extraer los datos de ENA Browser que van a ser utilizados en el TFG y desarrollar un método de extracción automática de los mismos. (Tiempo inicial estimado: <= 15 días)