jbs1009 / TFG_GIS_Jorge_Bermejo_Sacristan

Soy Jorge Bermejo Sacristán y curso 4º del Grado en Ingeniería de la Salud en la Universidad de Burgos (UBU). En este repositorio se recogerá el desarrollo de mi Trabajo de Fin de Grado.
0 stars 0 forks source link

Extracción automática de los datos de ENA Browser #11

Open jbs1009 opened 3 weeks ago

jbs1009 commented 3 weeks ago

Issue destinado a investigar cómo se pueden extraer los datos de ENA Browser que van a ser utilizados en el TFG y desarrollar un método de extracción automática de los mismos. (Tiempo inicial estimado: <= 15 días)

jbs1009 commented 2 weeks ago

Buenas tardes. Se está estudiando la posibilidad de utilizar las enaBrowserTools para llevar a cabo la extracción automática de los datos necesarios (secuencias .fastq y metadatos asociados a las mismas). A continuación os proporciono un enlace a una guía que estoy consultando para entender cómo funcionan estas herramientas y así poder utilizarlas: --> How to Download Data files from ENA using enaBrowserTools

jbs1009 commented 1 week ago

Se va a revisar la documentación sobre subprocess management en Python para poder prototipar funciones que permitan realizar la extracción de estos datos mediante la ejecución de comandos bash en el cuerpo de las mismas --> subprocess — Subprocess management

jbs1009 commented 6 days ago

Finalmente se ha optado por realizar la extracción de las secuencias con wget y subprocess, como se muestra en el último prototipo de función recogido el notebook correspondiente. Faltaría conseguir extraer los metadatos o información asociada a cada secuencia.