rocioagmi / TFG

0 stars 0 forks source link

Generar el workflow #6

Open rocioagmi opened 2 weeks ago

rocioagmi commented 2 weeks ago

Necesitamos crear el esquema que muestre el workflow que vamos a realizar con los datos.

rocioagmi commented 2 weeks ago

Hola @ajcanepa y @SoniaRamosGomez, Después de revisar el esquema de trabajo que siguen más o menos los artículos que he ido consultando, el workflow incluiría los pasos:

  1. Consulta y descarga de los datos:

    • Consulta de los datos de los artículos revisados
    • Automatización de la descarga de los datos
  2. Procesamiento de los datos

    • Recorte de las lecturas (eliminar adaptadores, eliminar bases de baja calidad, ...)
    • Filtrado de las lecturas por calidad y tamaño
  3. Ensamblaje del genoma, podemos hacerlo de dos formas:

    • De novo
    • Comparándolo con un genoma de referencia de una base de datos
  4. Identificación taxonómica, anotación de genes y funcional, podemos hacerlo por varios caminos:

    • Con genomas de referencia de bases de datos
    • Usando genes 16S rRNA
    1. Comparación de los resultados de las personas sanas con los pacientes de EM.

    2. Análisis estadísticos y de correlación.

    3. Visualización de los resultados obtenidos, correlaciones, comparaciones, etc con el uso de gráficos.

A partir de este esquema, podrían añadirse más pasos o sacarle más partido a algún paso ya existente según lo que vayamos encontrándonos. Para ello se irá revisando el workflow y cambiándolo de ser necesario.

ajcanepa commented 2 weeks ago

Hola @ajcanepa y @SoniaRamosGomez, Después de revisar el esquema de trabajo que siguen más o menos los artículos que he ido consultando, el workflow incluiría los pasos:

  1. Procesamiento de los datos
    • Recorte de las lecturas (eliminar adaptadores, eliminar bases de baja calidad, ...)
    • Filtrado de las lecturas por calidad y tamaño
  2. Ensamblaje del genoma, podemos hacerlo de dos formas:
    • De novo
    • Comparándolo con un genoma de referencia de una base de datos
  3. Identificación taxonómica, anotación de genes y funcional, podemos hacerlo por varios caminos:
    • Con genomas de referencia de bases de datos
    • Usando genes 16S rRNA
  4. Comparación de los resultados de las personas sanas con los pacientes de EM.
  5. Análisis estadísticos y de correlación.
  6. Visualización de los resultados obtenidos, correlaciones, comparaciones, etc con el uso de gráficos.

A partir de este esquema, podrían añadirse más pasos o sacarle más partido a algún paso ya existente según lo que vayamos encontrándonos. Para ello se irá revisando el workflow y cambiándolo de ser necesario.

Hola @rocioagmi , gracias por el mensaje. Creo que @SoniaRamosGomez coincidirá conmigo en que se debería agregar un paso previo (en este caso un paso 0) que incluya la consulta y descarga de los datos. Recuerda que la idea es que tu trabajo ofrezca una solución a quién quiera replicar o realizar algo similar y que de "alguna manera" tenga automatizado lo m´ás complejo, tedioso posible del trabajo. Para mí, lo que te comentaba de la base de datos y consulta de datos, sí que sería importante de incluir. No sé si las diferentes bases de datos que has encontrado ofrecen una estructura común de descargas para implementar una función que permita tener los datos en tu ordenador listos para ser analizados sólo con proveer de una URL (como usuario agradecería mucho eso). A lo mejor no será posible programar esa función para todas las fuentes de datos disponibles, pero si ya automatizas una en tu TFG es un avance.

Saludos,