u-genoma / BioinfinvRepro

Curso de introducción a la bioinformática e investigación reproducible
GNU General Public License v3.0
25 stars 38 forks source link

Dudas sobre archivos de plink para previamente utilizar SNPRelate #18

Open KarenJimenez16 opened 4 years ago

KarenJimenez16 commented 4 years ago

Hola @AliciaMstt

Para hacer el PCA requerido en el proyecto, en el ejemplo que vimos en clase usaban un archivo con terminación .gds. Después de leer el manual de SNPRelate, vi que podemos realizar un archivo .gds utilizando archivos de plink con terminación .bed, .fam y .bim. Sin embargo, en ningún momento nos piden en el proyecto transformar el archivo resultante de convertir los datos de .vcf a plink, de .ped a .bed. Se necesita hacer esta transformación para obtener los archivos con terminación .bed, .bim y .fam y, de esta manera, poder crear un archivo .gds que R pueda realizar el PCA en SNPRelate.

Mi pregunta es, ¿Hago un script por separado para obtener los archivos plink necesarios para hacer el PCA en R o lo agrego al final del de VCFtools? También me surge la duda que en ese caso, también tendríamos que agregar al script la descarga de plink.

AliciaMstt commented 4 years ago

Parte del ejercicio es justo que te des cuenta qué archivos necesitas y cómo generarlos. En qué script lo metas está bien siempre y cuando lo documentes bien.

El Jue, 20 feb 2020 1:18 p. m., KarenJimenez16 notifications@github.com escribió:

Hola @AliciaMstt https://github.com/AliciaMstt

Para hacer el PCA requerido en el proyecto, en el ejemplo que vimos en clase usaban un archivo con terminación .gds. Después de leer el manual de SNPRelate, vi que podemos realizar un archivo .gds utilizando archivos de plink con terminación .bed, .fam y .bim. Sin embargo, en ningún momento nos piden en el proyecto transformar el archivo resultante de convertir los datos de .vcf a plink, de .ped a .bed. Se necesita hacer esta transformación para obtener los archivos con terminación .bed, .bim y .fam y, de esta manera, poder crear un archivo .gds que R pueda realizar el PCA en SNPRelate.

Mi pregunta es, ¿Hago un script por separado para obtener los archivos plink necesarios para hacer el PCA en R o lo agrego al final del de VCFtools? También me surge la duda que en ese caso, también tendríamos que agregar al script la descarga de plink.

— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub https://github.com/u-genoma/BioinfinvRepro/issues/18?email_source=notifications&email_token=ABJJMNEWZ7SPBBFMWGQUVX3RD3JPPA5CNFSM4KYVHBOKYY3PNVWWK3TUL52HS4DFUVEXG43VMWVGG33NNVSW45C7NFSM4IPC2S3A, or unsubscribe https://github.com/notifications/unsubscribe-auth/ABJJMNC2EADY7XONKM4UC53RD3JPPANCNFSM4KYVHBOA .

AliciaMstt commented 4 years ago

Lo de la descarga de plink no te entendí. Si te refieres a la instalación, eso no es necesario. Sólo asume que el programa está instalado y documenta qué versión se utilizó.

El Jue, 20 feb 2020 1:18 p. m., KarenJimenez16 notifications@github.com escribió:

Hola @AliciaMstt https://github.com/AliciaMstt

Para hacer el PCA requerido en el proyecto, en el ejemplo que vimos en clase usaban un archivo con terminación .gds. Después de leer el manual de SNPRelate, vi que podemos realizar un archivo .gds utilizando archivos de plink con terminación .bed, .fam y .bim. Sin embargo, en ningún momento nos piden en el proyecto transformar el archivo resultante de convertir los datos de .vcf a plink, de .ped a .bed. Se necesita hacer esta transformación para obtener los archivos con terminación .bed, .bim y .fam y, de esta manera, poder crear un archivo .gds que R pueda realizar el PCA en SNPRelate.

Mi pregunta es, ¿Hago un script por separado para obtener los archivos plink necesarios para hacer el PCA en R o lo agrego al final del de VCFtools? También me surge la duda que en ese caso, también tendríamos que agregar al script la descarga de plink.

— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub https://github.com/u-genoma/BioinfinvRepro/issues/18?email_source=notifications&email_token=ABJJMNEWZ7SPBBFMWGQUVX3RD3JPPA5CNFSM4KYVHBOKYY3PNVWWK3TUL52HS4DFUVEXG43VMWVGG33NNVSW45C7NFSM4IPC2S3A, or unsubscribe https://github.com/notifications/unsubscribe-auth/ABJJMNC2EADY7XONKM4UC53RD3JPPANCNFSM4KYVHBOA .