biocorecrg / allele_specific_RNAseq

Allele Specific RNAseq
9 stars 2 forks source link

Content of the `Counts` folder #8

Closed Jacq3lin3 closed 4 years ago

Jacq3lin3 commented 4 years ago

Ciao Luca,

Nella sezione del README dei Results stavo leggendo che la cartella Counts contiene:

composite counts per gene per sample. No distincion between alleles

Non mi e' tanto chiaro il concetto di composite counts? Io mi sarei aspetta un file con 2 colonne una del gene ID e la seconda con le counts. Invece ci sono 4 colonne (una gene ID e 3 di counts) e non capisco la differenza tra le tre colonne della counts.

Inoltre le prima 4 righe (che mi sembrano un header) non capisco bene che informazione riportino.

Qui ti riporto l esempio di un file:

N_unmapped  231896  231896  231896
N_multimapping  1161389 1161389 1161389
N_noFeature 176413  458139  3269481
N_ambiguous 170644  46725   3691
ENSMUSG00000094121  0   0   0
ENSMUSG00000031166  41  37  4
ENSMUSG00000031167  85  33  52
ENSMUSG00000055188  8   7   1
ENSMUSG00000039201  81  75  6
ENSMUSG00000031168  159 146 13
ENSMUSG00000031169  688 661 27
ENSMUSG00000031171  200 191 9
ENSMUSG00000031170  14  13  1

Grazie mille per il tuo aiuto, Jackie

lucacozzuto commented 4 years ago

Ciao Jackie, quest è l'output di STAR con l'opzione --quantMode GeneCounts. Il formato e': gene_id, read counts on: both strands, forward, reverse. Questo dipende dal kit per il sequenziamento.

Luca

Jacq3lin3 commented 4 years ago

ok perfetto grazie mille! Voglio mettere in DEseq2 i dati NON allele specific, quindi prenderó la prima colonna (both strands) . Grazie ancora!

lucacozzuto commented 4 years ago

mmm vedi il protocollo che hanno - avete usato. Di solito é l'ultima

Jacq3lin3 commented 4 years ago

ma l'ultima non sarebbero solo le reads del reverse strand? se a me interessano tutte le reads dovrei prendere la prima no?

lucacozzuto commented 4 years ago

No. Funziona così: il sequencing puo' essere strand specific o no. Dipendendo dal kit che usi puo' sequenziare il forward o il reverse complement dell'RNA. Il tool considera tutte le opzioni pero' se non conti in base al kit usato introduci degli errori.