soh-i / Ivy

Detection method for RNA editng sites based on high-throughput sequencing data
GNU General Public License v2.0
1 stars 0 forks source link

Pileup時における塩基のバグ? #68

Closed soh-i closed 10 years ago

soh-i commented 10 years ago
chr1    161192312       C       A       2,0,110,118     0.991304347826

という結果をIGVで可視化すると、 2013-12-31 13 45 09 となっている。 この2塩基のAがどこ由来なのかが不明。

バグは、

soh-i commented 10 years ago
C 161192312
Total reads: 230
Matches: 2
Mismatches: 228

マッチとミスマッチがどうも逆転している、ところまで突き止めた。

ミスマッチ頻度の計算自体には問題はなかった。

soh-i commented 10 years ago
chr12 6646319 T Total reads: 16 Matches: 3 Mismatches: 13

2013-12-31 16 17 33 上記の例は、あっている。

soh-i commented 10 years ago

Weirdness with spliced reads in samfile.pileup(chr,start,end) given spliced alignments from an RNA-seq bam file

To ignore these in your analysis, test the flags is_del == True and indel=0 in the PileupRead object. http://pysam.readthedocs.org/en/latest/faq.html#weirdness-with-spliced-reads-in-samfile-pileup-chr-start-end-given-spliced-alignments-from-an-rna-seq-bam-file らしい。 とりあえず、このフィルターを加えた。

soh-i commented 10 years ago

ss_ 2013-12-31 23 05 14 chr1 230845793 A C 0,0,0,12 1.0 あっているのでは?

soh-i commented 10 years ago

めでたい、もうこれは問題ないでしょう