misshie / ngsdat2

NGS Data Analysis Textbook Version 2 (Disease Genome Analysis)
MIT License
42 stars 22 forks source link

培養細胞の変異の検出について #8

Closed kojix2 closed 4 years ago

kojix2 commented 4 years ago

三嶋先生

こんにちは。 インフォマ独学初心者でRubyユーザーのkojix2です。

申し訳ないと思いつつ、身の回りに詳しい人がおらず聞く当てがないので、ここで直接質問してしまいます。

ここのワークフローを使って、CCLEが公開しているMKN74(SRR8619167)という胃がん培養細胞のsnv indel検出を行うと、exonかつnonsynonymous SNVの変異が10000近く検出されました。 https://www.ncbi.nlm.nih.gov/sra/?term=SRR8619167 (塩基ごとの品質スコアの再校正の過程は省きました)

一方でCCLEのデータベースで見ると、登録されている変異は739個に過ぎません。 https://portals.broadinstitute.org/ccle

image

この差は何によるものでしょうか。

培養細胞をシークエンスすると公表されているものの10倍ぐらい変異が見つかるという噂も聞きますが、この場合はCCLEのデータを使ってるので単純に正しい方法で検出できていない気もします。一方で、培養細胞の変異が700しかないはずがないという気もします。

調べ方がわからないので、何か思い当たることやヒントがあったら教えて頂けると幸いです。

kojix2 commented 4 years ago

どうやら実際に変異は10000個ぐらいあって、そのうち人間のvariantで存在しないものが700ぐらいということかも知れませんね…