Closed athos closed 3 years ago
このプルリクエストでは、STARを用いた解析時にChimeric.out.samだけからでは検出できない融合遺伝子の検出を、STARのSJ.out.tabおよびAligned.out.bamを用いることで補完するフィルタを実装します。
Chimeric.out.sam
SJ.out.tab
Aligned.out.bam
隣接する遺伝子間での融合遺伝子のように比較的近距離で生じたキメラ遺伝子はChimeric.out.samに捕捉されないことがあります(たとえば、STIL-TALなど)。SJ.out.tabはSTARによって検出されたスプライシングジャンクションがリストアップされた出力ファイルで、Chimeric.out.samに捕捉されない融合遺伝子がスプライシングジャンクションとしてSJ.out.tabに捕捉されることがあります。
STIL-TAL
このフィルタの実装では、以下の5ステップによりSJ.out.tabから融合遺伝子候補のスプライシングジャンクションを抽出し、そのスプライシングジャンクション付近にマッピングされたアライメントをAligned.out.bamから読み込み解析することで融合遺伝子検出を補完します(これらの主な処理はShortRangeChimeraFilterクラスで実装しています):
ShortRangeChimeraFilter
parseJunctionInfo.parseJuncInfo_STAR
ステップ3および4は、fusionfusionにアライメントの3つ組(primary, supplementaryおよびそれらのペア)が融合遺伝子をサポートしていると認識させるために必要です。
なお、この変更では--starオプションの意味を変更しているため、ユーザレベルの後方互換性が維持されません。従来、--starオプションはChimeric.out.samのファイルパスを指定していましたが、この変更によりSTARの出力結果ファイル群のプレフィックス(STARの--outFileNamePrefixオプションに指定する値)を指定する必要があります。
--star
--outFileNamePrefix
このプルリクエストでは、STARを用いた解析時に
Chimeric.out.sam
だけからでは検出できない融合遺伝子の検出を、STARのSJ.out.tab
およびAligned.out.bam
を用いることで補完するフィルタを実装します。隣接する遺伝子間での融合遺伝子のように比較的近距離で生じたキメラ遺伝子は
Chimeric.out.sam
に捕捉されないことがあります(たとえば、STIL-TAL
など)。SJ.out.tab
はSTARによって検出されたスプライシングジャンクションがリストアップされた出力ファイルで、Chimeric.out.sam
に捕捉されない融合遺伝子がスプライシングジャンクションとしてSJ.out.tab
に捕捉されることがあります。このフィルタの実装では、以下の5ステップにより
SJ.out.tab
から融合遺伝子候補のスプライシングジャンクションを抽出し、そのスプライシングジャンクション付近にマッピングされたアライメントをAligned.out.bam
から読み込み解析することで融合遺伝子検出を補完します(これらの主な処理はShortRangeChimeraFilter
クラスで実装しています):SJ.out.tab
に出力されたスプライシングジャンクションのうち、始端と終端の遺伝子が異なるものを融合遺伝子候補のスプライシングジャンクションとして抽出Aligned.out.bam
から読み込み、スプライシングと同じ位置にギャップを持つアライメントを融合遺伝子をサポートするアライメントとして抽出Chimeric.out.sam
と同様にparseJunctionInfo.parseJuncInfo_STAR
に入力として渡し、その結果をChimeric.out.sam
の結果とマージする(以降は従来と同じ処理)ステップ3および4は、fusionfusionにアライメントの3つ組(primary, supplementaryおよびそれらのペア)が融合遺伝子をサポートしていると認識させるために必要です。
なお、この変更では
--star
オプションの意味を変更しているため、ユーザレベルの後方互換性が維持されません。従来、--star
オプションはChimeric.out.sam
のファイルパスを指定していましたが、この変更によりSTARの出力結果ファイル群のプレフィックス(STARの--outFileNamePrefix
オプションに指定する値)を指定する必要があります。