Jorge Vaquero-Garcia, Joseph K. Aicher, San Jewell, Matthew R. Gazzara, Caleb M. Radens, Anupama Jha, Scott S. Norton, Nicholas F. Lahens, Gregory R. Grant & Yoseph Barash
ジャーナル/会議名
Nature Communications
出版日(yyyy/MM/dd)
2023/03/03
概要
背景
Fig. 1 MAJIQにより,複雑なRNA-seqデータセットからRNAスプライシングを効率的かつ正確にモデル化・定量化・可視化できる
a GTEx由来の各組織のサブセットが大きくなるにつれて,同定されるde novoジャンクションの数は増加する.
b GTEx由来の各組織について,PSIの95パーセンタイルと5パーセンタイルの差が所定の値を超えるジャンクションを少なくとも1つ持つ遺伝子の数(aと同じ組織/色).破線の縦線は,PSIの差が20%を超える遺伝子の数を示す.
**PSI = Percent Spliced in Index:エクソンの包含率,特定のエクソンを含むアイソフォームの相対存在量/そのエクソンを含む遺伝子の全アイソフォームの相対存在量
c MAJIQは,アノテーション付き転写産物データベースと入力RNA-seq実験からのカバレッジを組み合わせて,アノテーションありおよびde novoジャンクションとイントロンリテンションによって接続されたエクソンの集合体として各遺伝子のモデルを構築する(splicegraph).MAJIQ v2での変更点:①インクリメンタルビルドが導入により,追加実験でのビルドが高速化,②使用頻度の低いジャンクションやイントロンリテンションを無視することでスプライスグラフ/LSVの複雑さを軽減,③独立したRNA-seq実験の集団間のPSIの違いを比較し、実験ごとに変動する不確実性を考慮するモード,HETを新規導入,④LSVではなく非重複スプライシングモジュールに対する相対解析を実行できるmodulizerを導入
Fig. 2 合成データとリアルデータを用いた性能評価
a 10のGTEx組織グループ間で,1グループあたりのサンプル数を1から6まで増やしながら,すべてのペアワイズ差分スプライシング解析を実行した場合の時間(左)とメモリ(右)の消費量(x軸).
b GTExのシミュレーションサンプル(小脳と骨格筋)を使用した差分スプライシングコールの性能評価(遺伝子で集計).指標は,発現変動(TOTAL-CHG)または発現非変動(TOTAL-NO-CHG)として報告された遺伝子の総数・その結果のFDR・FNR・Matthewの相関係数(MCC).横軸はセットサイズ.
書誌情報
一言でいうと
大規模RNA-seqデータセットからスプライシングバリアントの検出・定量・可視化を行うために,MAJIQ v2パッケージという一連のアルゴリズム・ツールを開発した.
論文リンク
https://www.doi.org/10.1038/s41467-023-36585-y
著者
Jorge Vaquero-Garcia, Joseph K. Aicher, San Jewell, Matthew R. Gazzara, Caleb M. Radens, Anupama Jha, Scott S. Norton, Nicholas F. Lahens, Gregory R. Grant & Yoseph Barash
ジャーナル/会議名
Nature Communications
出版日(yyyy/MM/dd)
2023/03/03
概要
背景
Fig. 1 MAJIQにより,複雑なRNA-seqデータセットからRNAスプライシングを効率的かつ正確にモデル化・定量化・可視化できる
a GTEx由来の各組織のサブセットが大きくなるにつれて,同定されるde novoジャンクションの数は増加する.
b GTEx由来の各組織について,PSIの95パーセンタイルと5パーセンタイルの差が所定の値を超えるジャンクションを少なくとも1つ持つ遺伝子の数(aと同じ組織/色).破線の縦線は,PSIの差が20%を超える遺伝子の数を示す.
**PSI = Percent Spliced in Index:エクソンの包含率,特定のエクソンを含むアイソフォームの相対存在量/そのエクソンを含む遺伝子の全アイソフォームの相対存在量
c MAJIQは,アノテーション付き転写産物データベースと入力RNA-seq実験からのカバレッジを組み合わせて,アノテーションありおよびde novoジャンクションとイントロンリテンションによって接続されたエクソンの集合体として各遺伝子のモデルを構築する(splicegraph).MAJIQ v2での変更点:①インクリメンタルビルドが導入により,追加実験でのビルドが高速化,②使用頻度の低いジャンクションやイントロンリテンションを無視することでスプライスグラフ/LSVの複雑さを軽減,③独立したRNA-seq実験の集団間のPSIの違いを比較し、実験ごとに変動する不確実性を考慮するモード,HETを新規導入,④LSVではなく非重複スプライシングモジュールに対する相対解析を実行できるmodulizerを導入
新規性
用いているデータセットや提案手法(簡潔に、詳細は結果の項目で)
研究として評価されている点(新規性で述べた点以外で)
Limitationや疑問・コメント(批判的なコメントも書くこと)
Graphical Absrtract(ある場合は適切なところに入れること)
結果
1. 提案手法
2. 実験
2-i データ
2-ii. 評価指標
3.結果(実験と同時に書いてもいい)