Genomon-Project / fusionfusion

script for detecting fusion genes from several transcript alignment tools
GNU General Public License v3.0
9 stars 8 forks source link

STARのSAMファイルパース時エラーの修正 #16

Closed athos closed 2 years ago

athos commented 2 years ago

STARから得られる結果のSAMファイルからアライメントをパースする際に以下のようなエラーが発生することがあります:

Traceback (most recent call last):
  File "/usr/local/bin/fusionfusion", line 11, in <module>
    load_entry_point('fusionfusion==0.5.0', 'console_scripts', 'fusionfusion')()
  File "build/bdist.linux-x86_64/egg/fusionfusion/__init__.py", line 10, in main
  File "build/bdist.linux-x86_64/egg/fusionfusion/run.py", line 149, in fusionfusion_main
  File "build/bdist.linux-x86_64/egg/fusionfusion/parseJunctionInfo.py", line 596, in parseJuncInfo_STAR
  File "build/bdist.linux-x86_64/egg/fusionfusion/parseJunctionInfo.py", line 566, in getFusInfo_STAR
NameError: global name 'read' is not defined

これは、SAMファイルから各行のアライメントの塩基配列を読み込む際、F[9](SAMファイルの10カラム目)ではなくread.seq(pysamを使っている場合の塩基配列の取得方法)を使っていることが原因となっており、未定義変数であるreadへのアクセスがエラーを引き起こしています。

このエラーは特に、ブレークポイントの間にinserted sequenceが検出された場合に発生するようですが、実運用時でもエラーが発生するケースはあまり多くなく比較的発生しにくい事象と思われます。

このPRでは、read.seqF[9]に直すことでエラーを修正しています。

athos commented 2 years ago

このプルリクエストによる修正は不十分だったため、新たに #17 を作成致しました。こちらはクローズとします。