RolyPolyCoily / NGSv2

NGS教本v2
7 stars 6 forks source link

fasterq-dump エラー #1

Open lucky5sugar opened 4 years ago

lucky5sugar commented 4 years ago
  1. RNA-seqデータダウンロードの通りに進めていたのですが,fasterq-dumpのエラーか,一部ファイルのダウンロードができませんでした. Sratoolkitのprefetchを使って,fasterq-dumpをしたところうまく行きました.

うまくいったファイルのアウトプット

spots read      : 7,872,484
reads read      : 15,744,968
reads written   : 15,744,968

うまくいかなかったファイルのアウトプット

2020-01-07T06:58:14 fasterq-dump.2.10.1 err: cmn_iter.c cmn_read_uint8_array( #5242881 ).VCursorCellDataDirect() -> RC(rcPS,rcCondition,rcWaiting,rcTimeout,rcExhausted) 
2020-01-07T06:58:14 fasterq-dump.2.10.1 err: row #5242881 : READ.len(100) != QUALITY.len(0) (D) 
2020-01-07T06:58:14 fasterq-dump.2.10.1 fatal: SIGNAL - Segmentation fault 
gzip: SRR1550989*fastq: No such file or directory
RolyPolyCoily commented 2 years ago

お返事が大変遅くなってしまいました。こちら教えてくださりありがとうございました。ページにも反映させていただきました。

iwakitakuma33 commented 2 years ago

同じ問題が生じたので具体的な手順を記載します。

■問題内容 rna-seqデータダウンロードでタイムアウトになる。

cat SRR_Acc_List.txt | while read line; do cmd="fasterq-dump --split-files ${line}; gzip ${line}*fastq"; eval ${cmd}; done
2020-01-07T06:58:14 fasterq-dump.2.10.1 err: cmn_iter.c cmn_read_uint8_array( #5242881 ).VCursorCellDataDirect() -> RC(rcPS,rcCondition,rcWaiting,rcTimeout,rcExhausted) 
2020-01-07T06:58:14 fasterq-dump.2.10.1 err: row #5242881 : READ.len(100) != QUALITY.len(0) (D) 
2020-01-07T06:58:14 fasterq-dump.2.10.1 fatal: SIGNAL - Segmentation fault 
gzip: SRR1550989*fastq: No such file or directory

■解決方法 第1章の実践編1で使用した sratoolkit.2.11.1-mac64(sratoolkitのバージョンは各自の環境による)内のprefetchを使用することで解決しました。 以下のようにすることでダウンロードできます。結構時間がかかります。

{各自のパス}/sratoolkit.2.11.1-mac64/bin/prefetch SRR1551071

2021-10-13T05:29:49 prefetch.2.11.1: directory SRR1551071 will be checked for missed files
2021-10-13T05:29:49 prefetch.2.11.1: 1) Downloading 'SRR1551071'...
2021-10-13T05:29:49 prefetch.2.11.1:  Downloading via HTTPS...
2021-10-13T07:16:40 prefetch.2.11.1:  HTTPS download succeed
2021-10-13T07:16:43 prefetch.2.11.1:  'SRR1551071' is valid
2021-10-13T07:16:43 prefetch.2.11.1: 1) 'SRR1551071' was downloaded successfully

■コマンドの修正案 下記のように修正するとダウンロードとFASTQへの変換まで可能です。 (私の環境ではcondaを使用しており、fasterq-dumpのパスは通っている状態 sratoolkitもcondaでinstallした方が楽かもしれません。)

cat SRR_Acc_List.txt | while read line; do cmd=“[各自のパス(sratoolkitのバージョンも各自のものに修正必要)]/sratoolkit.2.11.1-mac64/bin/prefetch ${line}; fasterq-dump ${line}/${line}.sra; eval ${cmd}; done

参考URL: ・sratoolkitのバージョンについて https://staffblog.amelieff.jp/entry/2019/08/28/180730 参考URLではlinux版のsratoolkitを使用している。 ・conda sratoolkitについて https://anaconda.org/bioconda/sra-tools