Open lucky5sugar opened 4 years ago
お返事が大変遅くなってしまいました。こちら教えてくださりありがとうございました。ページにも反映させていただきました。
同じ問題が生じたので具体的な手順を記載します。
■問題内容 rna-seqデータダウンロードでタイムアウトになる。
cat SRR_Acc_List.txt | while read line; do cmd="fasterq-dump --split-files ${line}; gzip ${line}*fastq"; eval ${cmd}; done
2020-01-07T06:58:14 fasterq-dump.2.10.1 err: cmn_iter.c cmn_read_uint8_array( #5242881 ).VCursorCellDataDirect() -> RC(rcPS,rcCondition,rcWaiting,rcTimeout,rcExhausted)
2020-01-07T06:58:14 fasterq-dump.2.10.1 err: row #5242881 : READ.len(100) != QUALITY.len(0) (D)
2020-01-07T06:58:14 fasterq-dump.2.10.1 fatal: SIGNAL - Segmentation fault
gzip: SRR1550989*fastq: No such file or directory
■解決方法 第1章の実践編1で使用した sratoolkit.2.11.1-mac64(sratoolkitのバージョンは各自の環境による)内のprefetchを使用することで解決しました。 以下のようにすることでダウンロードできます。結構時間がかかります。
{各自のパス}/sratoolkit.2.11.1-mac64/bin/prefetch SRR1551071
2021-10-13T05:29:49 prefetch.2.11.1: directory SRR1551071 will be checked for missed files
2021-10-13T05:29:49 prefetch.2.11.1: 1) Downloading 'SRR1551071'...
2021-10-13T05:29:49 prefetch.2.11.1: Downloading via HTTPS...
2021-10-13T07:16:40 prefetch.2.11.1: HTTPS download succeed
2021-10-13T07:16:43 prefetch.2.11.1: 'SRR1551071' is valid
2021-10-13T07:16:43 prefetch.2.11.1: 1) 'SRR1551071' was downloaded successfully
■コマンドの修正案 下記のように修正するとダウンロードとFASTQへの変換まで可能です。 (私の環境ではcondaを使用しており、fasterq-dumpのパスは通っている状態 sratoolkitもcondaでinstallした方が楽かもしれません。)
cat SRR_Acc_List.txt | while read line; do cmd=“[各自のパス(sratoolkitのバージョンも各自のものに修正必要)]/sratoolkit.2.11.1-mac64/bin/prefetch ${line}; fasterq-dump ${line}/${line}.sra; eval ${cmd}; done
参考URL: ・sratoolkitのバージョンについて https://staffblog.amelieff.jp/entry/2019/08/28/180730 参考URLではlinux版のsratoolkitを使用している。 ・conda sratoolkitについて https://anaconda.org/bioconda/sra-tools
うまくいったファイルのアウトプット
うまくいかなかったファイルのアウトプット