misshie / ngsdat2

NGS Data Analysis Textbook Version 2 (Disease Genome Analysis)
MIT License
42 stars 22 forks source link

P66 ./010_download-ucsc.sh 内のコマンドの誤植について #24

Open shouya00025 opened 3 years ago

shouya00025 commented 3 years ago

突然のご連絡失礼します P66 ./010_download-ucsc.sh 内のコマンドに置きまして、コマンドが u1="ftp://hgdownload.soe.ucsc.edu" となっていたのですが、正しくは u1="https://hgdownload.soe.ucsc.edu" だと思われます。私の場合、初期の状態ではhg38参照ゲノムがダウンロードされなく、上記のようにコマンドを変えることでダウンロードできるようになりました。 私のコンピュータ(MacBook Pro m1チップ搭載モデル)のみでの誤作動ならよいのですが、他の方にも支障あると思い連絡させていただきました。 ご確認のほど何卒よろしくお願いします。

NakanoTakato commented 3 years ago

失礼します。同様のエラーがこちらでも発生しておりますので、コメントさせていただきます。 以下、エラー内容の詳細です。

Mac Version 11.2.3 カレントディレクトリ /Users/ユーザー名/Analysis/ngsdat2-master/DiseaseGenomeMain

less 010_download-ucsc.sh のコマンドまでは、問題なく動いています。 ./010_download-ucsc.sh のコマンドを実行すると、 curl: (7) Failed to connect to hgdownload.soe.ucsc.edu port 21: Operation timed out tar: Error opening archive: Failed to open 'hg38.analysisSet.chroms.tar.gz' ~/Analysis/ngsdat2-master/DiseaseGenomeMain という内容のエラーが発生します。

ダウンロードしたいファイルに接続できず、タイムアウトになると解釈しましたので、shouya00025 様がURLを変更することで(正しくファイルに接続できるようになり、)問題を解決したというのは頷けます。(USCSのサイト側がURLを変更したのではないかと考えております。) ただ、ftpをhttpsに変更して、必要なデータが正しくダウンロードできて、その先のコマンド等に影響が出ないかを懸念しているため、まだhttpsに変更してコマンドの実行までには至っておりません。その辺りのコメントをいただけると非常にうれしいです。

shouya00025 commented 3 years ago

その後のコマンド等には特には影響はなかったです。 この部分についてはおそらくこのコマンドが正しいと個人的には感じました。

NakanoTakato commented 3 years ago

ありがとうございます。 とりあえず、010_download-ucsc.shのftpをhttpsに変更して先に進めてみることにしました。ここでは問題なく実行できたように思います。 ですが、030_download-dra.shで同じエラーが発生しました。(curl: (7) Failed to connect to ftp.ddbj.nig.ac.jp port 21: Operation timed out) ここでもcurl でftpに接続しようとして失敗するので、そのあたりに原因がありそうな気がします。(曖昧ですみません。。。) 先人の方達が問題なく010_download-ucsc.shや030_download-dra.shを使えているところを見ると、誤植ではなく、こちら側に問題がありそうな気がします。 また今回は030_download-dra.shのftpをhttpsに変更しても問題が解決されませんでした。 解決方法を見つけ次第ここにコメントを残そうと思います。

shouya00025 commented 3 years ago

個人的にもその点について気になり軽くではあるのですが検索をかけてみたのですが、もしかすると個人的にインストールしたウイルス対策ソフトに問題があるのかもと思いました。 ただ、データ管理やウイルスに関してどうしてそのウイルス対策ソフトをアンインストール又、無効化することはできないのでそのソフトが原因であるのかは確認できておりません。参考までに、私の考えを述べさせたいただきました。 その他、我々の不具合の原因になりうる要因が分かりましたらご教授頂けたら幸いです。 何卒よろしくお願いいたします。

NakanoTakato commented 3 years ago

ご返信ありがとうございます。 僕もウイルス対策ソフトやファイアウォールがftpを妨げている可能性があるのかと思い、ファイアウォールを解除して実行したりしたのですがそれでもうまくいきませんでした。

ただ、前回のコメントで『今回は030_download-dra.shのftpをhttpsに変更しても問題が解決されませんでした。』と書いたのですが、これは単純に僕の打ち間違いでして、 site="ftp://ftp.ddbj.nig.ac.jp" を site="https://ddbj.nig.ac.jp" に変更すれば、無事にsraファイルをダウンロードすることはできました。 根本的な解決にはなっていませんが、とりあえずこれで進めていこうと思っています。 ご教授ありがとうございました。

knakamura6222053 commented 2 years ago

突然のご連絡失礼いたします。 p66 ./010_download-ucsc.sh を実行したのですが、以下のエラーが出ました。 curl: (28) Failed to connect to hgdownload.soe.ucsc.edu port 21 after 75011 ms: Operation timed out tar: Error opening archive: Failed to open 'hg38.analysisSet.chroms.tar.gz'

上記のように、u1="https://hgdownload.soe.ucsc.edu/" スクリプトを変更したのですが、上手くいきません。 ご教授していただけると幸いです。 宜しくお願い致します。