misshie / ngsdat2

NGS Data Analysis Textbook Version 2 (Disease Genome Analysis)
MIT License
42 stars 22 forks source link

080_download-gatk-bundlesのバリエーションデータについて #29

Open nakane-scc opened 3 years ago

nakane-scc commented 3 years ago

080_download-gatk-bundles.shを見ると、ftp://gsapubftp-anonymous@ftp.broadinstitute.org/bundle/hg38からデータファイルをDLするようですが、サイトにアクセスできません。

下記サイトを見ると、Grch38/hg38 referenceはGoogleクラウドに移されたように思えます。 https://gatk.broadinstitute.org/hc/en-us/articles/360035890811-Resource-bundle

そこで、サイトにアクセスしてみたところ、 Mills_and_1000G_gold_standard.indels.hg38.vcf.gz Mills_and_1000G_gold_standard.indels.hg38.vcf.gz.tbi はあったのですが、次の2つのファイルが見つかりません。 dbsnp_146.hg38.vcf.gz dbsnp_146.hg38.vcf.gz.tbi

ご確認と対応方法をご教授いただければ幸いです。

misshie commented 3 years ago

まず、issueへの対応が大幅に遅くなっていることをお詫びします。順次すすめていきます。また、お返事・対応の順番が前後することをお許し下さい。

p71の080_download-gatk-bundles.sh の件について。

いろいろパブリックデータの場所が変化することもあり、完全に対応がむずかしくなっています。とくにGATK関連は体制がかわるごとに変化が激しいようです。

提示戴いたGATKのページ中程にある”Owned by the Broad Institute"以下のリンク gcp-public-data--broad-references に行きますと、hg38/v0ディレクトリ以下にHomo_sapiens_assembly38.dbsnp138.vcf.gz*.tbiファイルがあります。dbSNPのバージョンは下がってしまいますが、これで代用できないでしょうか?

実際にはお手元のコンピューターへのダウンロードど、スクリプト内のファイル名の書き換えが必要になると思います。

nakane-scc commented 3 years ago

回答ありがとうございます。

アドバイスいただきました通り、Homo_sapiens_assembly38.dbsnp138.vcf.gzをDLし、090を実行した後、#19の質問に対する回答にあったように、gatk-4.1.2.0をDLしなおして100を実行いたしました。 ところが、#19の方と同じエラーが出て、処理が進みません。 ご多用とは存じますが、アドバイスをいただければ幸いです。

Exception in thread "main" java.lang.IncompatibleClassChangeError: Inconsistent constant pool data in classfile for class org/broadinstitute/hellbender/transformers/ReadTransformer. Method 'org.broadinstitute.hellbender.utils.read.GATKRead lambda$identity$d67512bf$1(org.broadinstitute.hellbender.utils.read.GATKRead)' at index 65 is CONSTANT_MethodRef and should be CONSTANT_InterfaceMethodRef at org.broadinstitute.hellbender.transformers.ReadTransformer.identity(ReadTransformer.java:30) at org.broadinstitute.hellbender.engine.GATKTool.makePreReadFilterTransformer(GATKTool.java:345) at org.broadinstitute.hellbender.engine.GATKTool.getTransformedReadStream(GATKTool.java:374) at org.broadinstitute.hellbender.engine.ReadWalker.traverse(ReadWalker.java:93) at org.broadinstitute.hellbender.engine.GATKTool.doWork(GATKTool.java:1039) at org.broadinstitute.hellbender.cmdline.CommandLineProgram.runTool(CommandLineProgram.java:139) at org.broadinstitute.hellbender.cmdline.CommandLineProgram.instanceMainPostParseArgs(CommandLineProgram.java:191) at org.broadinstitute.hellbender.cmdline.CommandLineProgram.instanceMain(CommandLineProgram.java:210) at org.broadinstitute.hellbender.Main.runCommandLineProgram(Main.java:162) at org.broadinstitute.hellbender.Main.mainEntry(Main.java:205) at org.broadinstitute.hellbender.Main.main(Main.java:291)

nakane-scc commented 3 years ago

gatk-4.1.2.0をgatk-4.2.0.0にしたら、動き始めました。これで様子を見てみたいと思います。