misshie / ngsdat2

NGS Data Analysis Textbook Version 2 (Disease Genome Analysis)
MIT License
42 stars 22 forks source link

050_run-bwa-mem.shについて #28

Open nakane-scc opened 3 years ago

nakane-scc commented 3 years ago

050のシェルスクリプトについてわからないことがあったので、質問させてください。

まず、{rg}で用いられているRead Groupの値というのは、どこに書かれているのでしょうか。

もう一点、samtoolsで使われている「-1」、「-」というオプションの意味についてもご教授いただければと思います。

よろしくお願いいたします。

misshie commented 3 years ago

issueの対応が遅くなっておりご迷惑をおかけしています。お返事の順序が前後することをお許し下さい。

p68, p83の050_run-sra-fasta-dump.shについてお答えします。

id=DRR006760 および rg="@RG\tID:${id}\tSM:${id}\tPL:illumina\tLB:${id}" の部分でBASHシェルスクリプト上の変数idおよびrgを定義しています。詳細は第2章コマンドラインの使い方などをご参照下さい。

'samtool'の使い方については、'samtools view'のみ実行してヘルプを表示するか、公式ドキュメントをご参照下さるといろいろ発見があると思います。この場合'-1'は圧縮をスピード優先で行うことを示します。また、ハイフンのみ'-'は、シェルスクリプトのパイプ機能を使って標準入力(=bwaの標準出力)を入力ファイルのかわりに使うことを指示しています。この辺もコマンドラインの使い方などが参考になると思います。