xinehc / args_oap

ARGs-OAP: Online Analysis Pipeline for Antibiotic Resistance Genes Detection from Metagenomic Data Using an Integrated Structured ARG Database
MIT License
43 stars 11 forks source link

metadata问题请教 #52

Open GengY-sdu opened 10 months ago

GengY-sdu commented 10 months ago

您好,我最近开始学习您开发的这个软件,有一些问题想向您请教一下。

  1. ARGs-OAP的2.3版本我记得第一步就需要上传一个metadata,现在3.2这个版本两步都不自己需要上传metadata了是嘛。
  2. 之所以关注metadata,是因为我对于2.3版本上传的metadata最后一列readlength有些疑问,我的宏基因组样本里reads长度并不是一个固定的数值,一个样本里reads短到50,长至100(如图片),像这种情况readlength要怎么填写呢,填写最小值或者平均值?当然3.2版本已经不需要上传metadata了,我这种reads长度不一的样本不影响软件使用吧?
  3. 图片里的宏基因组数据是不是需要处理成您示例数据那样,就图片里的数据来说只保留名称和序列两行(@开头的行以及序列行)。 多有打扰,期待您的回复,谢谢! ba56b144e1d10dcf5137b3921201433
xinehc commented 10 months ago

Hi,

ARGs-OAP的2.3版本我记得第一步就需要上传一个metadata,现在3.2这个版本两步都不自己需要上传metadata了是嘛。

3.2版本不需要

像这种情况readlength要怎么填写呢,填写最小值或者平均值?当然3.2版本已经不需要上传metadata了,我这种reads长度不一的样本不影响软件使用吧

不影响,但stage_two现在默认至少要有25aa的alignment,也就是说短于75bp大概率不会被注释

就图片里的数据来说只保留名称和序列两行

没有必要,fastq/fasta都ok

GengY-sdu commented 10 months ago

谢谢您耐心的解答。

不影响,但stage_two现在默认至少要有25aa的alignment,也就是说短于75bp大概率不会被注释

这里如果我有的reads短于75bp,我可以通过改变stage_two的--length参数来覆盖这些短reads吧,比如我最短的reads是50bp,我设置--length 16。

xinehc commented 10 months ago

可以试一下

GengY-sdu commented 10 months ago

我试了一下,改变参数之后确实是会获得更多的结果。 谢谢您的解答!