metadata问题请教 - Githubissues

GengY-sdu commented 10 months ago

您好，我最近开始学习您开发的这个软件，有一些问题想向您请教一下。

ARGs-OAP的2.3版本我记得第一步就需要上传一个metadata，现在3.2这个版本两步都不自己需要上传metadata了是嘛。
之所以关注metadata，是因为我对于2.3版本上传的metadata最后一列readlength有些疑问，我的宏基因组样本里reads长度并不是一个固定的数值，一个样本里reads短到50，长至100（如图片），像这种情况readlength要怎么填写呢，填写最小值或者平均值？当然3.2版本已经不需要上传metadata了，我这种reads长度不一的样本不影响软件使用吧？
图片里的宏基因组数据是不是需要处理成您示例数据那样，就图片里的数据来说只保留名称和序列两行（@开头的行以及序列行）。多有打扰，期待您的回复，谢谢！

xinehc commented 10 months ago

Hi,

ARGs-OAP的2.3版本我记得第一步就需要上传一个metadata，现在3.2这个版本两步都不自己需要上传metadata了是嘛。

3.2版本不需要

像这种情况readlength要怎么填写呢，填写最小值或者平均值？当然3.2版本已经不需要上传metadata了，我这种reads长度不一的样本不影响软件使用吧

不影响，但stage_two现在默认至少要有25aa的alignment，也就是说短于75bp大概率不会被注释

就图片里的数据来说只保留名称和序列两行

没有必要，fastq/fasta都ok

GengY-sdu commented 10 months ago

谢谢您耐心的解答。

不影响，但stage_two现在默认至少要有25aa的alignment，也就是说短于75bp大概率不会被注释

这里如果我有的reads短于75bp，我可以通过改变stage_two的--length参数来覆盖这些短reads吧，比如我最短的reads是50bp，我设置--length 16。

xinehc commented 10 months ago

可以试一下

GengY-sdu commented 10 months ago

我试了一下，改变参数之后确实是会获得更多的结果。谢谢您的解答！

xinehc / args_oap