Closed anshrly closed 2 months ago
hi,您说的是2.1.6版本吧。-L参数是旧版本的参数,如果想保留指定数量的reads在输出文件中,需要在-c 的参数文件(比如文件名:config)中加上一行“totalReadsNum=22000000”,然后这样运行:SOAPnuke filter -c config <其他参数>。所以在您这个例子中,-L参数由于被弃用并没有生效。当然这一切的前提是过滤后的数量要大于抽取的reads数 补充下totalReadsNum参数的说明,它能在过滤后的reads中抽取指定数量存在输出文件中,这里抽取方式有两种: 1、随机抽取(默认方式) 2、抽取头部的数据(totalReadsNum=22000000head),这种方式会更快,拿到足够的数据就会结束程序。
非常感谢您的回复! 我检查了一下版本,确实是2.2.6,我输入的原始数据有41M,希望过滤后能获得22M的reads,我之后尝试了将-L 22000000参数改为-L 22000000head,过滤后的数据量可以达到22M,所以我有点困惑好像不加head -L参数约束的是输入的raw reads,加上的话是能保证获得的clean数据量是我期望的。是不是应该加不加head都可以保证数据量是我要求的,只不过加上是输入前22M条,不加是随机抽取22M条呢?
参数说明里出现-L参数,造成了误解,下次更新时会消除这个问题。正确使用方式是像上面说的:需要在-c 的参数文件(比如文件名:config)中加上一行“totalReadsNum=22000000”,您这样使用试试。
hi~我最近在用SOAPnuke.2.2.6过滤时遇到一个问题,希望得到帮助,我希望获得的clean reads >=22M,因此设置了-L参数,命令行如下
SOAPnuke.2.2.6 filter -R 41011723 -L 22000000 -f AAGTCGGAGGCCAAGCGGTCTTAGGAAGACAA -r AAGTCGGATCGTAGCCATGTCGTTCTGTGAGCCAAGGAGTTG -1 raw.1.fq.gz -2 raw.2.fq.gz -C clean_1.fq.gz -D clean_2.fq.gz -o result
期待您的回复,祝好