Open ShixiangWang opened 9 months ago
@ShixiangWang 很棒了,明后天我试试再反馈。
@ShixiangWang 很棒了,明后天我试试再反馈。
好的。我补充了下 ssh 的配置说明。
@ShixiangWang 能否增加 kill .sh的步骤。我之前的报错了,一直 kill 不完全。 ps -ef | grep "hisat2-align-s"| awk '{ print $2 }' | xargs kill -9 ps -ef | grep "bwa"| awk '{ print $2 }' | xargs kill -9 ps -ef | grep "perl"| awk '{ print $2 }' | xargs kill -9
ps -ef | grep 'EGAD00001008796_call.sh'| awk '{ print $2 }' | xargs kill -9
@JianGuoZhou3 补充在最后 QA 里面了哈。
进行该任务需要基本掌握 Linux 操作。 @JianGuoZhou3
1. 准备
~/circrna-pipeline
目录。推荐使用 VS Code,利用 Remote SSH(插件)直接连接到对应的文件目录,后续操作会更简单。成功后会看到左侧展示出 circrna-pipeline 的文件目录。建议配置 SSH config 文件,参考格式(网上自行搜索):
并可以考虑配置 SSH 免密登陆,避免每一次都要输入密码。很简单,比如针对上述的主机,在本地运行
ssh-copy-id circrna-zhou
即可(解决不了自行搜索或反馈)。/home/zhou/t12a/HRA000524/raw
/home/circrna/circrna-pipeline/run_batch_from_qc
下创建一个与队列 ID 一致的目录名,例如/home/circrna/circrna-pipeline/run_batch_from_qc/HRA000524
。这里无论用鼠标或者mkdir
都是一样的。2. 执行计算
执行计算需要分为 3 个独立的步骤,需要按顺序进行,分别对应一个 Shell 脚本。初次接触的人可以大致看下左侧栏已经处理过的队列的结构逻辑和代码。
基本都是下面这个样子,3 个 Shell 脚本以及 3 个对应的日志文件(运行 Shell 脚本会自动生成),以及一个 txt 文件,它是 QC 脚本运行后会产生的队列样本 ID 列表。
2.1. 创建脚本文件
创建上面提到的 3 个脚本文件,如果在 zhou 服务器上做计算,以
HRA000524
队列目录作为参考;如果是在 zhou2 服务器上做计算,以EGA_OAK
队列目录作参考。2.2. QC
ABC_qc.sh
文件进行编辑,修改indir
路径。替换后涉及的地方都会改变。
可以以右键或 cd 的方式进入脚本目录。
运行脚本
脚本会放到后台运行(可以关闭终端),日志文件也会生成。可以点击或者通过命令查看(命令会更新更快一些)。
2.3 检测
针对
ABC_call.sh
脚本重复上面 2.2 的 2-4 步骤。2.4 聚合结果
针对
ABC_aggr.sh
脚本重复上面 2.2 的 2-4 步骤。2.5 检查结果
最后的结果会在
/home/zhou/raid/IO_RNA/circRNA/ABC
目录下面(zhou2 服务器是/home/data/IO_RNA/circRNA/ABC
)。联系诗翔或有经验的人导出以及载入 TCCIA 数据库。3. QA
Kill 任务
有时任务存在错误配置、出错,需要 Kill 的情况,这种情况可以调用已准备的 bkill.sh 脚本(在流程代码库的主目录下面)
建议以上面的方式情况计算任务的清除。因为我们的运行目录包含队列ID,所以通过队列目录ID可以完全匹配到所有相关的计算任务。