NetManAIOps / DejaVu

Code and datasets for FSE'22 paper "Actionable and Interpretable Fault Localization for Recurring Failures in Online Service Systems"
MIT License
73 stars 16 forks source link

关于docker镜像的一点问题 #6

Open ztc125521 opened 1 year ago

ztc125521 commented 1 year ago

pull镜像后,启动镜像,在/workspace目录下,没有.envrc文件(对应source .envrc),没有exp目录(对应python exp/run_GAT_node_classification.py),也没有data目录(对应--data_dir=./data/A1),这是出现了什么问题嘛?

1666421089879 1666421045607

ztc125521 commented 1 year ago

启动镜像命令docker run -it lizytalk/dejavu /bin/bash

lizeyan commented 1 year ago
  1. /worksapce目录需要自己挂载,需要挂载的内容是此git仓库
  2. 数据同样是需要自己下载好放到data目录
ztc125521 commented 1 year ago

感谢您的解答。在阅读文献中有一个点概念有点混淆,希望您能帮助解惑。 A feature extractor is trained to map the metrics of any failure unit of the same failure class into a fixed-width vector (unit-level feature). We train a failure extractor for each failure class, since failure units of different failure classes contain different metrics. 后一句话说为每个故障类训练特征提取器是因为不同故障单元的metrics不同。 这里的每个故障类是指db、service、os、docker组件吗还是细化到db state、 db load、 docker cpu、os disk每个组件的Group甚至是下沉到db1 state、db2 state、os1 disk、docker2 cpu这种具体到每个实际的运行组件。 期待您的回复。

lizeyan commented 1 year ago

感谢您的解答。在阅读文献中有一个点概念有点混淆,希望您能帮助解惑。 A feature extractor is trained to map the metrics of any failure unit of the same failure class into a fixed-width vector (unit-level feature). We train a failure extractor for each failure class, since failure units of different failure classes contain different metrics. 后一句话说为每个故障类训练特征提取器是因为不同故障单元的metrics不同。 这里的每个故障类是指db、service、os、docker组件吗还是细化到db state、 db load、 docker cpu、os disk每个组件的Group甚至是下沉到db1 state、db2 state、os1 disk、docker2 cpu这种具体到每个实际的运行组件。 期待您的回复。

Failure class指的是db state、 db load、 docker cpu、os disk这些。db、service、os、docker对应的概念是component class。db1 state、db2 state、os1 disk、docker2 cpu这种对应的概念是failure unit。

ztc125521 commented 1 year ago

您好,关于D原始数据集,每次注入故障时长5分钟,在这五分钟内产生的多种服务请求是随机的吗,不同故障之间的服务请求也都不相同吗?这些服务请求在注入故障后是怎么模拟的呢? 期待您的回复。

lizeyan commented 1 year ago

您好,关于D原始数据集,每次注入故障时长5分钟,在这五分钟内产生的多种服务请求是随机的吗,不同故障之间的服务请求也都不相同吗?这些服务请求在注入故障后是怎么模拟的呢? 期待您的回复。

每次故障时的流量都是随机生成的。生成流量的脚本:https://github.com/lizeyan/train-ticket/tree/master/workload

ztc125521 commented 1 year ago

您好,关于D数据集graphs文件夹有234个graph*.yml文件,而注入故障是156个,多出来的78个yml文件是根据incomplete构造的吗。

lizeyan commented 1 year ago

您好,关于D数据集graphs文件夹有234个graph*.yml文件,而注入故障是156个,多出来的78个yml文件是根据incomplete构造的吗。

多出来的忽略就好了