crimson-unicorn / parsers

GNU General Public License v2.0
20 stars 19 forks source link

How does unicorn handle the DARPA TC dataset? #4

Closed jiangdie666 closed 3 days ago

jiangdie666 commented 1 year ago

I'm trying to process DARPA TC dataset now, but the text doesn't mention how the initial processing is done, can you give an idea?

dlgdwy commented 9 months ago

Have you solved the problem? I'd like to ask you something.

Win7ery commented 4 months ago

Have you solved the problem? I'd like to ask you something.

026plan commented 3 days ago

Have you solved the problem? I'd like to ask you something.你解决问题了吗?我想问你一件事。

你知道怎么处理darpa TC数据集吗?他这个标签不知道怎么界定怎么标注的

jiangdie666 commented 3 days ago

没有明确的 节点标签 ,只有报告中的文字回告诉你具体时间是否有异常

026plan commented 3 days ago

没有明确的 节点标签 ,只有报告中的文字回告诉你具体时间是否有异常

大佬,是不是根据darpa数据集中的Grund truth的pdf文档来看哪些数据正常哪些数据是攻击?但是如果是这样的话我还有个疑问:darpaTC数据集的系统日志那么多,难道是根据PDF文档去把攻击对应的系统日志根据时间信息来打标签吗?我对darpa TC数据集的标签该怎么打有点懵,能不能加个好友求教一下,可以有偿

jiangdie666 commented 3 days ago

我后续没继续看 TC 的数据集了,我就看了 E3和E5的数据集 你如果想做节点标签的话,你可以看一下 MAGIC这篇文章

026plan commented 3 days ago

我后续没继续看 TC 的数据集了,我就看了 E3和E5的数据集 你如果想做节点标签的话,你可以看一下 MAGIC这篇文章

大佬,我现在在复现unicorn的代码,卡在了DARPA tc数据集的实验上,我从谷歌云盘下的数据集没有区分正常攻击,但是我看unicorn的makefile好像他这输入又是有正常和恶意两个路径,就有点搞不明白在unicorn代码里tc数据集是怎么使用的了。 此外我好奇对TC数据集在unicorn里面是先从原始数据集按时段划分为正常和攻击的系统日志文件再构建溯源图还是怎么做的?

026plan commented 3 days ago

我后续没继续看 TC 的数据集了,我就看了 E3和E5的数据集 你如果想做节点标签的话,你可以看一下 MAGIC这篇文章

另外关于TC数据集的节点标注我找到threaTrace这个项目开源了节点标签,不过我目前不打算做节点级检测。更多是在好奇unicorn这种做法的标签是对每一个溯源图打标签还是在对什么对象进行标注

jiangdie666 commented 3 days ago

你邮箱多少

026plan commented 3 days ago

你邮箱多少

2352696056@qq.com 这是我邮箱,前面的数字也是QQ号