Open liuxukun2000 opened 2 years ago
测评机不再接收新的任务,且已经开始运行的任务不论进行到哪个阶段都会莫名停止运行。一段时间后触发硬中断导致worker进程被 强行kill并重启。重启后的进程仍会卡在沙箱调用时。
worker
增大测评机数量,选择任意一道题目进行重测。
celery
NFS
目前已经对测评机数量与worker数量进行测试,结果如下:
与上学期的区别为:
会不会是内存用完了?
目前看起来应该不是,第一是测评机内存非常大,第二是我用top检查了一下,cpu占用率很低,内存也没用太多。非常奇怪。
表现
测评机不再接收新的任务,且已经开始运行的任务不论进行到哪个阶段都会莫名停止运行。一段时间后触发硬中断导致
worker
进程被 强行kill并重启。重启后的进程仍会卡在沙箱调用时。复现步骤
增大测评机数量,选择任意一道题目进行重测。
原因分析
celery
文档与搜索引擎,未发现符合此问题的错误报告。NFS
卡死导致无法读取输入。(未有相关报告)目前已经对测评机数量与worker数量进行测试,结果如下:
与上学期的区别为: