lidq92 / MDTVSFA

[official] Unified Quality Assessment of In-the-Wild Videos with Mixed Datasets Training (IJCV 2021)
MIT License
83 stars 16 forks source link

运行训练代码报错 #10

Closed upupbo closed 3 years ago

upupbo commented 3 years ago

ERROR: Unexpected bus error encountered in worker. This might be caused by insufficient shared memory (shm). 查了我的docker容器默认shm是64M,请问应该改为多少G才不会报这个错

lidq92 commented 3 years ago

我没遇到过这个问题,也没改过shm, 我不清楚要改到多大才能不报错。 你可以自己在网上查一下,比如https://zhuanlan.zhihu.com/p/59271905这个的第5点建议你把Dataloader的num_workers设置为0,或者也可以建docker的时候加个参数 shmsize xxG 更改默认的shm内存到更大的值。 如果还不行,你可根据自己的实际情况按关键词在网上查一下解决方案,比如会出来https://blog.csdn.net/u013823233/article/details/101209718 http://ai.baidu.com/forum/topic/show/957544之类的

这种问题只跟你的机器使用pytorch训练的时候有关,跟具体的代码没关系,可以去看pytorch官方的解释。