-
## 环境
1.系统环境:win10 + 1660ti + cuda 11.1
2.MegEngine版本: 1.4.0
3.python版本: 3.7
## 复现步骤
连续训练两次, 都是在训练过程中卡死了 , 没有任何错误打印提示, cpu和内存都没有释放, gpu 内存还有很多余量, 内存也有大部分余量
## 请提供关键的代码片段便于追查问题
a = U…
-
With pydata theme v0.5 that is still used for MegEngine [doc](https://github.com/MegEngine/Documentation):
![image](https://user-images.githubusercontent.com/21091736/118764586-541cee80-b8ac-11eb-9…
-
请问有没有win10部署教程?
-
## 背景
## 任务描述
## 目标
-
已将该问题移动到 MegEngine 主存储库。 cc @lijiansong
https://github.com/MegEngine/Documentation/pull/148#commitcomment-50120715
-
## 环境
1.系统环境:ubuntu 18.04
2.MegEngine版本:1.2.0
3.python版本:3.6.3
## 请提供关键的代码片段便于追查问题
```python3
#!/usr/bin/env python3
from typing import Iterable
import numpy as np
import megengine as mge
…
-
您好,我在win10、RTX 3060 、cuda11.1、pytorch官网对应pytorch(1.9+cuda111)调试失败,因为deepspeed(0.3.16)没有添加到环境变量,CMD deepspeed的时候就报错deepspeed不是可用命令。
然后我下载了ubuntu 20.04、cuda11.1+pytorch对应的linux版本,同样出现错误,这次是找不cuda某个dll,…
NLPIG updated
3 years ago
-
https://github.com/MegEngine/Models/blob/e0908675d028f9803fed88828e1304d8db9706f4/official/vision/classification/resnet/train.py#L110
python自带的多进程在进程退出的时候会有一些问题,有时候会出现训练退出卡住的情况,
`distributed`对它做了一…
-
### Project
megengine https://pypi.org/project/MegEngine
### Does this project already exist?
- [X] Yes
### Size of release/project
950MB
### Which indexes
PyPI, TestPyPI
### Reasons for the r…
-
## 背景
在训练FPN的过程中存在很多的数组索引,定义的检测模型文件是可以跑起来的,但是在训练过程中总是回出现warning文件,样子很不美观:
## 任务描述
20 20:03:40[mgb] WRN indexing_multi_axis_vec(device_value[746096494])[746096498]{IndexingMultiAxisVec}:…