Create cudnn-handle 0 非法指令 (核心已转储)

SpongeBab commented 3 years ago

/darknet detector test cfg/coco.data cfg/yolov4.cfg CUDA-version: 11000 (11000), cuDNN: 8.1.1, CUDNN_HALF=1, GPU count: 1
CUDNN_HALF=1 OpenCV version: 4.4.0 0 : compute_capability = 610, cudnn_half = 0, GPU: GeForce GTX 1070 net.optimized_memory = 0 mini_batch = 1, batch = 8, time_steps = 1, train = 0 layer filters size/strd(dil) input output 0 Create CUDA-stream - 0 Create cudnn-handle 0 非法指令 (核心已转储)

@AlexeyAB i dont know how to slove this> can you help me ? hope to your reply above is my config

SpongeBab commented 3 years ago

I guess it's same as https://github.com/AlexeyAB/darknet/issues/7153 @AlexeyAB Do you plan to solve it? or i have to downgrate my cuda and ubuntu version.cuda 10.x only support ubuntu 18.04.

SpongeBab commented 3 years ago

(base) xiaopeng@xiaopeng-HP-Z800-Workstation:~/下载/darknet$ ./darknet detector test cfg/coco.data cfg/yolov4.cfg yolov4.weights data/desk2.jpg
 CUDA-version: 11000 (11000), cuDNN: 8.1.1, GPU count: 1  
 OpenCV isn't used - data augmentation will be slow 
 0 : compute_capability = 610, cudnn_half = 0, GPU: GeForce GTX 1070 
net.optimized_memory = 0 
mini_batch = 1, batch = 8, time_steps = 1, train = 0 
   layer   filters  size/strd(dil)      input                output
   0 Create CUDA-stream - 0 
 Create cudnn-handle 0 
非法指令 (核心已转储)

and i tried with opencv 4.4.0.No help. i tried without opencv.No help. @AlexeyAB @cenit

SpongeBab commented 3 years ago

Oh。I success installing it . I can confirm that darknet does not install cuda 11.0 and above! I dowgrade my cuda and make it.

4.cfg yolov4.weights -thresh 0.25
 CUDA-version: 10010 (11000), cuDNN: 8.0.4, GPU count: 1  
 OpenCV version: 4.2.0
 0 : compute_capability = 610, cudnn_half = 0, GPU: GeForce GTX 1070 
net.optimized_memory = 0 
mini_batch = 1, batch = 8, time_steps = 1, train = 0 
   layer   filters  size/strd(dil)      input                output
   0 Create CUDA-stream - 0 
 Create cudnn-handle 0 
conv     32       3 x 3/ 1    608 x 608 x   3 ->  608 x 608 x  32 0.639 BF
   1 conv     64       3 x 3/ 2    608 x 608 x  32 ->  304 x 304 x  64 3.407 BF
   2 conv     64       1 x 1/ 1    304 x 304 x  64 ->  304 x 304 x  64 0.757 BF
   3 route  1                                  ->  304 x 304 x  64 
   4 conv     64       1 x 1/ 1    304 x 304 x  64 ->  304 x 304 x  64 0.757 BF
   5 conv     32       1 x 1/ 1    304 x 304 x  64 ->  304 x 304 x  32 0.379 BF
   6 conv     64       3 x 3/ 1    304 x 304 x  32 ->  304 x 304 x  64 3.407 BF
   7 Shortcut Layer: 4,  wt = 0, wn = 0, outputs: 304 x 304 x  64 0.006 BF
   8 conv     64       1 x 1/ 1    304 x 304 x  64 ->  304 x 304 x  64 0.757 BF
   9 route  8 2                                ->  304 x 304 x 128 
  10 conv     64       1 x 1/ 1    304 x 304 x 128 ->  304 x 304 x  64 1.514 BF
  11 conv    128       3 x 3/ 2    304 x 304 x  64 ->  152 x 152 x 128 3.407 BF
  12 conv     64       1 x 1/ 1    152 x 152 x 128 ->  152 x 152 x  64 0.379 BF
  13 route  11                                 ->  152 x 152 x 128 
  14 conv     64       1 x 1/ 1    152 x 152 x 128 ->  152 x 152 x  64 0.379 BF

cenit commented 3 years ago

can you build successfully with cuda 11 using darknet from PR #7279 ?

SpongeBab commented 3 years ago

@cenit , I haven't tried with cuda 11. now my version is :

CUDA-version: 10010 (11000), cuDNN: 8.0.4, GPU count: 1  
 OpenCV version: 4.3.0

cenit commented 3 years ago

ok closing the issue. If it will become a problem again, please re-open with details

EVNN304 commented 3 years ago

hello, but it will pass cuda 10.2 and cudnn 8.0.2?

cenit commented 3 years ago

it may work. Please try and open another issue in case you have problems, reporting all logs

EVNN304 commented 3 years ago

Heillo, found problems

CUDA-version: 10020 CUDNN_HALF=1 OpenCV version: 3.2.0 backup: Using default '/backup/' yolov4-custom 0 : compute_capability net.optimized_memory = 0 mini_batch = 1, batch layer filters size/strd(dil) 0 Create CUDA-stream - 0 Create cudnn-handle 0 conv 32 3 x 3/ 1 1 conv 64 3 x 3/ 2 2 conv 64 1 x 1/ 1 3 route 1 4 conv 64 1 x 1/ 1 5 conv 32 1 x 1/ 1 6 conv 64 3 x 3/ 1 7 Shortcut Layer: 4, 8 conv 64 1 x 1/ 1 9 route 8 2 10 conv 64 1 x 1/ 1 11 conv 128 3 x 3/ 2 12 conv 64 1 x 1/ 1 13 route 11 14 conv 64 1 x 1/ 1 15 conv 64 1 x 1/ 1 16 conv 64 3 x 3/ 1 17 Shortcut Layer: 14, 18 conv 64 1 x 1/ 1 19 conv 64 3 x 3/ 1 20 Shortcut Layer: 17, 21 conv 64 1 x 1/ 1 22 route 21 12 23 conv 128 1 x 1/ 1 24 conv 256 3 x 3/ 2 25 conv 128 1 x 1/ 1 26 route 24 27 conv 128 1 x 1/ 1 28 conv 128 1 x 1/ 1 29 conv 128 3 x 3/ 1 30 Shortcut Layer: 27, 31 conv 128 1 x 1/ 1 32 conv 128 3 x 3/ 1 33 Shortcut Layer: 30, 34 conv 128 1 x 1/ 1 35 conv 128 3 x 3/ 1 36 Shortcut Layer: 33, 37 conv 128 1 x 1/ 1 38 conv 128 3 x 3/ 1 39 Shortcut Layer: 36, 40 conv 128 1 x 1/ 1 41 conv 128 3 x 3/ 1 42 Shortcut Layer: 39, 43 conv 128 1 x 1/ 1 44 conv 128 3 x 3/ 1 45 Shortcut Layer: 42, 46 conv 128 1 x 1/ 1 47 conv 128 3 x 3/ 1 48 Shortcut Layer: 45, 49 conv 128 1 x 1/ 1 50 conv 128 3 x 3/ 1 51 Shortcut Layer: 48, 52 conv 128 1 x 1/ 1 53 route 52 25 54 conv 256 1 x 1/ 1 55 conv 512 3 x 3/ 2 56 conv 256 1 x 1/ 1 57 route 55 58 conv 256 1 x 1/ 1 59 conv 256 1 x 1/ 1 60 conv 256 3 x 3/ 1 61 Shortcut Layer: 58, 62 conv 256 1 x 1/ 1 63 conv 256 3 x 3/ 1 64 Shortcut Layer: 61, 65 conv 256 1 x 1/ 1 66 conv 256 3 x 3/ 1 67 Shortcut Layer: 64, 68 conv 256 1 x 1/ 1 69 conv 256 3 x 3/ 1 70 Shortcut Layer: 67, 71 conv 256 1 x 1/ 1 72 conv 256 3 x 3/ 1 73 Shortcut Layer: 70, 74 conv 256 1 x 1/ 1 75 conv 256 3 x 3/ 1 76 Shortcut Layer: 73, 77 conv 256 1 x 1/ 1 78 conv 256 3 x 3/ 1 79 Shortcut Layer: 76, 80 conv 256 1 x 1/ 1 81 conv 256 3 x 3/ 1 82 Shortcut Layer: 79, 83 conv 256 1 x 1/ 1 84 route 83 56 85 conv 512 1 x 1/ 1 86 conv 1024 3 x 3/ 2 87 conv 512 1 x 1/ 1 88 route 86 89 conv 512 1 x 1/ 1 90 conv 512 1 x 1/ 1 91 conv 512 3 x 3/ 1 92 Shortcut Layer: 89, 93 conv 512 1 x 1/ 1 94 conv 512 3 x 3/ 1 95 Shortcut Layer: 92, 96 conv 512 1 x 1/ 1 97 conv 512 3 x 3/ 1 98 Shortcut Layer: 95, 99 conv 512 1 x 1/ 1 100 conv 512 3 x 3/ 1 101 Shortcut Layer: 98, 102 conv 512 1 x 1/ 1 103 route 102 87 104 conv 1024 1 x 1/ 1 105 conv 512 1 x 1/ 1 106 conv 1024 3 x 3/ 1 107 conv 512 1 x 1/ 1 108 max 5x 5/ 1 109 route 107 110 max 9x 9/ 1 111 route 107 112 max 13x13/ 1 113 route 112 110 108 107 114 conv 512 1 x 1/ 1 115 conv 1024 3 x 3/ 1 116 conv 512 1 x 1/ 1 117 conv 256 1 x 1/ 1 118 upsample 119 route 85 120 conv 256 1 x 1/ 1 121 route 120 118 122 conv 256 1 x 1/ 1 123 conv 512 3 x 3/ 1 124 conv 256 1 x 1/ 1 125 conv 512 3 x 3/ 1 126 conv 256 1 x 1/ 1 127 conv 128 1 x 1/ 1 128 upsample 129 route 54 130 conv 128 1 x 1/ 1 131 route 130 128 132 conv 128 1 x 1/ 1 133 conv 256 3 x 3/ 1 134 conv 128 1 x 1/ 1 135 conv 256 3 x 3/ 1 136 conv 128 1 x 1/ 1 137 conv 256 3 x 3/ 1 138 conv 18 1 x 1/ 1 139 yolo [yolo] params: iou loss: nms_kind: greedynms 140 route 136 141 conv 256 3 x 3/ 2 142 route 141 126 143 conv 256 1 x 1/ 1 144 conv 512 3 x 3/ 1 145 conv 256 1 x 1/ 1 146 conv 512 3 x 3/ 1 147 conv 256 1 x 1/ 1 148 conv 512 3 x 3/ 1 149 conv 18 1 x 1/ 1 150 yolo [yolo] params: iou loss: nms_kind: greedynms 151 route 147 152 conv 512 3 x 3/ 2 153 route 152 116 154 conv 512 1 x 1/ 1 155 conv 1024 3 x 3/ 1 156 conv 512 1 x 1/ 1 157 conv 1024 3 x 3/ 1 158 conv 512 1 x 1/ 1 159 conv 1024 3 x 3/ 1 160 conv 18 1 x 1/ 1 161 yolo [yolo] params: iou loss: nms_kind: greedynms Total BFLOPS 59.563 avg_outputs = 489778 Allocate additional Loading weights from yolov4.conv.137... seen 64, trained: 0 Done! Loaded 137 layers Learning Rate: 0.001, Detection layer: 139 - type = 28 Detection layer: 150 - type = 28 Detection layer: 161 - type = 28 (11030), cuDNN: 8.0.2, CUDNN_HALF=1, GPU count: 1
= 610, cudnn_half = 0, GPU: NVIDIA GeForce GTX 1060 6GB = 64, time_steps = 1, train = 1 input output 416 x 416 x 3 -> 416 x 416 x 32 0.299 BF 416 x 416 x 32 -> 208 x 208 x 64 1.595 BF 208 x 208 x 64 -> 208 x 208 x 64 0.354 BF -> 208 x 208 x 64 208 x 208 x 64 -> 208 x 208 x 64 0.354 BF 208 x 208 x 64 -> 208 x 208 x 32 0.177 BF 208 x 208 x 32 -> 208 x 208 x 64 1.595 BF wt = 0, wn = 0, outputs: 208 x 208 x 64 0.003 BF 208 x 208 x 64 -> 208 x 208 x 64 0.354 BF -> 208 x 208 x 128 208 x 208 x 128 -> 208 x 208 x 64 0.709 BF 208 x 208 x 64 -> 104 x 104 x 128 1.595 BF 104 x 104 x 128 -> 104 x 104 x 64 0.177 BF -> 104 x 104 x 128 104 x 104 x 128 -> 104 x 104 x 64 0.177 BF 104 x 104 x 64 -> 104 x 104 x 64 0.089 BF 104 x 104 x 64 -> 104 x 104 x 64 0.797 BF wt = 0, wn = 0, outputs: 104 x 104 x 64 0.001 BF 104 x 104 x 64 -> 104 x 104 x 64 0.089 BF 104 x 104 x 64 -> 104 x 104 x 64 0.797 BF wt = 0, wn = 0, outputs: 104 x 104 x 64 0.001 BF 104 x 104 x 64 -> 104 x 104 x 64 0.089 BF -> 104 x 104 x 128 104 x 104 x 128 -> 104 x 104 x 128 0.354 BF 104 x 104 x 128 -> 52 x 52 x 256 1.595 BF 52 x 52 x 256 -> 52 x 52 x 128 0.177 BF -> 52 x 52 x 256 52 x 52 x 256 -> 52 x 52 x 128 0.177 BF 52 x 52 x 128 -> 52 x 52 x 128 0.089 BF 52 x 52 x 128 -> 52 x 52 x 128 0.797 BF wt = 0, wn = 0, outputs: 52 x 52 x 128 0.000 BF 52 x 52 x 128 -> 52 x 52 x 128 0.089 BF 52 x 52 x 128 -> 52 x 52 x 128 0.797 BF wt = 0, wn = 0, outputs: 52 x 52 x 128 0.000 BF 52 x 52 x 128 -> 52 x 52 x 128 0.089 BF 52 x 52 x 128 -> 52 x 52 x 128 0.797 BF wt = 0, wn = 0, outputs: 52 x 52 x 128 0.000 BF 52 x 52 x 128 -> 52 x 52 x 128 0.089 BF 52 x 52 x 128 -> 52 x 52 x 128 0.797 BF wt = 0, wn = 0, outputs: 52 x 52 x 128 0.000 BF 52 x 52 x 128 -> 52 x 52 x 128 0.089 BF 52 x 52 x 128 -> 52 x 52 x 128 0.797 BF wt = 0, wn = 0, outputs: 52 x 52 x 128 0.000 BF 52 x 52 x 128 -> 52 x 52 x 128 0.089 BF 52 x 52 x 128 -> 52 x 52 x 128 0.797 BF wt = 0, wn = 0, outputs: 52 x 52 x 128 0.000 BF 52 x 52 x 128 -> 52 x 52 x 128 0.089 BF 52 x 52 x 128 -> 52 x 52 x 128 0.797 BF wt = 0, wn = 0, outputs: 52 x 52 x 128 0.000 BF 52 x 52 x 128 -> 52 x 52 x 128 0.089 BF 52 x 52 x 128 -> 52 x 52 x 128 0.797 BF wt = 0, wn = 0, outputs: 52 x 52 x 128 0.000 BF 52 x 52 x 128 -> 52 x 52 x 128 0.089 BF -> 52 x 52 x 256 52 x 52 x 256 -> 52 x 52 x 256 0.354 BF 52 x 52 x 256 -> 26 x 26 x 512 1.595 BF 26 x 26 x 512 -> 26 x 26 x 256 0.177 BF -> 26 x 26 x 512 26 x 26 x 512 -> 26 x 26 x 256 0.177 BF 26 x 26 x 256 -> 26 x 26 x 256 0.089 BF 26 x 26 x 256 -> 26 x 26 x 256 0.797 BF wt = 0, wn = 0, outputs: 26 x 26 x 256 0.000 BF 26 x 26 x 256 -> 26 x 26 x 256 0.089 BF 26 x 26 x 256 -> 26 x 26 x 256 0.797 BF wt = 0, wn = 0, outputs: 26 x 26 x 256 0.000 BF 26 x 26 x 256 -> 26 x 26 x 256 0.089 BF 26 x 26 x 256 -> 26 x 26 x 256 0.797 BF wt = 0, wn = 0, outputs: 26 x 26 x 256 0.000 BF 26 x 26 x 256 -> 26 x 26 x 256 0.089 BF 26 x 26 x 256 -> 26 x 26 x 256 0.797 BF wt = 0, wn = 0, outputs: 26 x 26 x 256 0.000 BF 26 x 26 x 256 -> 26 x 26 x 256 0.089 BF 26 x 26 x 256 -> 26 x 26 x 256 0.797 BF wt = 0, wn = 0, outputs: 26 x 26 x 256 0.000 BF 26 x 26 x 256 -> 26 x 26 x 256 0.089 BF 26 x 26 x 256 -> 26 x 26 x 256 0.797 BF wt = 0, wn = 0, outputs: 26 x 26 x 256 0.000 BF 26 x 26 x 256 -> 26 x 26 x 256 0.089 BF 26 x 26 x 256 -> 26 x 26 x 256 0.797 BF wt = 0, wn = 0, outputs: 26 x 26 x 256 0.000 BF 26 x 26 x 256 -> 26 x 26 x 256 0.089 BF 26 x 26 x 256 -> 26 x 26 x 256 0.797 BF wt = 0, wn = 0, outputs: 26 x 26 x 256 0.000 BF 26 x 26 x 256 -> 26 x 26 x 256 0.089 BF -> 26 x 26 x 512 26 x 26 x 512 -> 26 x 26 x 512 0.354 BF 26 x 26 x 512 -> 13 x 13 x1024 1.595 BF 13 x 13 x1024 -> 13 x 13 x 512 0.177 BF -> 13 x 13 x1024 13 x 13 x1024 -> 13 x 13 x 512 0.177 BF 13 x 13 x 512 -> 13 x 13 x 512 0.089 BF 13 x 13 x 512 -> 13 x 13 x 512 0.797 BF wt = 0, wn = 0, outputs: 13 x 13 x 512 0.000 BF 13 x 13 x 512 -> 13 x 13 x 512 0.089 BF 13 x 13 x 512 -> 13 x 13 x 512 0.797 BF wt = 0, wn = 0, outputs: 13 x 13 x 512 0.000 BF 13 x 13 x 512 -> 13 x 13 x 512 0.089 BF 13 x 13 x 512 -> 13 x 13 x 512 0.797 BF wt = 0, wn = 0, outputs: 13 x 13 x 512 0.000 BF 13 x 13 x 512 -> 13 x 13 x 512 0.089 BF 13 x 13 x 512 -> 13 x 13 x 512 0.797 BF wt = 0, wn = 0, outputs: 13 x 13 x 512 0.000 BF 13 x 13 x 512 -> 13 x 13 x 512 0.089 BF -> 13 x 13 x1024 13 x 13 x1024 -> 13 x 13 x1024 0.354 BF 13 x 13 x1024 -> 13 x 13 x 512 0.177 BF 13 x 13 x 512 -> 13 x 13 x1024 1.595 BF 13 x 13 x1024 -> 13 x 13 x 512 0.177 BF 13 x 13 x 512 -> 13 x 13 x 512 0.002 BF -> 13 x 13 x 512 13 x 13 x 512 -> 13 x 13 x 512 0.007 BF -> 13 x 13 x 512 13 x 13 x 512 -> 13 x 13 x 512 0.015 BF -> 13 x 13 x2048 13 x 13 x2048 -> 13 x 13 x 512 0.354 BF 13 x 13 x 512 -> 13 x 13 x1024 1.595 BF 13 x 13 x1024 -> 13 x 13 x 512 0.177 BF 13 x 13 x 512 -> 13 x 13 x 256 0.044 BF 2x 13 x 13 x 256 -> 26 x 26 x 256 -> 26 x 26 x 512 26 x 26 x 512 -> 26 x 26 x 256 0.177 BF -> 26 x 26 x 512 26 x 26 x 512 -> 26 x 26 x 256 0.177 BF 26 x 26 x 256 -> 26 x 26 x 512 1.595 BF 26 x 26 x 512 -> 26 x 26 x 256 0.177 BF 26 x 26 x 256 -> 26 x 26 x 512 1.595 BF 26 x 26 x 512 -> 26 x 26 x 256 0.177 BF 26 x 26 x 256 -> 26 x 26 x 128 0.044 BF 2x 26 x 26 x 128 -> 52 x 52 x 128 -> 52 x 52 x 256 52 x 52 x 256 -> 52 x 52 x 128 0.177 BF -> 52 x 52 x 256 52 x 52 x 256 -> 52 x 52 x 128 0.177 BF 52 x 52 x 128 -> 52 x 52 x 256 1.595 BF 52 x 52 x 256 -> 52 x 52 x 128 0.177 BF 52 x 52 x 128 -> 52 x 52 x 256 1.595 BF 52 x 52 x 256 -> 52 x 52 x 128 0.177 BF 52 x 52 x 128 -> 52 x 52 x 256 1.595 BF 52 x 52 x 256 -> 52 x 52 x 18 0.025 BF ciou (4), iou_norm: 0.07, obj_norm: 1.00, cls_norm: 1.00, delta_norm: 1.00, scale_x_y: 1.20 (1), beta = 0.600000 -> 52 x 52 x 128 52 x 52 x 128 -> 26 x 26 x 256 0.399 BF -> 26 x 26 x 512 26 x 26 x 512 -> 26 x 26 x 256 0.177 BF 26 x 26 x 256 -> 26 x 26 x 512 1.595 BF 26 x 26 x 512 -> 26 x 26 x 256 0.177 BF 26 x 26 x 256 -> 26 x 26 x 512 1.595 BF 26 x 26 x 512 -> 26 x 26 x 256 0.177 BF 26 x 26 x 256 -> 26 x 26 x 512 1.595 BF 26 x 26 x 512 -> 26 x 26 x 18 0.012 BF ciou (4), iou_norm: 0.07, obj_norm: 1.00, cls_norm: 1.00, delta_norm: 1.00, scale_x_y: 1.10 (1), beta = 0.600000 -> 26 x 26 x 256 26 x 26 x 256 -> 13 x 13 x 512 0.399 BF -> 13 x 13 x1024 13 x 13 x1024 -> 13 x 13 x 512 0.177 BF 13 x 13 x 512 -> 13 x 13 x1024 1.595 BF 13 x 13 x1024 -> 13 x 13 x 512 0.177 BF 13 x 13 x 512 -> 13 x 13 x1024 1.595 BF 13 x 13 x1024 -> 13 x 13 x 512 0.177 BF 13 x 13 x 512 -> 13 x 13 x1024 1.595 BF 13 x 13 x1024 -> 13 x 13 x 18 0.006 BF ciou (4), iou_norm: 0.07, obj_norm: 1.00, cls_norm: 1.00, delta_norm: 1.00, scale_x_y: 1.05 (1), beta = 0.600000 workspace_size = 54.53 MB K-images (0 Kilo-batches_64) from weights-file Momentum: 0.949, Decay: 0.0005

AlexeyAB / darknet

Create cudnn-handle 0 非法指令 (核心已转储) #7531