ALTree / PLISCuda

PLIS on CUDA
MIT License
1 stars 0 forks source link

Investigate initcheck failure with odd number of subvolumes #54

Closed ALTree closed 8 years ago

ALTree commented 8 years ago

cuda-memcheck --tool initcheck --log-file mcheck.out path/to/pliscuda conf.txt

Pare che l'ultimo accesso (es. thread 40 per sistema 41x1x1 sia segnalato come erroneo, i.e. ad area non inizializzata); l'errore scompare se in fase di allocazione viene riservata una sezione lunga (sbc+1) * sizeof(int).

ALTree commented 8 years ago

diff-41

========= CUDA-MEMCHECK
========= Uninitialized __global__ memory read of size 4
=========     at 0x00000650 in /galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/src/rates.cu:102:compute_rates(i$
=========     by thread (40,0,0) in block (0,0,0)
=========     Address 0x2304aa12a0
=========     Saved host backtrace up to driver entry point
=========     Host Frame:/lib64/libcuda.so.1 (cuLaunchKernel + 0x2cd) [0x15865d]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x449c1]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x5f1d3]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x579a]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x5690]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x56d6]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x7a1c]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x2af95]
=========     Host Frame:/lib64/libc.so.6 (__libc_start_main + 0xf5) [0x21b15]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x4a69]
=========
========= Uninitialized __global__ memory read of size 4
=========     at 0x000007e8 in /galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/src/rates.cu:103:compute_rates(i$
=========     by thread (40,0,0) in block (0,0,0)
=========     Address 0x2304aa12a0
=========     Saved host backtrace up to driver entry point
=========     Host Frame:/lib64/libcuda.so.1 (cuLaunchKernel + 0x2cd) [0x15865d]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x449c1]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x5f1d3]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x579a]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x5690]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x56d6]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x7a1c]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x2af95]
=========     Host Frame:/lib64/libc.so.6 (__libc_start_main + 0xf5) [0x21b15]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x4a69]
=========
========= Uninitialized __global__ memory read of size 4
=========     at 0x00000f98 in /galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/src/rates.cu:37:react_rate(int*,$
=========     by thread (40,0,0) in block (0,0,0)
=========     Address 0x2304aa00a0
=========     Device Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/src/rates.cu:48:react_rates(int*, s_$
=========     Device Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/src/rates.cu:106:compute_rates(int*,$
=========     Saved host backtrace up to driver entry point
=========     Host Frame:/lib64/libcuda.so.1 (cuLaunchKernel + 0x2cd) [0x15865d]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x449c1]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x5f1d3]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x579a]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x5690]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x56d6]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x7a1c]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x2af95]
=========     Host Frame:/lib64/libc.so.6 (__libc_start_main + 0xf5) [0x21b15]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x4a69]
=========

e anche (x100)

========= Host API memory access error at host access to 0x2304aa1800 of size 164 bytes
=========     Uninitialized access at 0x2304aa18a0 on access by cudaMemcopy source.
=========     Saved host backtrace up to driver entry point at error
=========     Host Frame:/lib64/libcuda.so.1 (cuMemcpyAsync + 0x1b9) [0x156319]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x5e82d]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x3821b]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x73a86]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0xd5d4]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x181c5]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x16e11]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x15b47]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x1491f]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x13cd8]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x12e89]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x123db]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x11777]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x10dce]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x103de]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0xfb06]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0xf2eb]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0xea52]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0xde6b]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x7c07]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x2af95]
=========     Host Frame:/lib64/libc.so.6 (__libc_start_main + 0xf5) [0x21b15]
=========     Host Frame:/galileo/home/userinternal/adonizet/progetto-PLISCuda/PLISCuda/PLISCuda/pliscuda [0x4a69]
=========     
ALTree commented 8 years ago

Il secondo è causato da h_get_min_tau, che però fore può essere eliminato (vedere #24).

ALTree commented 8 years ago

Tutti gli errori

Uninitialized access at 0x2304aa18a0 on access by cudaMemcopy source

sembrano essere causati internamente da thrust.