zeratax / yacx

Yet Another CudaExecutor - wrapper to easily compile and execute cuda kernels
https://zeratax.github.io/yacx
MIT License
8 stars 4 forks source link

Fast kernel example&transposition pinnend #151

Closed LukasSiefke closed 4 years ago

LukasSiefke commented 4 years ago

Das ist das gleiche nur mit PinnendMemory. Bin mir aber nicht sicher, ob das so in den Master soll, wenn immer PinnendMemory benutzt wird, weil das ja theoretisch nicht immer so gut ist, wenn man so viel PinnendMemory benutzt. Ich würde es aber trotzedem mergen, weils auf dem Palma (und Agamemnon) immer ziemlich problemlos geklappt hat auch mit größeren Datengrößen