Повторное использование массива в глобальной памяти в CUDA
Добрый день! Есть проблема.
Я выделяю память под результат вычислений. err = cudaMalloc((void**)&nor.d_tdel,szTdelb);
где szTdelb: размер выделяемой памяти.
Затем последовательно выполняются 2 kernels:
d_normaAnew <« curgrsz, nor.blksz, szShMem, *stream»>(igrA, gdmnBeg, grM, grN, nor.d_tdel);
и
d_normaABnew <« nor.blks, nor.blksz, szShMem»>(nor.d_mn, M, N, nor.d_tdel);
И там и там я указываю на одно и тоже место в памяти nor.d_tdel.
Проблема: печать nor.d_tdel в конце d_normaAnew содержит правильные данные, а в начале d_normaABnew я получаю одни нули.
В чем может быть причина?