LINUX.ORG.RU

OpenACC и C++: работают ли вместе?

 ,


0

2

Для С++ вполне логично было бы использовать для хранения данных не голые массивы, а классы типа std::vector или какие-нибудь самопальные велосипеды. А вычисления над этими данными реализовывать в каком-нибудь другом классе, который будет данные доставать через методы типа operator[]. Вопрос: реально ли подобную иерархию классов/объектов протащить на GPU с помощью OpenACC? Я что-то попытался и потерпел фиаско, но я в OpenACC нуб, так что не показатель. Если кто умеет готовить OpenACC и C++, гляньте, пожалуйста, что не так с моим кодом?

#define DATASIZE 16

class Data {
  float *arr;

public:
  Data() {
    arr = new float[DATASIZE];
#pragma acc enter data copyin(this)
#pragma acc enter data create(arr[:DATASIZE])
  }

  ~Data() {
#pragma acc exit data delete(arr)
#pragma acc exit data delete(this)
    delete [] arr;
  }

  float &get(int i) { return arr[i]; }
};

class DataKeeper {
  Data a, b;

public:
  DataKeeper() {
#pragma acc enter data copyin(this)
  }

  ~DataKeeper() {
#pragma acc exit data delete(this)
  }

  void init() {
#pragma acc parallel loop
    for (int i = 0; i < DATASIZE; ++i) {
      a.get(i) = i*i;
    }
  }
};

int main() {
  DataKeeper DK;
  DK.init();
}
_T29790288_118 lives at 0x7fffb818be00 size 16 partially present
Present table dump for device[1]: NVIDIA Tesla GPU 0, compute capability 3.5, threadid=1
host:0x7fffb818be00 device:0xc05da0000 size:8 presentcount:0+1 line:11 name:_T29788448_113
host:0x7fffb818be08 device:0xc05da0200 size:8 presentcount:0+1 line:11 name:_T29788448_113
allocated block device:0xc05da0000 size:512 thread:1
allocated block device:0xc05da0200 size:512 thread:1
FATAL ERROR: variable in data clause is partially present on the device: name=_T29790288_118
 file:/home/bozhenovn/tst/test.cc _ZN10DataKeeperC1Ev line:28



Код компилится, но крешится на исполнении. И я понятия не имею не только, что произошло, но и как получить больше информации, чтобы понять, что случилось.

Буду признателен за любую помощь по делу.



Последнее исправление: yekka (всего исправлений: 1)
Ответ на: комментарий от Harald

Скажем так. У меня есть код на С++, который мне надо запихнуть на GPU с использованием OpenACC. Я бы предпочёл обойтись без копирования объектов на GPU, если OpenACC это позволяет. Вот исходный пример кода на C++, который я пытаюсь портировать:

[br]#define DATASIZE 16[br][br]class Data {[br]  float *arr;[br][br]public:[br]  Data() { arr = new float[DATASIZE]; }[br]  ~Data() { delete [] arr; }[br]  float &get(int i) { return arr[i]; }[br]};[br][br]class DataKeeper {[br]  Data a, b;[br][br]public:[br]  void init() {[br]    for (int i = 0; i < DATASIZE; ++i) {[br]      a.get(i) = i*i;[br]    }[br]  }[br]};[br][br]int main() {[br]  DataKeeper DK;[br]  DK.init();[br]}[br]


Можешь предложить, как ещё этот код можно портировать на OpenACC?

yekka
() автор топика

Без понятия, что такое OpenACC, но у std::vector есть метод data(), позволяющий невозбранно его использовать в коде, рассчитанном на сишное API.

Softwayer ★★
()

Я думаю, что директивы должны стоять в тексте и обрамлять код #pragma acc enter data // какой-то код #pragma acc exit data

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.