Граждане (ну и прочие всякие), кто-нибудь знает нормальную либу (вернее проход оптимизации IR-кода, скорее всего для Polly) под LLVM, которая после некоторой доводки напильником могла бы генерить код для сопроца?
ситуация в двух словах и в понятных терминах - есть проц, есть видяха, есть OpenCL/CUDA. есть код для проца, нужно его анализировать на возможность разбивки на потоки с последующим join, выносить независимые куски в отдельные ядра и на их место подбивать код инициализации.
напильник нужен будет потому что сопроц не видяха, но так ситуация проще для понимания. тем более что кодогенераторы под видяху в теории есть. желательный уровень доводки - задать число ядер, объем памяти ядра, влепить код инициализации.
спрашиваю потому что все те что видел (тот же PPCG) нихрена не доделаны, а кодовая база выглядит так словно ее писал школьник для проекта по информатике (интерфейсы? о чем вы? все лепим прям в один файл!).