Требуется решить численно систему N обыкновенных дифференциальных уравнений первого порядка (или одно уравнение N-го порядка, что, я так понял, сводится к первому случаю). Знаю, что есть много методов, в частности метод Рунге-Кутта.
Требуется ускорить этот алгоритм при помощи CUDA (или других языков, например, OpenCL, не так важно, просто CUDA попроще, и я с ним хоть немного, а знаком).
Но проблема в том, что этот метод итерационный... для каждого последующего шага нам необходимо знать состояние предыдущего шага... то есть мы не можем выполнять шаги одновременно. А для эффективного ускорения это необходимо... Так как же это сделать? %) это вообще возможно?
Википедию и книжки по численным методам рыл - но ни одного параллельного метода решения диффуров не нашёл... они вообще есть?