Всем доброго времени суток! Давно тут не писал/не спрашивал, но помню, что тут много умных людей. Собственно вопрос. Дано: Windows(пардон), OpenCV master + TBB (собрано из сорсов), Visual Studio 2015 Community. Для самодельной ANPR юзаю уже обученный каскад Хаара из примеров самого OpenCV. Вся беда в том, что меня смущает конское время обработки кадра (640*480) в 130-170мс одним только каскадом. Очень долго. Как я понял, реализация каскадов в OpenCV не умеет cuda/opencl, только через tbb можно устроить распараллеливание (работает, грузит 2-3 ядра вместо одного, если считать по процентам загрузки core i5, но выигрыш от этого 40мс от силы). Код написан с поддержкой TAPI (функции обработки изображения типа фильтров Кэнни и т.д. дают прирост в разы). Вот примерно так все юзается.
UMat _Frame;
// Инициализация _Frame из видеопотока идет в цикле
CascadeClassifier _HAAR = CascadeClassifier("haarcascade_russian_plate_number.xml");
vector<Rect> _Rects;
// начало замера времени
_HAAR.detectMultiScale(_Frame, _Rects);
// конец замера времени