Скажем есть заданное множество типа short, которое нужно сравнить с другими множествами (порядка 1_000_000). В каждом множестве примерно 1000 записей. Размеры множеств не равны.
В результате сравнения заданного множества со всеми другими, нужно получить проценты совпадения значений для заданного множества. Т.е. каждое значение заданного множества нужно прогнать по значениям другого множества. Если множество меньше заданного, то его выбрасываем из сравнения. Значения в множествах не упорядочены.
Вопрос собственно в том - на GPU или CPU (какой-нибудь современный доступный Xeon) это делать? И нужно ли использовать какие-нибудь интринсики или компилятор GCC сам всё оптимизирует?
По идее нужно на джаве, но можно вынести эту часть на Си, если JIT не сможет заоптимизировать...