Есть база в которой 16000 товаров. Клиент хочет для каждой пары товаров просчитать схожесть(не спрашивайте «зачем?», я сам не знаю).
Я накидал скрипт который использует функцию similarity из постгреса и складываю результаты в отдельную таблицу. Результатов должно быть 16000х16000, амазоновский бомжеинстанс будет считать где-то неделю.
Чувствую, что занимаюсь какой-то ерундой. В общем нужен совет, как всё это лучше сделать.