Оптимизация вычисления большой матрицы расстояний

0

3

Добрый вечер! У меня есть объемный массив (около 30 тысяч элементов), и метрика между любыми элементами. Мне необходимо посчитать матрицу расстояний (достаточно треугольной), даже если это займет много памяти.

Сейчас используется следующий код:

distance_matrix = np.ndarray((len(foo),len(foo)))
for i, bar1 in enumerate(foo):
    for j, bar2 in enumerate(foo[i+1:]):
        distance_matrix[i,j] = hight_level_python_function(bar1, bar2)

И работает он очень долго, даже если разбивать матрицу на несколько, и считать каждую в отдельном процессе. На низкоуровневых языках переписать метрику необоснованно трудозатратно. Кеш на hight_level_python_function уже есть.

Как быть?

Ссылка

←	Кто зажал spinlock?

anaconda, PATH, ubuntu.

→

← 1 2 →

Ответ на: комментарий от ZERG 17.07.16 11:49:34 MSK

Есть сравнения?

от диванного аналитика коих тут почти все сравнений не жди
а вот полезная ссылочка:
http://stackoverflow.com/questions/146159/is-fortran-faster-than-c

reprimand ★★★★★
(17.07.16 15:28:00 MSK)

А сколько времени считается табличка для 1024 элементов ? (т.е. ((2*10)**2)/2=«пол_лимона» вызовов )

anonymous
(17.07.16 16:52:32 MSK)

Ссылка

Ответ на: комментарий от reprimand 17.07.16 15:28:00 MSK

Что должна доказывать эта ссылочка? Большинство по ней как раз высказывается в пользу того, что Фортран немного быстрее. Другая часть говорит о некорректности сравнения. А диванные аналитики это те, кто предлагают всё переписать на Си. Попробуй переписать на Си матричное умножение в numpy. Даже такой тормоз как Матлаб делает матричное умножение со скоростью Си по причине того, что и он, и Си, и numpy используют одну и ту же фортрановскую библиотеку.

Bell
(17.07.16 17:10:05 MSK)