Все очень плохо?

0

2

Собственно есть анонимная PL/PGSQL функция которая циклится по записям N таблиц и для каждой таблицы в каждой итерации делает от 0 до M INSERT'ов или UPDATE'ов. На самом толстом тестовом наборе данных это занимает порядка 4 часов что совершенно неприемлемо. Есть ли способы заставить это работать быстрее?

~~no-dashi~~

Ссылка

←	Присваивание коллбэк функции

Qt 5.4.2: Забыли положить файл, или я чего-то не понимаю?

→

И что, ты не раскажешь даже, что конкретно делает эта функция?

tailgunner ★★★★★
(02.07.15 20:56:30 MSK)

Ответ на: комментарий от tailgunner 02.07.15 20:56:30 MSK

внутри банальная бизнес-логика которая по натуральным ключам ищет соответствия пришедшей записи с существующей записью и вставляет новую если соответствий нет плюс обходит связанные таблицы и опять таки или инсертит или обновляет связи в случае их изменения.

exception13 ★★★★★
(02.07.15 21:01:30 MSK) автор топика

Ответ на: комментарий от exception13 02.07.15 21:01:30 MSK

А проблемы с производительностью возникают из-за того, что не хватает:

а. Ресурсов ЦПУ

б. Производительности дисковой подсистемы.

(выбрать один из пунктов)

anonymous
(02.07.15 21:12:20 MSK)

Ответ на: комментарий от anonymous 02.07.15 21:12:20 MSK

IO почти 0. Проц жрат, да.

exception13 ★★★★★
(02.07.15 21:24:02 MSK) автор топика

Ссылка

Транзакции?

anonymous
(02.07.15 21:27:40 MSK)

Ответ на: комментарий от anonymous 02.07.15 21:27:40 MSK

все обернуто в одну транзакцию, да. или все или ничего.

exception13 ★★★★★
(02.07.15 21:29:28 MSK) автор топика

Ответ на: комментарий от exception13 02.07.15 21:01:30 MSK

плюс обходит связанные таблицы

Эти связи она как обходит? Джойнами или? Если джойнами, может, можно логику переделать на простые какие-то проверки...

Shadow ★★★★★
(02.07.15 21:40:01 MSK)

Ответ на: комментарий от Shadow 02.07.15 21:40:01 MSK

нет, строгая последовательность с таблицами который маппят внешний идентификатор с внутренним.

exception13 ★★★★★
(02.07.15 21:45:02 MSK) автор топика

Ссылка

1. Избавиться от циклов «for i in (select ... from tablename) loop insert ... values ...; превратив циклы в insert ... select

2. Использовать временные таблицы (они не прокатываются через журналы и т.п.) и с ними всё намного быстрее, а потом также скопом делать insert/update (см. предыдущий пункт)

~~no-dashi~~ ★★★★★
(03.07.15 07:34:59 MSK)

Ссылка

Ответ на: комментарий от exception13 02.07.15 21:29:28 MSK

все обернуто в одну транзакцию

Уже несколько лет не смотрел близко на постгрис, но раньше был такой фичебаг: статистика и план выполнения в пределах транзакции не изменялись.

То есть, если перед функцией в таблице было несколько записей, оптимизатор считал что нужно делать sequential scan, то всю функцию он его и будет делать, хоть там уже 100500 записей и нужно использовать индекс.

Deleted
(03.07.15 10:44:54 MSK)

Ссылка

была у нас такая же проблемы, хранили кучу данных, их в оракле агрегировали и записывали в другие таблички. данных было много всё это единолично работало на большом (по тем временам) сане 4-5 часов и иногда отваливалось по timeout. Пришёл клиент у которого это вообще бы не работало - переместили данные из оракла в файлики, и написали на java приложение которое грамотно эти данные обрабатывает и сохраняет в бд только то что нужно в итоге. Всё стало работать 20-25 минут и без мега загрузки базы. Возможно вам стоит поступить так же и переместить логику колбасанья данных в отдельное приложение _оптимизированное_ для работы с данными данными, а не пытаться поставить мёртвому банки.

vtVitus ★★★★★
(03.07.15 10:50:52 MSK)
Последнее исправление: vtVitus 03.07.15 10:52:53 MSK (всего исправлений: 1)