LINUX.ORG.RU

Медленная сортировка больших файлов


0

2

Есть брутальные словари 4-6G
Если сортировать, используя sort, то затрачивается много времени, к примеру на словарь в 1G уходит

real 5m26.229s
user 10m27.864s
sys 0m3.760s


на словарь в 5G

real 17m53.584s
user 28m58.164s
sys 0m15.728s


не подскажите ли способ сортировки побыстрее?
Большое спасибо!


Способ называется «база данных».

anonymous
()

как вариант напиши свой qsort, у меня он работал быстрее дефолтного qsort в с++

abs ★★★
()

помню ещё где-то была статья как ускорить бинарный поиск убирая потери кеш-промахов, может это подойдет и для сортировки

abs ★★★
()

Осспаде. Ну зачем тебе сортировать файлы каждые пять минут? Это ведь разовая задача, да? Какая тогда разница сколько они сортироваться будут? Тем более, что приведённые тобой цифры ещё ничего. Я запускал сортировки, которые оставлял на выходные.

ziemin ★★
()
Ответ на: комментарий от zolden

Словари создаю по неким правилам, их много, затем я их сравниваю и удаляю совпадающие строки, для дальнейшего использования.
Без сортировки не обойтись.
Задача отнюдь не разовая.

serles
() автор топика
Ответ на: комментарий от zolden

Спасибо большое!
так получается гораздо быстрее:

real 1m5.600s
user 1m33.008s
sys 0m3.192s

serles
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.