LINUX.ORG.RU

Какой архиватор сейчас самый быстрый?


0

2

Сабж. Давно не следил за их развитием. Существует ли сейчас что-либо существенно быстрее, чем 7-zip, работающий с архивами ZIP? 32-разрядные.

Скорость упаковки важна, скорость распаковки важнее. Степень сжатия не особо важна. Поэтому я счёл формат ZIP целесообразнее 7Z.

Если интересны подробности. Нужно сжимать-разжимать образы виртуальных машин VMware. Объём — от 3 до 30 гигабайт. Пользоваться снапшотами или другим эмулятором нет возможности.

Естественно, желательны открыто-свободные программы. Или хотя бы как unrar.

Помнится, какой-то автор хвастался своим распаковщиком, который распаковывал файл быстрее, чем шло копирование несжатого файла — за счёт меньшего времени на чтение с диска. Такой существует?

Заранее спасибо.

★★★★★
Ответ на: комментарий от bhfq

lzo не самый быстрый? а squashfs? короче хз, кастую сравнительные тесты с фороникса :)

adriano32 ★★★
()
Ответ на: комментарий от anTaRes

+ минитест (1000M .img, 2x core):

$ time lzma -1 Linux.img 
real	0m29.077s
user	0m27.831s
sys	0m1.191s

$ time lzma -d Linux.img.lzma 
real	0m3.964s
user	0m3.945s
sys	0m0.004s

$ time pbzip2 -1 Linux.img 
real	0m15.728s
user	0m26.561s
sys	0m2.087s

$ time pbunzip2 Linux.img.bz2 
real	0m24.031s
user	0m6.023s
sys	0m1.549s

anTaRes ★★★★
()

>Поэтому я счёл формат ZIP целесообразнее 7Z.

так это ж контейнеры, все едино. Я недавно дампы баз сжимал методом LZMA и засовывал в zip. Скорость сжатия на третьей степени намного выше обычного deflate (тот самый, который в обычном зипе со времен pkzip), при этом сжимается лучше. Скорость распаковки не измерял, мне было важнее, чтоб открывалось даже голой вендой :)

А так можешь взять 7z в руки да проверить на одном своем файле. Контейнеров и методов сжатия не так и много.

nu11 ★★★★★
()

tar

Степень сжатия не особо важна.


Тем более. А за сжатием вообще обращаться к компрессорам.

firestarter ★★★☆
()
Ответ на: комментарий от amorpher

> винрар

Чем он лучше нативного консольного rar-а? А заодно и виндового консольного?

question4 ★★★★★
() автор топика
Ответ на: комментарий от anTaRes

> минитест

Спасибо. Надеюсь, Linux.img — несжатый? :)

Насколько я помню, LZMA — 1-поточный. Даже если его научились распараллеливать, в программе lzma была старая версия алгоритма.

То есть 1-поточный LZMA сжимает на проценты медленнее, чем 2-поточный bzip2. А распаковывает вдвое быстрее.

Насколько я знаю deflate (в zip/gzip) — ещё быстрее LZMA.

То есть про pbzip2 можно не вспоминать.

question4 ★★★★★
() автор топика
Ответ на: комментарий от nu11

> так это ж контейнеры, все едино

Я имел в виду методы, используемые в этих контейнерах по умолчанию. LZMA для 7z и deflate для zip.

Скорость сжатия на третьей степени

Это как? «7z -mx=3» ?

намного выше обычного deflate (тот самый, который в обычном зипе со времен pkzip), при этом сжимается лучше.

Попробую, спасибо. Но для «7z -tzip -mx=1», вроде получилось медленне, чем с «7z -tzip -mx=1» при несущественном выигрыше в сжатии.

Скорость распаковки не измерял, мне было важнее, чтоб открывалось даже голой вендой :)

Достаточно взять версию 7-zip не ниже :)

А так можешь взять 7z в руки да проверить на одном своем файле.

С -mx=1 сжимается полчаса.

question4 ★★★★★
() автор топика
Ответ на: комментарий от sdio

> pigz (parallel gzip)

Спасибо. И большой выигрыш здесь даёт параллелизм? Будет ли прирост на 4-ядерном процессоре по сравнению с 2-ядерным?

question4 ★★★★★
() автор топика
Ответ на: комментарий от firestarter

> tar ... А за сжатием вообще обращаться к компрессорам.

Где взять патчи для tar-а для поддержки компрессоров pigz, lzop и snappy? ОС с кривой реализацией пайпов, tar чтототам | gzip работает через раз.

question4 ★★★★★
() автор топика
Ответ на: комментарий от anonymous

> http://exdupe.com/

Нет 32-битной версии.

К тому же закрытый. И ни одного стороннего отзыва в интернете не нашёл.

И возникают подозрения: зачем архиватору доступ к IPX, AppleTalk и /proc/net ?

http://maximumcompression.com/data/summary_mf4.php

Автору нравится FreeARC :) Snappy в списке нет. Но в остальном хорошая таблица.

http://extrememoderate.wordpress.com/2011/08/20/synthetic-test-of-filesystem-...

Довольно специфическая задача. Но хотя бы показывает соотношение Snappy-LZO. Спасибо.

question4 ★★★★★
() автор топика
Ответ на: комментарий от devl547

> lrzip

Спасибо, посмотрю и его заодно.

Хотя в http://ck.kolivas.org/apps/lrzip/README ничего нет о параллелизме. И на файлах больше 10 гигабайт 32-битная версия проигрывает стандартным реализациям LZMA.

question4 ★★★★★
() автор топика
Ответ на: комментарий от devl547

> Та же фигня, только от Яндекса.

Snappy с их патчами? Ссылку можно? А то в поиске одни чихуахуа.

question4 ★★★★★
() автор топика
Ответ на: комментарий от question4

Я по его блогу сужу - он там подробности постоянно пишет.

devl547 ★★★★★
()
Ответ на: комментарий от shty

> tar?

Есть сильные подозрения, что что-нибудь быстро сжимающее и разжимающее (на основе LZO?) обработает большой объём хорошо сжимаемых данных быстрее. Будет меньше работы с диском.

question4 ★★★★★
() автор топика
Ответ на: комментарий от shty

>>скорость распаковки важнее

так что быстрее не будет

Да, время записи больше времени чтения, но оно одинаково. Время чтения сжатого архива всегда будет меньше времени чтения несжатого тарболла. Вопрос в том, какие распаковщики настолько быстро работают, чтобы почувствовать разницу, сжимая-распаковывая исполнимые файлы.

question4 ★★★★★
() автор топика
Ответ на: комментарий от question4

ну я подразумевал в качестве архиватора /dev/null. может выразился немного неправильно)

etwrq ★★★★★
()
Ответ на: комментарий от post-factum

> xz, например.

Никаких преимуществ перед LZMA из свежего 7-zip. Кроме сохранения атрибутов, которые в данном случае не играют роли, т.к. по умолчанию. И долго работает.

question4 ★★★★★
() автор топика
Ответ на: комментарий от question4

2002 год. Поновее нету?


алгоритмы обычно не меняются, даже если со временем изменились цифры - общее соотношение осталось прежним

вот, к примеру, я еще с конца 90х помню что rar сжимает текст лучше чем zip
и я даже проверять не буду, уверен за 10 лет ничего не изменилось

Спасибо. Надеюсь, Linux.img — несжатый? :)


это образ какой-то вм, qemu чтоль
зх как там с сжатием, но уверен там много нулей ;)

anTaRes ★★★★
()
Ответ на: комментарий от anTaRes

> >> 2002 год. Поновее нету?

алгоритмы обычно не меняются,

Неверно.

Кроме того, конкретные реализации важнее.

даже если со временем изменились цифры - общее соотношение осталось прежним

Опять неверно.

вот, к примеру, я еще с конца 90х помню что rar сжимает текст лучше чем zip

и я даже проверять не буду, уверен за 10 лет ничего не изменилось

Учитывая, что zip не развивается с середины 1990-х, неудивительно. А вот про реализацию deflate в 7-zip я бы не был не столь уверен :)

Ещё контрпример: 15 лет назад rar уступал ha. Сейчас превосходит.

Linux.img

это образ какой-то вм,

Так и запишем, с ядром линукса anTaRes не знаком :)

question4 ★★★★★
() автор топика
Ответ на: комментарий от question4

Так и запишем, с ядром линукса anTaRes не знаком :)


ядро тут не причем , это образ виртуалки
а что там внутри - хз, возможно она вообще пустая :)
но Вам же образы и сжимать, ткчто они тоже не всегда на 100% заполнены будут
и даже со степенью сжатия «1» можно будет раз в 5-10 ужать

вобшшем как определитесь - обнародуйте свое решение ;) интересно будет узнать что выбрали и почему

anTaRes ★★★★
()
Ответ на: комментарий от question4

>Это как? «7z -mx=3» ?
угу

Но для «7z -tzip -mx=1», вроде получилось медленне, чем с «7z -tzip -mx=1» при несущественном выигрыше в сжатии.

не понял, что с чем сравниваешь :) Deflate тормоз изначально, при этом ЕМНИП работает только в один поток

Достаточно взять версию 7-zip не ниже :)

неа, в том и фишка, что открывается без сторонних приблуд

С -mx=1 сжимается полчаса.

так отрежь от него кусок небольшой для теста

nu11 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.