Объясните как работает rsync

0

1

Читаю алгоритм rsync (just for fun), но как-то медленно доходит. Вот, допустим, очередной блок S не совпал. Как он понимает длину участка который отличается? Неужели он рассчитывает контрольную сумму длиной S для всех возможных смещений? Т.е. если в середину файла вставить один мегабайт то он миллион (2^20) раз посчитает «плавающую» контрольную сумму?

Описание алгоритма: http://rsync.samba.org/tech_report/

Ссылка

←	Как через DBus вызвать метод Unmount (IN a{sv} options)

Переменная в качестве имени переменной

→

Это даже я понимаю.

Во-первых он действительно считает контрольную сумму для всех смещений, НО эта сумма позволяет «вычесть» один байт с начала и добавить один байт в конец. Т.е. ничего пересчитывать не надо.

Плюс там схема с двоичным поиском в виде заготовленных таблиц хешей и чё-то ещё.

ziemin ★★
(08.10.13 23:21:20 MSK)

Ссылка

Понятия не имею как на самом деле работает rsync, но всегда предполагал что так:

- для локального файла считаются блочные CRC (объём получается небольшой, ибо блоки относительно большие -> их мало)

- пересылаются на удалённую сторону

- удалённая сторона считает бегущую сумму по своему файлу и ищет блоки с совпавшей CRC в том что получила от меня

- совпавшие блоки перепроверяются более надёжной нециклической контрольной суммой, отсутствующие блоки просто пересылаются

- итого, с минимальным оверхедом по трафику и не увеличивая сложности алгоритма сверх O(размера файла) умеем находить совпадения даже по нечётным смещениям, profit

slovazap ★★★★★
(09.10.13 00:10:18 MSK)