LINUX.ORG.RU

Изменился ли файл (самый быстрый алгоритм хеширования)?

 , ,


2

2

Если вместо чексумм запоминать время последнего изменения файла, может быть файл тот же, но был копирован из другого места с заменой или сохранён, но без изменений. Это не вариант.

Для чексумм сейчас применён md5, говорят он типа самый быстрый, но на большом кол-ве (большИх в том числе) файлов оно работает дико долго.

Не нужна криптография. И не сильно критичны коллизии. Нужно максимально просто и максимально быстро получать хешсумму.

Какие алгоритмы быстрее md5?

Вообще, как эту фигню (определение изменился файл или нет) сделать правильно и максимально ускорить?

next_time — почту проверь.

★★★★★★★★★

Последнее исправление: deep-purple (всего исправлений: 1)

Btrfs использует CRC32, для обнаружения случайных изменений типа bit rot этого достаточно. Производительность:

 % sudo btrfs scrub status /home
scrub status for 9dffdcdb-5777-4667-8b85-be5372b38531
	scrub started at Sun Jan 20 20:12:58 2019 and finished after 00:01:28
	total bytes scrubbed: 282.76GiB with 0 errors

anonymous
()
Ответ на: комментарий от intelfx

Какой коррекции? По 32 битам ничего особо не скорректируешь.

anonymous
()
Ответ на: комментарий от deep-purple

Говорят мд5 рвёт црц32 в два раза

Говорят, что кур доят. crc32 на современных CPU поддерживается аппаратно.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.