LINUX.ORG.RU

Сравнение файлов на разных фтп серверх


0

0

Доброе время суток! Недавно подключился к локалке, решил поставить линукс и для более быстрого вникания в линукс заботать какой-нить простенький поисковичек по фтп(обмен файлами в сетке принят по фтп) и в голову пришла такая мысль - так как люди после закачки файлов постоянно переименовывают файлы так как им хочется, необходимо придумать какой-нить алгоритм для сравнения файлов на разных фтп без закачки. Единственное что пока пришло в голову это сравнение контрольных сумм, нов справке к md5sum не нашел ничего для себя полезного. Может отцы линуксоиды подскажут какой-либо выход. Готов выслушать ответы типа RTFM, главное чтоб было указано куда копать:) Прогать собираюсь на перле заодно и в язык побыстрее въеду. За любые советы заранее благодарен.

anonymous

А просто по размеру не пойдет? Ну и сравнивать тип/расширение. Мне кажется, что там не так уж много файлов, чтоб были существенные коллизии при сравнении размера (с точностью до байта).

anonymous
()
Ответ на: комментарий от anonymous

В принципе я думал о сравнении по размерам фалов, но когда попытался сделать выборку по размеру файлов в папке с дистрибутивами то нашлось порядочно файлов с одинаковыми размерами но разные по смыслу(хотя привязать к этому еще и расширение не пробовал возможно получится). Спасибо за совет.

Нет локалка в противоположной стороне как раз на севере Москвы

Ну а исполнить мою мечту и всетаки определить контрольные суммы файлов али еще как-нить определить переименнованный файл можно?

anonymous
()
Ответ на: комментарий от anonymous

Только что проверил размеры файлов в папке куда у меня установлены винда. Всего там файлов 147. Получилось семь пар файлов с одинаковыми размерами из них 5 пар с одинаковыми разрешениями, так что такой способ не является абсолютным. Хотя для фильмов и музыки скорее всего будет отлично работать.

anonymous
()
Ответ на: комментарий от anonymous

Я как раз и думал о фильмах с мп3, о софте как-то не подумал. Для хешей придется файл скачивать для посчета.. Можно внедрить индексатор на стороне сервера, но в локалке это не прокатит скорее всего, если только при поддержке провайдера. В принципе есть вариант еще привязать дату, но она опять же может быть выставлена одинаково, можно качать только первые, скажем, пару килобайт, но они тоже вообще говоря могут быть сходны. Да и вообще файлы иногда бывают дублируются. Сам не понял, к чему написал, но вот! :)

anonymous
()

Имя + размер + произвольное чтение в контрольных точках. В 99.9% это сработает.

seiken ★★★★★
()
Ответ на: комментарий от seiken

качай 1024 байта файла и хешируй

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.