LINUX.ORG.RU
ФорумAdmin

Инкрементальный diff, samba

 ,


0

1

Для мониторинга телодвижений нужно вещицу, которая умеет искать и дампить различия в docx, xlsx, txt и и.д., а потом патчи слать на мыло.

Пока на ум приходит только создать .yesterday, туда совать все вчерашнее, а на следующий день дергать текст из сегодняшних документов и вчерашних и патчем его. Есть, конечно, идея заюзать svn/git, но docx - зипари [т.е. придется предварительно экстрактить текст в репозитарий по тригу на mtime, а потом делать коммит].

Заморачивался кто-нибудь чем-то аналогичным?



Последнее исправление: division_hell (всего исправлений: 1)

инкрементный бекап тебе поможет сделать rsync, а дальше уже к каждому формату придется свой подход искать. Но перебирать после rsync придется сильно меньше точно.

BaBL ★★★★★
()

Цель, а не инструмент.

Для чего вся это байда? Какой смысл в том, что ты увидишь разницу в binary data? Что это тебе даст?

Может тебе нужен журнал изменений?

zgen ★★★★★
()
Ответ на: комментарий от zgen

Для чего вся это байда? Какой смысл в том, что ты увидишь разницу в binary data? Что это тебе даст?

Это мне? Не понял, кому ответ. Я же явно упоминал экспорт текста из бинарников. Просто инкрементальный бэкап мне не нужен. Цель - «Для мониторинга телодвижений». Другими словами, нужно знать кто, сколько и каких документов настрочил в байтах/страницах и т.д за день.

division_hell
() автор топика
Ответ на: комментарий от division_hell

Другими словами, нужно знать кто, сколько и каких документов настрочил в байтах/страницах и т.д за день.

Для чего? Оценка строк кода или что?

Может быть есть более рациональное решение вашего вопроса, поэтому нужно понять цель, а не думать, как микроскоп применить.

zgen ★★★★★
()
Ответ на: комментарий от zgen

Есть товарищ, который пишет документацию. Нужно знать, что он ее а) не копипастит из инета б) не пинает груши в) знать сколько страниц он написал

division_hell
() автор топика
Ответ на: комментарий от division_hell

Нужно знать, что он ее а) не копипастит из инета б) не пинает груши в) знать сколько страниц он написал

Это называется code review.

Для этого надо писать документацию не в вагоне файлов различных проприетарных форматов, а в одном месте/формате. Поскольку озаботиться правильным подходом к написанию документации у вас пока не получается то и решить свою задачу без костылей у вас не выйдет.

Утилита, умеющая сравнивать конктент word/excel/rtf/etc под винду:
http://www.softinterface.com/wdd/wdd.htm

А своему документатору скажите, чтобы он делал это в любой вменяемой wiki системе с последующим экспортом в word/pdf/etc, тогда все ваши задачи решатся самым простым образом.

zgen ★★★★★
()
Ответ на: комментарий от zgen

Поскольку озаботиться правильным подходом к написанию документации у вас пока не получается то и решить свою задачу без костылей у вас не выйдет.

Вот откуда такие выводы? М? Откуда вы знаете, чем я могу/хочу озаботиться? Документация оформляется согласно различным ГОСТам. Документатор мне лично не подчиняется, использовать что-то кроме ворда не будет. Поэтому вышеперечисленное нужно, чтобы заткнуть ему пасть и заставить работать.

division_hell
() автор топика
Ответ на: комментарий от division_hell

Документатор мне лично не подчиняется
поэтому вышеперечисленное нужно, чтобы заткнуть ему пасть и заставить работать.

заставлять документатора работать должен начальник. А раз вы ему не начальник, то это не ваше дело.

В любом случае решить задачу с теми условиями, которые вы задали не выйдет.

zgen ★★★★★
()
Ответ на: комментарий от init_6

А просто к примеру тот же git не решает?

git покажет binary разницу между файлами, а ему нужен осмысленный текст изъятый из закрытого формата

zgen ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.