LINUX.ORG.RU

Как «причесать» вывод fdupes?

 , ,


0

2

Есть выхлоп fdupes, где группы одинаковых файлов разделены двойным переводом строки. В группе может быть больше 2 строк. http://pastebin.com/1VFTaFAd

Никак не могу придумать, как очистить этот выхлоп от групп, где все строки содержат «_big» или не содержат «_».

awk знаю чуть лучше, чем никак. С pcregrep как-то не срастается. sed тут вроде не проканает.

★★★★★

Последнее исправление: Radjah (всего исправлений: 1)

У тебя хотя бы одно подчёркивание есть в каждой группе, не понятно, чего ты хочешь.

d ★★★★
()
Ответ на: комментарий от d

Убрать из вывода примерно такие куски:

./44928727_big_p0.png
./44928727_big_p2.png

./44928727_big_p0.png
./44928727_big_p2.png
./44928727_big_p4.png
./44928727_big_p6.png
./44928727.png
./44928728.png
Radjah ★★★★★
() автор топика
Ответ на: комментарий от Radjah

еще пустые строки убери и перевод строки.

Deleted
()

Так, нашел более другой способ поиска и удаление дублей.

Radjah ★★★★★
() автор топика
Ответ на: комментарий от Radjah
#!/usr/bin/env python

import sys
import re

with open(sys.argv[1], 'r') as infile:
    groups = infile.read().split('\n\n')

for group in groups:
    if len(re.findall('_big', group)) == len(re.findall('\.\/', group)):
        continue
    if not re.search('_', group):
        continue
    print(group, '\n')
d ★★★★
()
Ответ на: комментарий от Bfgeshka

Спасибо. Посмотрю на этого зверя.

Radjah ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.