bash. как удалить повторы строк в файле, не сортируя его?

0

1

привет.

сабж.

использовал «sort -u», но необходимо избавиться от сортировки.

благодарен.

Ссылка

←	Как сделать подсветку логов нормальную?

fstab - пароль при монтированиие

→

uniq myfile1.txt > myfile2.txt

ksevelyar ★
(01.03.12 15:12:53 MSK)

те, раз тебе важна позиция, нужно оставлять первое вхождение повторяющейся строки? или какое?

anonymous
(01.03.12 15:13:24 MSK)

Ответ на: комментарий от ksevelyar 01.03.12 15:12:53 MSK

$ echo -e 'aa\nnn\naa' |uniq 
aa
nn
aa

anonymous
(01.03.12 15:14:31 MSK)

Ссылка

Ответ на: комментарий от anonymous 01.03.12 15:13:24 MSK

да, первое.

niXman ★★★
(01.03.12 15:17:52 MSK) автор топика

Ссылка

man uniq

Makefile
(01.03.12 15:18:36 MSK)

$ echo -e 'aa\nbb\nnn\naa\ncc\nnn\naa' | awk '{if (!h[$0]) h[$0]=NR} END {for (k in h) {print h[k],k}}' | sort -k1n
1 aa
2 bb
3 nn
5 cc

$ echo -e 'aa\nbb\nnn\naa\ncc\nnn\naa' | awk '{if (!h[$0]) h[$0]=NR} END {for (k in h) {print h[k],k}}' | sort -k1n | cut -d' ' -f2-
aa
bb
nn
cc

~~sdio~~ ★★★★★
(01.03.12 15:20:15 MSK)

Ответ на: комментарий от ksevelyar 01.03.12 15:12:53 MSK

«Filter adjacent matching lines »

не годится!

без сортировки работать не будет.

ТС: видимо только awk/perl/sed -что ближе и понятней

и да, если файло большое - ОЗУ понадобится много ;)

mumpster ★★★★★
(01.03.12 15:21:43 MSK)

Ответ на: комментарий от Makefile 01.03.12 15:18:36 MSK

man uniq

прувом поделитесь? (в контексте задачи)

по сабжу: eddie -mData.List unlines.nub.lines

anonymous
(01.03.12 15:31:32 MSK)

Ссылка

Ответ на: комментарий от sdio 01.03.12 15:20:15 MSK

Из awk one-liners:

[code=awk] # remove duplicate, nonconsecutive lines awk '! a[$0]++' # most concise script awk '!($0 in a) {a[$0];print}' # most efficient script [/code]

anonymous
(01.03.12 15:34:05 MSK)

Ссылка

Ответ на: комментарий от sdio 01.03.12 15:20:15 MSK

Из awk one-liners:

 # remove duplicate, nonconsecutive lines
 awk '! a[$0]++'                     # most concise script
 awk '!($0 in a) {a[$0];print}'      # most efficient script

anonymous
(01.03.12 15:35:03 MSK)

Ответ на: комментарий от mumpster 01.03.12 15:21:43 MSK

да, uniq не подходит.

niXman ★★★
(01.03.12 15:35:54 MSK) автор топика

Ответ на: комментарий от anonymous 01.03.12 15:35:03 MSK

Ну да, логично, я перекрутил.

~~sdio~~ ★★★★★
(01.03.12 15:37:21 MSK)

Ссылка

Ответ на: комментарий от niXman 01.03.12 15:35:54 MSK

вот тебе пример с awk дали. я восхищён!

mumpster ★★★★★
(01.03.12 15:39:17 MSK)

Ссылка

Ответ на: комментарий от anonymous 01.03.12 15:35:03 MSK

спасибо. подходит. вопрос закрыт.

niXman ★★★
(01.03.12 16:24:34 MSK) автор топика

Ответ на: комментарий от anonymous 01.03.12 15:35:03 MSK

В фортунки, спасибо.

Deleted
(01.03.12 22:09:21 MSK)

Ссылка

Ответ на: комментарий от niXman 01.03.12 16:24:34 MSK

помни, что это только для max тысяч строк. а то озу отожрёт!:(

mumpster ★★★★★
(02.03.12 08:51:14 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Как сделать подсветку логов нормальную?

fstab - пароль при монтированиие

→