Найти слово между между '] ' и следующим пробелом

0

3

Разбираю в bash скрипте примерно такие строки:

[+] FIRST TEXT
[ ] SECOND TEXT

Как красиво найти слова FIRST и SECOND (т.е. слово между '] ' и следующим пробелом)?

Для первой строки работает awk '{print $2}', а для второй строки нужно уже awk '{print $3}'.

Ссылка

←	DVB SkyStar 2 в Linux

Необходимо соединение несвязных (на первый взгляд) скриптов

→

Там вам на Баше или АВКе? В любом случае, просто срежьте первые четыре символа, а уже остальное разбирайте по разделителям.

На Баше:

#!/bin/bash

while read line; do
    read num __ <<< "${line:4}"
    echo "$num"
done

Zmicier ★★★★★
(02.12.15 17:33:42 MSK)
Последнее исправление: Zmicier 02.12.15 17:39:40 MSK (всего исправлений: 1)

sed "s/.*] $.*$ .*/\1/g"

r3lgar ★★★★★
(02.12.15 17:36:25 MSK)

sed -e 'y/[+]/   /;s/^ *//;s/ .*$//'

не оч красиво, но работать будет

f1u77y ★★★★
(02.12.15 17:37:32 MSK)
Последнее исправление: f1u77y 02.12.15 17:42:58 MSK (всего исправлений: 2)

Ссылка

Ответ на: комментарий от r3lgar 02.12.15 17:36:25 MSK

Или

sed 's/^.*\] \([^ ]*\).*$/\1/'

beastie ★★★★★
(02.12.15 17:42:57 MSK)

Ответ на: комментарий от Zmicier 02.12.15 17:33:42 MSK

Спасибо! Работает. И, кажется, это самый красивый способ.

romychvk
(02.12.15 17:47:46 MSK) автор топика

Ответ на: комментарий от beastie 02.12.15 17:42:57 MSK

В твоём варианте символов больше. (=

Хотя, на результат это не влияет, поэтому не имеет значения. Вообще, мне нравится sed за то, что с его помощью можно добиться любых результатов целой пачкой способов на каждый.

r3lgar ★★★★★
(02.12.15 17:48:10 MSK)

Ответ на: комментарий от romychvk 02.12.15 17:47:46 MSK

Да всегда пожалуйста. Но если удобнее именно на АВКе, то тоже можно, разумеется:

#!/usr/bin/gawk -E

{
    $0 = substr ($0, 5);
    print $1;
}

Zmicier ★★★★★
(02.12.15 17:50:09 MSK)

Ответ на: комментарий от romychvk 02.12.15 17:47:46 MSK

самый красивый способ

Самый понятный, если быть точным. Но с малейшим изменением задачи скрипт будет сильно изменяться, а ещё это лишняя сущность при пакетной обработке данных. К счастью bash присутствует во всех дистрибутивах.

r3lgar ★★★★★
(02.12.15 17:51:11 MSK)

Ответ на: комментарий от r3lgar 02.12.15 17:48:10 MSK

Там разница в другом. Твой вариант «жадный», мой нет. Попробуй мой и свой на:

[+] FIRST TEXT WHATEVER
[ ] SECOND TEXT WHATEVER

beastie ★★★★★
(02.12.15 17:54:28 MSK)

Ответ на: комментарий от r3lgar 02.12.15 17:51:11 MSK

Под красивым я понимаю а) минималистичный; б) совместимый; в) понятный.

Т.е. самый короткий способ на чистом баше выглядит самым желательным.

sed - это дополнительная сущность, плюс зубодробительные заклинания для простейшей, казалось бы, задачи.

romychvk
(02.12.15 17:55:09 MSK) автор топика

Ответ на: комментарий от Zmicier 02.12.15 17:50:09 MSK

KISS ;)

/^\[\+\]/       { print $2 }
/^\[ \]/        { print $3 }

beastie ★★★★★
(02.12.15 17:57:26 MSK)

Ссылка

Ответ на: комментарий от Zmicier 02.12.15 17:33:42 MSK

Я дико извиняюсь, не могли бы вы объяснить синтаксис:

read num __ <<<

Не понимаю, как это работает.

romychvk
(02.12.15 18:18:08 MSK) автор топика

Ссылка

Ответ на: комментарий от beastie 02.12.15 17:54:28 MSK

Начнём с другого конца: у тебя GNU sed?

r3lgar ★★★★★
(02.12.15 22:17:25 MSK)

Ответ на: комментарий от romychvk 02.12.15 17:55:09 MSK

минималистичный

Тут sed всегда выигрывает, а если нет, то проигрывает только перлу.

совместимый

А с чем не совместим sed?

понятный

Вот тут sed проигрывает с точки зрения новичков. Но если один раз освоишь регулярки, потом тебя за уши не оттащат. Я и vim попробовал из-за них, и теперь не представляю замену без подобных регулярок.

read num __ <<<
Не понимаю, как это работает.

понятный

Ага, ага.

r3lgar ★★★★★
(02.12.15 22:22:28 MSK)

Ответ на: комментарий от r3lgar 02.12.15 22:17:25 MSK

В данном случае да, но в общем у меня разные.

beastie ★★★★★
(02.12.15 23:43:50 MSK)

Ссылка

sed -r 's/[^]]*] (\w+).*/\1/' file

~~somequest~~
(03.12.15 09:52:53 MSK)

Для первой строки работает awk '{print $2}', а для второй строки нужно уже awk '{print $3}'.

awk '{print $(NF-1)}' — второе с конца поле

anonymous
(03.12.15 09:54:54 MSK)

Ссылка

Ответ на: комментарий от somequest 03.12.15 09:52:53 MSK

sed -r 's/[^]]*] ([^ ]+).*/\1/' file

~~somequest~~
(03.12.15 09:55:36 MSK)

Ссылка

Ответ на: комментарий от beastie 02.12.15 17:54:28 MSK

Твой вариант «жадный», мой нет

Твой вариант нежадный только частично. Вот полностью нежадный вариант

sed -r 's/[^]]*] ([^ ]+)[^$]*/\1/' file

~~somequest~~
(03.12.15 10:01:25 MSK)

Ссылка

grep -o '[[:alpha:]][^ ]*' | head -1

anonymous
(03.12.15 10:04:14 MSK)

Ссылка

echo -e "[+] FIRST TEXT\n[ ] SECOND TEXT" | perl -nE 'if(/]\s+(S+)/){print "$1\n"}'

false ★★★★★
(03.12.15 10:11:51 MSK)

Ответ на: комментарий от false 03.12.15 10:11:51 MSK

(S+)

(\S+)

anonymous
(03.12.15 10:26:12 MSK)

Ответ на: комментарий от anonymous 03.12.15 10:26:12 MSK

Точно, с мобилы набирал

false ★★★★★
(03.12.15 10:43:03 MSK)

Ссылка

Ответ на: комментарий от r3lgar 02.12.15 22:22:28 MSK

понятный
Вот тут sed проигрывает с точки зрения новичков. Но если один раз освоишь регулярки, потом тебя за уши не оттащат. Я и vim попробовал из-за них, и теперь не представляю замену без подобных регулярок.

Я целиком и полностью за регулярные выражения. Но вот в таких моментах оказывается, что простая, с формальной точки зрения, задача оказывается нетривиальной - вон сколько уже последовательно уточняющихся варинатов регэкспа написали в каментах.

Причем каноничный перловый регэксп выглядит вполне неплохо:

/]\s+(S+)/

А в sed он становится монстрообразным.

read num __ <<<
Не понимаю, как это работает.
понятный
Ага, ага.

Ну да. С таким синтаксисом я не сталкивался. В принципе, регэксп для sed я бы и сам написал, я искал вариант поэлегантнее.

romychvk
(03.12.15 17:53:27 MSK) автор топика

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	DVB SkyStar 2 в Linux

General

Необходимо соединение несвязных (на первый взгляд) скриптов

→

Похожие темы