LINUX.ORG.RU

Сообщения Velikan

 

Задать язык для sed

Почему sed - потому что нужно будет производить операции и это удобнее через sed. Есть старый распознанный скан, где каким то чудом перемешана кирилица и латиница, т.е. в одном слове могут быть и те, и те буквы. Можно ли седнуть так, чтобы выдать только слова, где есть хотя бы 1 буква латиницы? Файл предварительно разбит на строки по 1 слову для удобства обработки. Пробую так

echo $LANG
en_US.UTF-8
sed -nr '/[a-Z]+/p' file
LC_ALL=C sed -nr '/[a-Z]+/p' file
LC_ALL=en_US sed -nr '/[a-Z]+/p' file
Получаю все равно все слова, даже чисто на кирилице. Пробовал и инверсию через !p. Без цикла на проверку каждой буквы можно как то это решить?

P.S. Я в курсе про замену через y/, но мне и сами слова нужны.

 , ,

Velikan
()

RSS подписка на новые темы