Задать язык для sed
Почему sed - потому что нужно будет производить операции и это удобнее через sed. Есть старый распознанный скан, где каким то чудом перемешана кирилица и латиница, т.е. в одном слове могут быть и те, и те буквы. Можно ли седнуть так, чтобы выдать только слова, где есть хотя бы 1 буква латиницы? Файл предварительно разбит на строки по 1 слову для удобства обработки. Пробую так
echo $LANG
en_US.UTF-8
sed -nr '/[a-Z]+/p' file
LC_ALL=C sed -nr '/[a-Z]+/p' file
LC_ALL=en_US sed -nr '/[a-Z]+/p' file
P.S. Я в курсе про замену через y/, но мне и сами слова нужны.