LINUX.ORG.RU

[прошу сильно не бить] Как grep'ом найти символы второй половины таблицы ASCII?


0

1

Сижу сейчас, перевожу все комментарии в своем велосипеде на английский («по многочисленным просьбам»). Хочу найти, может, где пропустил чего.

grep [^[:alnum:]] считает русские буквы символами.

grep [а-яА-Я] не работает (т.к. буквы, все-таки, не по алфавиту в таблице - КОИ8-Р у меня).

Как быть?

☆☆☆☆☆

> КОИ8-Р у меня
Допрыгался, курилка. Говорили тебе — кои8 до добра не доведёт.

Deleted
()
Ответ на: комментарий от Bad_ptr

Прошу не разводить срачи вокруг совершенно ненужного для русского человека юникода, а ответить по существу.

Eddy_Em ☆☆☆☆☆
() автор топика
Ответ на: Ну я и кретин! от Eddy_Em

Фигвам!

Оно так еще кучу мусора выдает

Eddy_Em ☆☆☆☆☆
() автор топика
Ответ на: комментарий от Eddy_Em

> ненужного для русского человека юникода

Ага. Только с ним этого топика бы не было.

YAR ★★★★★
()
Ответ на: комментарий от Eddy_Em

дело только в том, что юникод, общепринятый международный стандарт, и все, кто еще хоть как-то шевелится, на него переезжают.
Причем utf-8 даже не требует дополнительных байтиков, при использовании наиболее распространенного в компьютерном мире, английского языка.

Bad_ptr ★★★★★
()
Ответ на: комментарий от Eddy_Em

Просто интересно, а вот кроме фанатичной преданности, какие доводы есть у пользователя KOI8 против UTF?

fagot ★★★★★
()
Ответ на: комментарий от fagot

Вместо двух байт буквы занимают один, просто работать с read/write, просто обрабатывать строки, сортировка через локали все равно работает (несмотря на неалфавитный порядок букв в таблице).

В общем, преимуществ над дебильным юникодом достаточно.

Eddy_Em ☆☆☆☆☆
() автор топика
Ответ на: комментарий от power

Можно подумать, есть какой-то другой вариант…

Eddy_Em ☆☆☆☆☆
() автор топика
Ответ на: комментарий от Eddy_Em

Это все хорошо, если требуются исключительно латинские и кириллические символы, что редкость и не гибко.

Кстати, в utf-8 латинские символы тоже занимают один байт (они вообще совпадают с ascii).

note173 ★★★★★
()
Ответ на: комментарий от note173

Кстати, в utf-8 латинские символы тоже занимают один байт (они вообще совпадают с ascii).

Я в курсе.

Eddy_Em ☆☆☆☆☆
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.