LINUX.ORG.RU

История изменений

Исправление saahriktu, (текущая версия) :

Я же говорю: при локали KOI8-R все файлы локально создаются в KOI8-R, а приём сторонних текстов можно автоматизировать чтобы на лету конвертировалось в KOI8-R. Бывают, конечно, исключения, но тут можно привлекать специальные инструменты, например:

> enca -g test
Universal transformation format 8 bits; UTF-8
> enca -g test2
MS-Windows code page 1251
  LF line terminators
> enca -g test3
IBM/MS code page 866
  LF line terminators
> enca -g test4
KOI8-R Cyrillic
  LF line terminators
Отдельные файлы можно спокойно опознать и вручную. Если в тексте содержится нечто наподобие «п²п╬п╡п╬я│я┌п╦», то это UTF-8, а если нечто наподобие «ОКЮМНБШЛХ ПЮАНРЮЛХ яРЮПННЯЙНКЭЯЙХУ ЩКЕЙРПНЯЕРЕИ», то это cp1251, а если нечто наподобие «╞╚═╜╝╒К╛╗ Ю═║╝Б═╛╗ ▒Б═Ю╝╝А╙╝╚ЛА╙╗Е М╚╔╙БЮ╝А╔Б╔╘», то это cp866.

Исходная версия saahriktu, :

Я же говорю: при локали KOI8-R все файлы локально создаются в KOI8-R, а приём сторонних текстов можно автоматизировать чтобы на лету конвертировалось в KOI8-R. Бывают, конечно, исключения, но тут можно как привлекать специальные инструменты, например:

> enca -g test
Universal transformation format 8 bits; UTF-8
> enca -g test2
MS-Windows code page 1251
  LF line terminators
> enca -g test3
IBM/MS code page 866
  LF line terminators
> enca -g test4
KOI8-R Cyrillic
  LF line terminators
Отдельные файлы можно спокойно опознать и вручную. Если в тексте содержится нечто наподобие «п²п╬п╡п╬я│я┌п╦», то это UTF-8, а если нечто наподобие «ОКЮМНБШЛХ ПЮАНРЮЛХ яРЮПННЯЙНКЭЯЙХУ ЩКЕЙРПНЯЕРЕИ», то это cp1251, а если нечто наподобие «╞╚═╜╝╒К╛╗ Ю═║╝Б═╛╗ ▒Б═Ю╝╝А╙╝╚ЛА╙╗Е М╚╔╙БЮ╝А╔Б╔╘», то это cp866.