LINUX.ORG.RU
ФорумTalks

[flame] utf8 vs koi8r

 


0

0

На самом деле флейма совершенно не хочется. Устал от него давно. С давних времен стоит гента. Обновляюсь часто. В качестве локали стоит koi8-r. Как и на всех серверах, которые настраиваю. Не могу понять, почему мне говорят некоторые личности типа "древность. давно пора на утф"?

Не хочу, повторяю, флейма, холивара и споров. Интересует конкретно ответы на вопросы "А что я теряю, используя koi8?". Я не буду говорить, ПОЧЕМУ у меня koi8, просто мне лень, например, переходить на utf и все тут.

★★

Сидел, сижу и буду сидеть на KOI8-R

anonymous
()

> "А что я теряю, используя koi8?"

Если возник такой вопрос - скорее всего ничего. Но по мере всеобщего перехода увеличится количество косяков с однобайтовыми, тогда и заметишь.

anonymous
()

> гента

> А что я теряю, используя koi8?

Возможность называть файлы на французском, японском, немецком и других иностранных языках. Возможность использовать эти языки в nano, vim и других консольных редакторах. Удобства при распаковывании архивов с такими файлами внутри. Отсутствие глюков при копировании текста на данных языках.

Перейдя на UTF получишь проблемы с man и копированием в gdm.

question4 ★★★★★
()
Ответ на: комментарий от wfrr

> в утф-8 слово "жопа" из /dev/urandom ищется grep более чем в 1000 раз медленее

В 8-битных шанс получить нужный символ (для произвольного регистра) 1/128=2^-7. Если с соблюдением регистра, то 1/256=2^-8. Для русских букв в UTF-8, 2^-15 или 2^-16. Итого разница в 2^(8*4) раз. Примерно 4 миллиарда :)

question4 ★★★★★
()

Ну вот захочется тебе аниме посмотреть, придёт к тебе бздун-анимешник, воткнёт переносной винт, а там вместо 鋼の錬金術師 - ??????. И так везде.

Или вот придёт вендузятник с NTFS, и теперь даже вместо русских букв - ??????.

Да даже если ты просто архив скачал, есть большой шанс напороться на UTF-8. Об этом ты узнаешь после распаковки по уже знакомым названиям ??????.

Далее в теме: "не захочется", "анимэ ненужно", "BSD RIP", "у меня нет знакомых вендузятников" и.т.д.

anonymous
()

>А что я теряю, используя koi8?

Русские литературные кавычки в названиях файлов. Или, там, значок номер, немецкие умляуты, смайлики, наконец ☺

KRoN73 ★★★★★
()
Ответ на: комментарий от Rubystar

>не вижу необходимости, кроме, как если хочется ещё с ЧЕМ нибудь потрахаться.

А с чем там трахаться? UTF-8 просто работает.

KRoN73 ★★★★★
()
Ответ на: комментарий от anonymous

>>Или вот придёт вендузятник с NTFS, и теперь даже вместо русских букв - ??????

Да ну? каждый день втыкаю и монтирую usb'шный винт на 120 гигов под ntfs-3g. Копирую туда любые файлы с русскими именами и содержимым. Размонтирую. Монтирую на форточную тачку - все отлично, никаких глюков с именами и содержимым!

vitroot ★★
() автор топика
Ответ на: комментарий от vitroot

> каждый день втыкаю и монтирую usb'шный винт на 120 гигов под ntfs-3g. Копирую туда

А копировать ОТТУДА файлы с тире и многоточиями в названиях приходилось?

question4 ★★★★★
()
Ответ на: комментарий от KRoN73

> Русские литературные кавычки в названиях файлов. Или, там, значок номер, немецкие умляуты, смайлики, наконец ☺

<<кавычки>> Номер: \No смайлик :) или \smiley подгрузив пакет wasysym

Evgueni ★★★★★
()
Ответ на: комментарий от question4

>mc

А что в нём не так? У меня - работает. Разве что не пашет перекодировка 1251/koi8/etc, но нафига они нужны? Всё остальное - ок.

>man

У меня man выдаёт всю документацию в utf-консоль без нареканий.

>теги MP3

id3v2 - всё идеально.

KRoN73 ★★★★★
()
Ответ на: комментарий от Slavaz

> А в манах что не работает?

Если у тебя нормально показываются маны на русском в кодировке UTF-8, скажи, пожалуйста, версии man и groff и дистрибутив. А ещё лучше — покажи конфиги.

Большинство русских манов — в КОИ-8, с ними проблем нет.

Кроме того, локализованный man игнорирует настройки локали UTF-8 и использует для сообщений кодировку КОИ-8.

Генту.

question4 ★★★★★
()
Ответ на: комментарий от KRoN73

>>mc

> А что в нём не так? У меня - работает. Разве что не пашет перекодировка 1251/koi8/etc, но нафига они нужны?

У меня много текстовых файлов, накопленных под досом и Windows, без перекодировки — никуда. Если нельзя это сделать одной кнопкой как в FARе, городить огород с iconv-enconv проще в консоли. А с остальными задачами справляются konqueror, thunar и bash. Промучавшись с MC с месяц, я его снёс.

>>теги MP3

> id3v2 - всё идеально.

Не все скачиваемые файлы их имеют :)

>>man

>У меня man выдаёт всю документацию в utf-консоль без нареканий.

Повторю вопрос: в какой кодировке хранятся эти файлы? С теми, которые изначально в однобайтной кодировке, проблем у меня тоже нет. И сам man сообщения об ошибках и --help пишет в КОИ-8 (и по-моему не в stdout, а в stderr). Буду рад узнать, как это решить.

question4 ★★★★★
()
Ответ на: комментарий от question4

Пересобрал groff с поддержкой иероглифов. Вроде маны стало читать нормально...

question4 ★★★★★
()
Ответ на: комментарий от question4

> версии man

man-1.6e-3.fc7

> и groff

groff-1.18.1.4-11.fc8

> и дистрибутив.
$ lsb_release -d
Description:    Fedora release 8 (Werewolf)

> А ещё лучше — покажи конфиги.

Комментарии пропускаю - много будет.

/etc/man.config:
# -------------------------------------
FHS
MANPATH /usr/man
MANPATH /usr/share/man
MANPATH /usr/local/man
MANPATH /usr/local/share/man
MANPATH /usr/X11R6/man

MANPATH_MAP     /bin                    /usr/share/man
MANPATH_MAP     /sbin                   /usr/share/man
MANPATH_MAP     /usr/bin                /usr/share/man
MANPATH_MAP     /usr/sbin               /usr/share/man
MANPATH_MAP     /usr/local/bin          /usr/local/share/man
MANPATH_MAP     /usr/local/sbin         /usr/local/share/man
MANPATH_MAP     /usr/X11R6/bin          /usr/X11R6/man
MANPATH_MAP     /usr/bin/X11            /usr/X11R6/man
MANPATH_MAP     /usr/bin/mh             /usr/share/man
TROFF           /usr/bin/groff -Tps -mandoc
NROFF           /usr/bin/nroff -c -mandoc 2>/dev/null
EQN             /usr/bin/geqn -Tps
NEQN            /usr/bin/geqn -Tutf8
TBL             /usr/bin/gtbl
# COL           /usr/bin/col
REFER           /usr/bin/grefer
PIC             /usr/bin/gpic
VGRIND
GRAP
PAGER           /usr/bin/less -is
BROWSER         /usr/bin/less -is
HTMLPAGER       /bin/cat
CAT             /bin/cat
CMP             /usr/bin/cmp -s
COMPRESS        /usr/bin/bzip2
COMPRESS_EXT    .bz2
MANSECT         1:1p:8:2:3:3p:4:5:6:7:9:0p:n:l:p:o:1x:2x:3x:4x:5x:6x:7x:8x
.gz             /usr/bin/gunzip -c
.bz2            /usr/bin/bzip2 -c -d
.z
.Z              /bin/zcat
.F
.Y
# -------------------------------------

P.S.
$ cat /usr/share/man/ru/man2/fork.2.gz |gunzip|enca
Universal transformation format 8 bits; UTF-8

То есть все маны в utf-8

Slavaz ★★★★★
()
Ответ на: комментарий от anonymous

>Простоту настройки в Slackware.

не надо её настраивать

>Возможно, стабильную работу mc.

что там с mc? вот у меня и русские буквы и иероглифы в консоли. я видимо что то в стабильности потерял ? :)

tommy ★★★★★
()
Ответ на: комментарий от question4

$ man --help
man, версия 1.6e
Использование: man [-adfhktwW] [раздел] [-M путь] [-P просмотрщик] [-S список]
        [-m система] [-p строка] название ...

  a : найти все совпадаения
  c : не использовать cat-файл
  d : выводить отладочную информацию
  D : то же, что и -d, но с отображением страниц руководства
  f : то же самое, что и whatis(1)
  h : вывести эту помощь
  k : то же самое, что и apropos(1)
  K : поиск строчки во всех страницах
  t : использовать troff, чтобы форматировать страницы для печати
  w : вывести расположение страниц руководства, которые будут отображены
      (если название не указано, то будет выведены все каталоги поиска)
  W : как для -w, но отображать только имена файлов

  C файл    : использовать `файл' в качестве конфигурационного файла
  M путь    : установить путь поиска страниц руководства в `путь'
  P просмотрщик : использовать программу `просмотрщик' для отображения страниц
  S список  : разделенный двоеточиями список разделов
  m система : поиск страниц руководства альтернативной системы
  p строка : строка, указывающая какой препроцессор стартовать
               e - [n]eqn(1)   p - pic(1)    t - tbl(1)
               g - grap(1)     r - refer(1)  v - vgrind(1)

По-русски, без кракозяблитов.
$ echo $LANG
ru_RU.UTF-8

Уточнение, на всякий случай :)

Slavaz ★★★★★
()
Ответ на: комментарий от question4

>У меня много текстовых файлов, накопленных под досом и Windows, без перекодировки — никуда.

iconv. Остальное - неюниксвэй :) В любом случае тут проблема у mc не с utf-8, а с cp1251 и др.

>Не все скачиваемые файлы их имеют :)

Опять же, это не проблема совместимости системы с utf-8.

>Повторю вопрос: в какой кодировке хранятся эти файлы?

Мне пофиг. Главное, что по man ls я получаю:

ИМЯ
       ls, dir, vdir - выводит содержимое каталога

ОБЗОР
       ls [опции] [файл...]
       dir [файл...]
       vdir [файл...]

       Опции POSIX: [-CFRacdilqrtu1] [--]

...

KRoN73 ★★★★★
()
Ответ на: комментарий от Slavaz

 man --help
man, ������ 1.6f
�������������: man [-adfhktwW] [������] [-M ����] [-P �����������] [-S ������]
	[-m �������] [-p ������] �������� ...

И так далее. Буду разбираться...

Ещё раз спасибо.

question4 ★★★★★
()
Ответ на: комментарий от KRoN73

> проблема у mc не с utf-8, а с cp1251 и др.

Я про то, что если перейти на UTF, MC создаёт проблемы :)

>> в какой кодировке

> Мне пофиг.

Я про свои проблемы. Вроде разобрался, groff надо было собирать с USE=cjk. И опять же непонятно, почему man ругается в КОИ-8 :)

Но да, это проблемы конкретных программ, а не системы в целом.

question4 ★★★★★
()
Ответ на: комментарий от question4

>Я про то, что если перейти на UTF, MC создаёт проблемы :)

да не перешла наверное только слака. так что не надо про переход в будущем времени.

ну и главное - проблемы не появялся а исчезнут.

tommy ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.