LINUX.ORG.RU
ФорумTalks

Список ссылок на сайты в KOI8-R

 ,


0

3

Начал составлять сабж. Пока в списке 31 ссылка. Среди них «Институт Ядерной Физики им.Г.И.Будкера СО РАН», «Информационные научно-образовательные ресурсы ГАГУ», «Нижегородский Университетский Центр Интернет», «ивановский региональный портал», «МЦНМО: МОСКОВСКИЙ ЦЕНТР НЕПРЕРЫВНОГО МАТЕМАТИЧЕСКОГО ОБРАЗОВАНИЯ», «Институт лингвистических исследований», «„За науку!“ :: газета Алтайского государственного университета», «Переславль-Залесский — информационный портал города» и «Специальная астрофизическая обсерватория Российской академии наук». А также ресурсы с документацией по UNIX'ам.

Список здесь: http://saahriktu.org/koi8rsitez.html .

★★★★★

Последнее исправление: saahriktu (всего исправлений: 1)

Ответ на: комментарий от EXL

Тем не менее, по приведённой мной ссылке на github приведённая цитата присутствует. А по Вашей ссылке другой интересный вариант упоминания KOI8-R, который встречается в т.ч. и по ссылке http://srinikom.github.io/pyside-docs/PySide/QtCore/QTextCodec.html :

Russian users often have their documents in KOI8-R or Windows-1251.

saahriktu ★★★★★
() автор топика
Последнее исправление: saahriktu (всего исправлений: 1)
Ответ на: комментарий от saahriktu

or Windows-1251

А теперь составь список сайтов, которые «Windows-1251». Удивишься, во сколько раз он будет больше того, что «KOI8-R».

EXL ★★★★★
()
Последнее исправление: EXL (всего исправлений: 1)
Ответ на: комментарий от saahriktu

Покажи мне хотя бы одного, кроме себя и eddy_em (которым, скорее всего, ты и являешься, ссылка на сайт его места работы тому пример).

te111011010
()
Ответ на: комментарий от saahriktu

В windows-1251 по дефолту (или вообще всегда при русской локализации) сохраняет (или сохранял) блокнот windows. Но блокнот — это анахронизм. Те, кто серьёзно работает с plain text под windows, используют другие текстовые редакторы.

te111011010
()
Ответ на: комментарий от EXL

Нет, не удивлюсь, я когда составлял список видел, что большинство сайтов или в UTF-8 или Windows-1251 или за пределами рунета.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от te111011010
Ответ на: комментарий от saahriktu

Кто-то что-то путает. Точнее кто-то очень глуп или прикидывается.

При чём тут локаль и кодировка? В том то и прикол utf, что в нём все локали.

Мне кажется, мой молодой друх не застал тех времён, когда не было utf, и какая это была боль мучатся со всеми этими кодировками.

Вы ещё помните DOS и cp866, cp855, cp1251, koi8 ...? Тысячи их было, и все «русские». И как их приходилось (с ошибками) угадывать и конвертировать друг в друга, что бы просто увидеть на экране?

И что у тебя были или псевдо-графика или буковки, но ни то и другое вместе. Что в текстах были крякозябры, у одного было µ, ü, ä, ö, а у другого что-то совсем другое.

Т.ч. пусть горят 8-и битные кодировки в аду. И их сподвижники-староверы тоже.

beastie ★★★★★
()
Последнее исправление: beastie (всего исправлений: 1)
Ответ на: комментарий от beastie

Юникодные кодировки охватывают тысячи _символов_. А вот локаль прописывается в те переменные окружения, которые выводятся командой «locale»:

> locale
LANG=ru_RU.KOI8-R
LC_CTYPE="ru_RU.KOI8-R"
LC_NUMERIC="ru_RU.KOI8-R"
LC_TIME="ru_RU.KOI8-R"
LC_COLLATE="ru_RU.KOI8-R"
LC_MONETARY="ru_RU.KOI8-R"
LC_MESSAGES="ru_RU.KOI8-R"
LC_PAPER="ru_RU.KOI8-R"
LC_NAME="ru_RU.KOI8-R"
LC_ADDRESS="ru_RU.KOI8-R"
LC_TELEPHONE="ru_RU.KOI8-R"
LC_MEASUREMENT="ru_RU.KOI8-R"
LC_IDENTIFICATION="ru_RU.KOI8-R"
LC_ALL=
Невозможно присвоить той же переменной $LANG одновременно и «ru_RU.KOI8-R» и «ru_RU.UTF-8» и «C». Что-то одно из ряда вариантов.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от beastie

Ну так и вот. Та же UTF-8 охватывает только UTF-8. А KOI8-R, BIG5, GB, JIS, KSC, EUC, Shift-JIS, EBCDIC,... и т.д. - нет. А потому людям нужны самые разные локали.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от beastie

Вот зачем всё постоянно передёргивать из одних крайностей в другие? Никто же не говорит о принуждении других людей пользоваться теми или иными локалями или о использовании неместных локалей. А местные локали никто не отменял, хоть теперь появились и юникодные. И любой человек может предпочесть юзать одну из местных локалей, а не юникодную, по тем или иным соображениям.

А «localedef -f KOI8-R -i ja_JP ja_JP.KOI8-R», кстати, завершается с ошибками:

...
/usr/share/i18n/locales/ja_JP:15001: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15002: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15002: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15003: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15003: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15004: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15004: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15005: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15005: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15006: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15006: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15007: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15007: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15008: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15008: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15009: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15009: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15010: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15010: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15011: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15011: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15012: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15012: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15013: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15013: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15014: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15014: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15015: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15015: LC_TIME: неизвестный знак в поле <<alt_digits>>
/usr/share/i18n/locales/ja_JP:15031: LC_NAME: неизвестный знак в поле <<name_gen>>
/usr/share/i18n/locales/ja_JP:15045: LC_ADDRESS: неизвестный знак в поле <<country_name>>
/usr/share/i18n/locales/ja_JP:15052: LC_ADDRESS: неизвестный знак в поле <<lang_name>>
LC_MESSAGES: значение поля <<yesexpr>> не должно быть пустой строкой
LC_MESSAGES: значение поля <<noexpr>> не должно быть пустой строкой
выходной файл не создан, поскольку были предупреждения
А вот ru_RU.KOI8-R вполне создаётся, поскольку нужна людям, и потому этот вариант предусмотрен.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

Ладно, а теперь представь японо-русскую компанию с koi8 в корреспонденции и на серверах. ;)

Предлагаешь им постоянно конвертировать в «местную» кодировку, только по тому, что русский админ чудак?

beastie ★★★★★
()
Последнее исправление: beastie (всего исправлений: 1)
Ответ на: комментарий от beastie

Зачем? Им на сайте всё равно придётся держать 2 варианта текстов: на русском в кириллице и на японском в иероглифах. А потому одна часть страниц может быть с «charset=KOI8-R», а другая с «charset=shift_jis». На печати разницы в кодировке печатаемого текста нет. Кстати, «charset=shift_jis» реально используется на японских сайтах, включая tlug.jp, как и, например, «charset=EUC-JP» (на том же http://www.debian.or.jp.

Но, про японцев изначально вообще никто не говорил. Тема про то, что происходит в пределах границ России.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

Мы так до того дойдём, что ты предложишь набирать документы в MS Paint, а хранить в BMP. ;) Для печати ведь нет разницы.

TL;DR: замечательный пример того, как люди сначала ищут себе приключения на задницу, а потом героически с ними борятся. И пока горка ретроградов трясутся над своей «локальной» кодировкой, только потому что им жалко байтиков, и потому что оно своё «родное», прогрессивный мир уже давно ушёл к коммунизму, и не заморачивают себе голову этим бредом.

beastie ★★★★★
()
Последнее исправление: beastie (всего исправлений: 1)
Ответ на: комментарий от beastie

Нет, не предложу. И, более того, если в документе таки на самом деле будет нужно использовать больше символов чем в KOI8-R я буду настаивать на создании текста в UTF-8 или даже UTF-32. Я говорю о том, что такие задачи есть далеко не у всех, а действия всегда лучше когда они реакционные, а не «Ой, давай я поломаю что тут у меня есть и построю по-новому на всякий случай! А то, вдруг, завтра у меня появятся новые задачи, а я не готовый...». А задачи в итоге так и не появятся. А построенная годами экосистема будет уже поломана. Ну и кому от этого будет лучше?

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

Ну вот смотри, у меня банальная задача общаться с тобой по русски и писать письма по немецки. Насущная, простая задача. Как мне этого добиться с koi?

Ещё раз — я застал те времена, когда были «локальные» кодировки в ходу. Свят-свят. Ну его нафик.

beastie ★★★★★
()
Ответ на: комментарий от beastie

Так я же никого не заставляю юзать локаль KOI8-R и только за то, чтобы желающие юзать локаль UTF-8 юзали именно её. Я говорю, что у ряда людей таких задач нет, а потому мы имеем полное право продолжать юзать KOI8-R.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

Я говорю, что у ряда людей

Этот ряд очень короткий. Обычно это очередь в локальный псих-диспансер. ;)

beastie ★★★★★
()
Ответ на: комментарий от beastie

Нет, это ряд людей не привыкших просто так метаться от одного стандарта к другому. При этом и сегодня любой только начинающий переходить на линуксы может также предпочесть поставить свой дистрибутив с локалью KOI8-R и втянуться в её использование. Не все пишут на ЛОР и другие ресурсы. Люди заняты своими делами.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

не привыкших просто так метаться от одного стандарта к другому

И это говорит мне чел, пару постов выше предлагавший мне на выбор

KOI8-R, BIG5, GB, JIS, KSC, EUC, Shift-JIS, EBCDIC,... и т.д.

Люди заняты своими делами.

Именно. И по-этому UTF.

beastie ★★★★★
()
Ответ на: комментарий от beastie

Я просто перечислил имеющиеся у людей варианты. И люди выбирают. И хорошо если выбирают, а не бездумно соглашаются с дефолтной UTF-8. Не всем она подходит.

saahriktu ★★★★★
() автор топика

Почему-то у меня на протяжении всего этого треда складывается впечатление, что автор топика пытается доказать, что KOI8-R до сих пор является популярным и общепринятым не только нам, но и себе. В первую очередь себе.

EXL ★★★★★
()
Последнее исправление: EXL (всего исправлений: 1)
Ответ на: комментарий от te111011010

Так никто не возражает. Но, каждый выбирает своё.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от beastie

Конверторы текстов никто не отменял. А веб-страницы, как правило, и так открываются должным образом, несмотря на то, что все в разных кодировках.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от EXL

Я знаю, что в последнее время KOI8-R перестала быть популярной (хоть в целом это в некотором роде удивительно; столько писать про неё в мануалах, а всего меньше чем через 10 лет...), но её никто не отменял, здесь и доказывать нечего. Пока хоть один человек что-то продолжает юзать оно не похоронено.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

Ладно, я устал. ;) Продолжай доказывать сам себе, что не зря тратишь своё жизненное время на эту туфту.

beastie ★★★★★
()
Ответ на: комментарий от Harald

А как быть с потерей юзерами UTF-8 тех текстов, которые пока ещё не переконвертированы в UTF-8? Чтобы ничто внезапно не потерялось они должны быть всегда, мало ли что. А если они есть, то другие кодировки никаких серьёзных проблем не представляют.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

Ну для цифровых археологов конверторы кодировок конечно нужны будут как рабочий инструмент, остальным нет

Harald ★★★★★
()
Ответ на: комментарий от saahriktu

А теперь представь, что бровзерам не надо было бы заниматься этой чёрной магией с перекодировкой тяжёлого наследия прошлого. И фурифокс весил бы сразу не 150M, а 50M. ;) KISS

beastie ★★★★★
()
Ответ на: комментарий от beastie

Не весит этот функционал в Firefox'е столько. А, вообще, в современных линуксах под полторы сотни метров весит только glibc:

> du -csh ../glibc_2.24_x86_64_linux/
132M    ../glibc_2.24_x86_64_linux/
132M    итого
> du -csh *
12K     etc
26M     lib64
10M     sbin
96M     usr
16K     var
132M    итого
> du -csh usr/*
2,8M    usr/bin
3,2M    usr/include
71M     usr/lib64
8,0K    usr/libexec
1,2M    usr/sbin
19M     usr/share
96M     итого
> du -csh usr/lib64/*.a
...
55M     итого
> find . -type f | wc -l
1376
> find . -type d | wc -l
111
В дистрибутивах почти всё прогоняют через strip. Без этого Firefox со своими библиотеками, кстати, весит около одного гига.

saahriktu ★★★★★
() автор топика
Последнее исправление: saahriktu (всего исправлений: 1)
Ответ на: комментарий от CYB3R

Сначала вы перестаньте навязывать UTF-8. Все локали имеют право на существование и использование. Я не против UTF-8 в корне. Хотите юзать - пожалуйста. Я против притеснения KOI8-R и её юзеров.

saahriktu ★★★★★
() автор топика

Прочитал весь тред, но так и не понял в чём удобство использования koi8. В чём это удобство заключается? Может мне именно её не хватало для полного счастья?

flyshoot
()
Ответ на: комментарий от saahriktu

Никто не навязывает UTF-8. Все тихонько используют то, что им удобнее. Некоторые, конечно, делают это слишком активно (привет, Dreamject!).
Навязываешь тут именно ты. Ну нравится тебе KOI-8, ну так и используй её. Нечего на ЛОР о каждом своём подвиге с кодировкой писать, ЛОР же вообще содержит ненавистный юникод, а Макском лично выпилил раздел books, который был в KOI-8R! Ты себя ведёшь, как люди на гей-параде.

CYB3R ★★★★★
()
Ответ на: комментарий от CYB3R

Выше писал, что это мой ответ на то, что началось уже давно. Мне ещё где-то в 2008-2009-х гг на упоминание (как я в то время считал, широко используемой) KOI8-R писали: «Деда, вылазь из танка, война окончилась!». Потом это продолжилось когда я начал выкладывать новости про релизы Pisaahriktux. А потом на ЛОРе все праздновали выпиливание KOI8-R из OpenBSD. И стоило мне заметить, что это не радостно, а грустно как начались новые витки старого...

Любой форум - это не только модераторы, но и другие люди. В т.ч., сюрприз, юзающие KOI8-R. Просто не все влезают в споры по её поводу. Многие вообще не хотят спорить. Я тоже особо не хочу. Но, умею.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

Но, умею.

Нет, не умеешь. Ты просто навязываешь свою кодировку, но не объясняешь её преимущества. А может, их просто нет.

CYB3R ★★★★★
()
Ответ на: комментарий от flyshoot
  • Зачем прыгать с кодировки на кодировку? А если потом появится ещё какая-нибудь VUG-256, то все с радостью на неё перепрыгнут и переконвертируют свои коллекции текстовых файлов? Не проще ли выбрать кодировку один раз в жизни?
  • Экономия системных ресурсов; тексты занимают меньше места на носителях и в оперативке и быстрее обрабатываются;
  • Можно продолжать юзать <<main (int argc, char **argv)>>, strncpy, strncmp, printf,... и другие неюникодные функции;
  • Можно переместить указатель на подстроку со смещением N символов просто прописав «strptr + N» без привлечения лишних сущностей в лице ICU (для отфильтровывания диакритики и других модификаторов);
  • В ядерной консоли по-прежнему размер символа может быть не больше чем 32x32 пикселя, а весь шрифт может весить не более чем 64 Кб. Отсюда и проблемы с кол-вом символов более чем 256. На уровне ядра. Поэтому юзерам ядерной консоли без иксов особой разницы нет, и можно продолжать извлекать преимущества KOI8-R.
  • И т.д.
saahriktu ★★★★★
() автор топика
Последнее исправление: saahriktu (всего исправлений: 1)
Ответ на: комментарий от CYB3R

Объясняю. Много раз. И по пунктам (см. выше) и так:

Must be a special reason? I'm not of those who greed for modern standarts and ruin everything for rebuilding
   all again. I even don't use X. Native framebuffer terminal is more than enough for me. Most part of my files is
   plain text (not ASCII only; with cyrillic letters here and there; but, nothing else). My PSF Terminus font
   provides 256 chars only. Also I haven't reason to left behind classic char/char* functions and migrate to new
   wchar_t subsystem. Switching to UTF-8 locale must be a big waste. Also I'm pretty sure my case isn't sporadic.
   Furthermore, most active CLI tools users are those who thinking in the same way. Primary usage of CLI tools for
   the rest of people not go beyond than scripts and bots.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от beastie

Т.ч. пусть горят 8-и битные кодировки в аду. И их сподвижники-староверы тоже.

оскорбление чувств верующих.

sudo
()
Ответ на: комментарий от saahriktu

Тема про то, что происходит в пределах границ России.

Интернет в пределах границ России? Нюню.

Напомнило искреннее убеждение некоторых православных бабулек о том, что Иисус Христос был русским).

sudo
()
Ответ на: комментарий от sudo

Интернет в пределах границ России?

Потенциальные юзеры KOI8-R физически находятся в пределах границ России. Хотя это могут быть и переселенцы в другие (англоязычные) страны, где ряду людей выше крыши хватает ASCII. А тут можно ещё и кириллицу прихватить.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

Не кириллицу, а очень маленькую часть кириллицы. Кириллица вот: https://en.wikipedia.org/wiki/Cyrillic_script_in_Unicode

Но даже для текста на русском языке кодировки KOI8-R недостаточно. Кавычек нет, тире нет. Я уж не говорю о значке параграфа или рубля.

TeopeTuK ★★★★★
()

Список ссылок на сайты в KOI8-R

Перепись населения в гробах на кладбище.

h578b1bde ★☆
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.