LINUX.ORG.RU
ФорумTalks

В июле этого года исполняется 25 лет стандарту KOI8-R

 ,


0

1

Сабж. Именно 25 лет назад, в июле 1993-его года, был создан RFC 1489.
За принятие RFC 1489 выступала Society of Unix User Groups (SUUG), поскольку кодировка KOI8-R уже была де-факто стандартом мира Unix на территории бывшего СССР.
Юникод уже существовал и RFC 1489 описывает соответствие кодов символов кодам уже принятого юникодного стандарта ISO 10646 для тех, кому юникод избыточен.
Через некоторое время (в мае 1999-го) и в glibc (версии 2.1.1) поддержка локали KOI8-R была добавлена не отдельной самодостаточной подсистемой, на поддержку которой нужны дополнительные силы и время, а как подмножество юникода (поддержка которого была добавлена только в glibc 2.0.1 (февраль 1997-го)).

Стандарт KOI8-R до RFC 1489 никогда не публиковался, но основан на нескольких опубликованных стандартах: ГОСТ 19768-74 (старый КОИ8), ISO 6937/8 (не зарегистрирован) и вариациях - INIS-cyrillic и ISO 5427.

Стандарт KOI8-U был принят позже - в RFC 2319 в апреле 1998-го года (в апреле было 20 лет).

* * *

Ура! Поздравляю других KOI8-R'щиков с юбилеем стандарта самой лучшей кодировки!

★★★★★
Ответ на: комментарий от Harald

сторонними библиотеками-то можно, всякими libicu, если не ошибаюсь. Да и своё навелосипедить можно

Можно. Но я тут запердолил Rust в продакшон и выяснил следующие вещи:

1. Синтаксис, если не устравить тотальный трешак, можно успешно побороть и код будет читаемым.

2. Скорость работы очень достойная и мне хватает за глаза.

3. Комьюнити выросло и для моих задач в crates.io я нашел все, что нужно.

И я теперь подумываю о том, что если все продолжится в таком духе, у C наконец-то появится действительно хорошая замена.

kirk_johnson ★☆
()
Ответ на: комментарий от te111011010

Но, для самого себя любой человек/любая группа людей может организовать любое напряжение. Так и здесь. При этом локаль KOI8-R не исключает экспорта во вне в UTF-8.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от kirk_johnson

Там есть нормализация конкретного юникодного кодепоинта. Для многих низкоуровневых задач этого вполне достаточно.

saahriktu ★★★★★
() автор топика
Последнее исправление: saahriktu (всего исправлений: 1)
Ответ на: комментарий от saahriktu

Устранение «некорректных последовательностей байт» в юникоде.

Нет.

kirk_johnson ★☆
()
Ответ на: комментарий от saahriktu

Ну так организуй себе свой манямирок с кои8. А не продвигай отказ от юникода на веб-сайтах.


Кстати, правильно писать КОИ-8, а не KOI-8, когда пишем на русском языке.

te111011010
()
Ответ на: комментарий от te111011010

А в 30-е годы были избыточны семивагонные поезда в московском метро. И домашние электрические сети с максимальной нагрузкой более трёх киловатт.

В деревне «Кривые берёзы» с её 15-ю жителями это и сегодня избыточно. И с однобайтными кодировками также. Там, где верстают документы на десяти языках одновременно, без юникода никак. Но, если таких задач у юзера нет, то, вполне вероятно, что больше чем однобайтные кодировки ему и не нужно. Особенно если он читает и пишет только на русском и английском языках.

saahriktu ★★★★★
() автор топика

KOI8-R нужен, а остальные кодировки не нужны. Потому что, кроме моей страны, на карте мира другой нет, а «все люди» = «все мои знакомые». И вообще, русский мир, у нас своя атмосфера, а в тех редких случаях, когда надо контактировать с другими странами, нам не западло сменить кодировку.

Все на Red Hat 7.3! После него весь линукс был - сладким хлебушком! Бэкпортируем туда все новые драйвера и назад, в прекрасный линукс!

ZenitharChampion ★★★★★
()
Ответ на: комментарий от te111011010

Что такое нормалицзация?

В Unicode часть букв может быть представлена двумя способами: одним символом A или двумя символами B+C. Нормализация — процесс модификации строки таким образом, чтобы форма представления была единообразной.

kirk_johnson ★☆
()
Последнее исправление: kirk_johnson (всего исправлений: 1)
Ответ на: комментарий от te111011010

КОИ-8 это ГОСТ, KOI8-R - международный стандарт. Тред про последний

TheAnonymous ★★★★★
()
Ответ на: комментарий от saahriktu

Мне порыться в истории твоих сообщений? Мне лень, но я помню, что ты продвигал. Если что, готов поспорить на деньги. Если найду, то ты мне будешь должен, скажем, 1000 рублей.

te111011010
()
Ответ на: комментарий от saahriktu

Особенно если он читает и пишет только на русском и английском языках.

Я полгода назад тоже писал только на русском и английском.

te111011010
()
Ответ на: комментарий от tailgunner

Кстати, судя по интервью, откуда это вырвано, мне не совсем ясно, не стеб ли это:

http://blogerator.org/page/andrej-chernov-mikrostimuli-pohlopyvanij-kontrol-i...

Вот цитаты оттуда же:

— Предлагаю сразу перейти к наиболее злободневной теме. Как вы относитесь к ужесточению законодательства в отношении Интернета?

— Важно не то, как я к этому отношусь, — я перестал удивляться чему-либо с момента принятия ФЗ «О внесении изменений в ФЗ „О защите детей от информации...“» — а то, чего желает наше общество в целом. Куда оно стремится? Как именно уточняется общественный договор? Существует способ продемонстрировать радикальное общественное несогласие — это масштабные гражданские волнения. Инициативы РОИ, РАЭК и Пиратской партии на этом фоне — никого и ни к чему не обязывающая маниловщина.

Если ничего подобного — даже одиночных самосожжений на городских площадях — не произошло, значит, общество согласно. Пусть оно отчасти недовольно, не сумев пока избавиться от старых привычек, но в целом согласно. Именно это позволяет двигаться вперед в обозначенном направлении. Вперед к патриотическому традиционному евразийскому обществу, представленному такими образцами для подражания, как Северная Корея, Китай и некоторые исламские государства (например, Иран).

К примеру, если у вас есть анонимный Биткоин, то вы уже наркоман, педофил, террорист или их пособник, возможно, даже этого не подозревая. Поэтому квалифицированные специалисты из ЦБ РФ и Генпрокуратуры оперативно разобрались с этим вопросом для вашего же блага.

Вот и пойми, всерьез это, или нет. Скорее и это стеб, если почитать дальше этой цитаты.

Zubok ★★★★★
()
Последнее исправление: Zubok (всего исправлений: 1)
Ответ на: комментарий от kirk_johnson

Вот этим юникод многим и не нравится. Поддерживать весь юникод с модификаторами мало кому хочется.

С другой стороны, некоторые могут пойти на компромисс и решиться поддерживать только часть юникода. Без модификаторов. Как и в однобайтных кодировках. С той точки зрения, что и при таком подходе символов у юзера становится гораздо больше чем в однобайтных кодировках. И если этого достаточно, то почему бы и нет?

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от te111011010

Нет, не продвигал. Я приводил список сайтов в KOI8-R. Но, не более этого. При этом я нигде не писал, что, якобы, все должны брать с этих сайтов пример. Пусть будет юникод. lynx'у без разницы какая кодировка. Он всё автоматически конвертирует в кодировку локали.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от burato

да, с тех пор как Эдди здесь нет, вариант теперь только один.

grem ★★★★★
()
Ответ на: комментарий от te111011010

Нет, не спорим. Вывернуть наизнанку можно любые слова. Можно, например, вот это интерпретировать как то, о чём Вы говорите:

Как «зачем»? Чтобы очертить передовой сегмент интернета, админы которого не поддаются на провокации и не следуют слепо моде, ломая сервера.

Но, в этих словах речь шла конкретно про KOI8-R и её актуальность. В этой же теме следом я писал:

Я никого не заставляю юзать KOI8-R. Я за то чтобы сторонников KOI8-R не заставляли юзать UTF-8. А кто хочет юзать UTF-8 - пожалуйста, никто же не против. Юзеры обоих локалей могут сосуществовать мирно если не будут кричать про психиатров и экзорцистов при упоминании другой локали.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

Поддерживать весь юникод с модификаторами мало кому хочется.

Ну, если ты пердолишься с C — да. Но появились новые языки, где это больше не является проблемой.

kirk_johnson ★☆
()
Ответ на: комментарий от saahriktu

ОК, ты оплачиваешь лингвистическую экспертизу. Если она признаёт, что эти слова не означают то, что ты ставишь адимнов этих сайтов выше админов сайтов на юникоде, то я оплачиваю и твою тысячу, и стоимость экспертизы. Если признаёт, что означают, то ты мне платишь тысячу, ну и экспертиза за тобой.

te111011010
()
Ответ на: комментарий от te111011010

Заметьте, это Ваши проблемы. Я никогда ни с кем не спорю и ничего никому никогда не доказываю.

saahriktu ★★★★★
() автор топика

За это и выпить не грех!

dk-
()
Ответ на: комментарий от te111011010

Нет, я комментирую, что юникод не всем нужен, а KOI8-R - одна из актуальных кодировок и локалей. А появился я на ЛОРе в 2007-м году, зарегистрировавшись из ядерной консоли с локалью KOI8-R, но про KOI8-R почти ничего не писал. Да и юникод в те годы в линуксах ещё только набирал обороты. Уже после на моих глазах в vt.c добавили переменную, которая отвечает за переключение на юникод, и первое время она была выставлена в false. Шли годы. Переменную выставили в true, я вычислил настройки, которые описал здесь, - http://saahriktu.org/ru/koi8rlinuxsetup.html . Большинство моих комментариев про KOI8-R появились уже после.

saahriktu ★★★★★
() автор топика
Последнее исправление: saahriktu (всего исправлений: 1)
Ответ на: комментарий от meliafaro

Да, и это жизнь. Даже жизнь EISA в Linux'е продолжается:

Для ядра Linux предложен патч, убирающий поддержку шины EISA и связанных с данной шиной драйверов устройств. В качестве мотива указывается на то, что использование EISA производителями фактически прекращено 20 лет назад, после того как данный интерфейс был вытеснен шиной PCI. Шина EISA просуществовала с 1988 по 1995 год и, как правило, оставалась на устаревших компьютерах с CPU 486/586 частотой 33-166MHz и 8-64MB ОЗУ. Так как сомнительно, что где-то до сих пор актуальное ядро Linux используется на подобных системах, поставлен вопрос целесообразности дальнейшей поддержки EISA в ядре Linux.

В процессе обсуждения патча нашёлся пользователь, у которого до сих пор работает хост с адаптером EISA FDDI и он пожелал бы продолжать использовать на нём актуальные выпуски ядра. В ответ Линус Торвальдс изложил политику в отношении удаления устаревших возможностей, заявив, что если остаётся хотя бы один пользователь, у которого имеются рабочие конфигурации на базе EISA, то поддержка данной технологии не будет удалена из ядра.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от te111011010

Ну так организуй себе свой манямирок с кои8.

Ну так он и. Просто иногда ему там так тепло и хорошо, что он выходит в свет за ушатом остужающих помоев.

t184256 ★★★★★
()
Ответ на: комментарий от Shaman007

Читая историю софта в СССР и сразу после, вспоминается двойной голландский штурвал. Такое впечатление, что каждый НИИ хотел запилить свою кодировку, версию UNIX или сеть. Сделали ли они что-то реально полезное? Не, зачем, главно - процесс.

Было такое. В нашем ФГУП ГНПП «Рубин» в 2000 году под Линукс народ реестр писал. Да, как в винде. Чем всё кончилось, не знаю, я уволился, но немного предсказуемо...

tiinn ★★★★★
()
Ответ на: комментарий от tiinn

Я так и знал, что dconf придумали люди, искренне ненавидящие все живое.

kirk_johnson ★☆
()

Правильно говорить «исполнилось бы»

Deleted
()

поскольку кодировка KOI8-R уже была де-факто стандартом мира Unix на территории бывшего СССР

поскольку кодировка КОИ-8 уже была де-факто стандартом мира IT на территории бывшего СССР

У меня на БК0010-01 была эта кодировка, и на УКНЦ. Возможно и на Радио86-РК она тоже была. Это точно за пределами мира UNIX.

Rupricht ★★
()

поддержка локали KOI8-R была добавлена не отдельной самодостаточной подсистемой, на поддержку которой нужны дополнительные силы и время, а как подмножество юникода

Ну все, это уже не труъ. Даже тут без юникода обойтись не могут!

cvs-255 ★★★★★
()
Ответ на: комментарий от kirk_johnson

А вот пользователей KOI8-R (кроме saahriktu) я в глаза не видел.

часть почты до сих пор в этой кодировке приходит, а лет 5-7 порядка 90% всей русской почты была в этой кодировке - я специально скриптом проверял. да и в linux я его у себя ещё помню году так 2004-2006, так что не тренди.

vtVitus ★★★★★
()
Ответ на: комментарий от vtVitus

часть почты до сих пор в этой кодировке приходит, а лет 5-7 порядка 90% всей русской почты была в этой кодировке - я специально скриптом проверял.

Я до сих пор получаю почту в KOI8-R с некоторых exchange'й. Это не делает KOI8-R более живым, просто кто-то сервак забыл настроить нормально.

да и в linux я его у себя ещё помню году так 2004

Это было 14 лет назад. Девочек, которые родились в том году, через пару лет можно будет безнаказанно пердолить в попчанский.

kirk_johnson ★☆
()
Последнее исправление: kirk_johnson (всего исправлений: 1)

Эдик был в треде?

Zhbert ★★★★★
()
Ответ на: комментарий от kirk_johnson

А вот пользователей KOI8-R (кроме saahriktu) я в глаза не видел.

Я Эдика видел. Даже по пиву с ним дунули на речке.

Zhbert ★★★★★
()
Ответ на: комментарий от kirk_johnson

Это было 14 лет назад. Девочек, которые родились в том году, через пару лет можно будет безнаказанно пердолить в попчанский.

Зачем, если есть кои8?

Zhbert ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.