LINUX.ORG.RU
ФорумTalks

В июле этого года исполняется 26 лет стандарту KOI8-R

 


1

2

Сабж. Именно 26 лет назад, в июле 1993-его года, был создан RFC 1489.
За принятие RFC 1489 выступала Society of Unix User Groups (SUUG), поскольку кодировка KOI8-R уже была де-факто стандартом мира Unix на территории бывшего СССР.
Юникод уже существовал и RFC 1489 описывает соответствие кодов символов кодам уже принятого юникодного стандарта ISO 10646 для тех, кому юникод избыточен.

Стандарт KOI8-R до RFC 1489 никогда не публиковался, но основан на нескольких опубликованных стандартах: ГОСТ 19768-74 (старый КОИ8), ISO 6937/8 (не зарегистрирован) и вариациях - INIS-cyrillic и ISO 5427.

* * *

Ура! Поздравляю KOI8-R'щиков с очередным днём рождения стандарта самой лучшей кодировки!

★★★★★
Ответ на: комментарий от saahriktu

Мой техпис на работе работает с текстами. Ей пофиг, какая там кодировка, главное, чтобы текст нормальный получился.

kirk_johnson ★☆
()
Ответ на: комментарий от saahriktu

Нет, не притесняют. Каждый выбирает себе кодировку по своему вкусу.

Нет, притесняют. Людям нужно работать с текстом, а им приходится твою бнопню распердоливать. Почему вы так ненавидите других людей?

kirk_johnson ★☆
()
Последнее исправление: kirk_johnson (всего исправлений: 1)
Ответ на: комментарий от kirk_johnson

В чём работает? Здесь под «текстом» подразумевается plaintext, а не работа в офисном софте. И вот когда юзер начнёт нормально работать с plaintext'ом (а это очень мощный и незаменимый инструмент!) вот тогда он и понимает что такое кодировки этого самого plaintext'а.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от kirk_johnson

Выбирая себе кодировку по своему вкусу человек обучается и узнавать с первого взгляда тексты в других кодировках как они отображаются в его любимой кодировке. Это не проблема.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

что такое кодировки этого самого plaintext'а

Кодировки plaintext - utf8, или utf8, а может еще и utf8. Больше ничего пользователю знать не нужно.

ptarh ★★★★★
()
Ответ на: комментарий от saahriktu

Под работой подразумевается полезная людям деятельность. Пердоленье графоманских текстов - не работа. Написание таймера на пол экрана так, что кровь из глаз - это не работа.

Shaman007 ★★★★★
()
Ответ на: комментарий от saahriktu

В чём работает? Здесь под «текстом» подразумевается plaintext, а не работа в офисном софте. И вот когда юзер начнёт нормально работать с plaintext'ом (а это очень мощный и незаменимый инструмент!) вот тогда он и понимает что такое кодировки этого самого plaintext'а.

Нет, не понимает. Мой техпис пишет в Markdown и ей пофиг на кодировки, потому что у всех все в UTF-8.

kirk_johnson ★☆
()
Ответ на: комментарий от saahriktu

Инструмент делает что-то полезное. Облегчает жизнь, повышает производительность, упрощает технологический процесс. KOI-8 появился из-за ограничений аппаратуры того времени и гигантского ЧСВ некоторых товарищей. Ничего полезного он не принес.

Shaman007 ★★★★★
()
Ответ на: комментарий от saahriktu

Нет, не всё и не у всех.

В моей конторе все и у всех. В моей предыдущей конторе то же самое.

kirk_johnson ★☆
()
Ответ на: комментарий от kirk_johnson

а вот мне относительно недавно некоторые китайцы присылали е-мейлы на русском не в UTF-8, а в какой-то GB-18030 кажется

Harald ★★★★★
()
Ответ на: комментарий от Deleted

Это просто удивительно: из всего многообразия мира интересоваться такой унылой и бессмысленной вещью как кодировки текста.

Shaman007 ★★★★★
()
Ответ на: комментарий от Shaman007

Кто-то же кодировки изобретает, стандарты для них пишет. Или на UTF-8 эволюция с прогрессом закончится и дальше всё?

Harald ★★★★★
()
Ответ на: комментарий от Shaman007

С другой стороны, в этом сила человеческого разнообразия.

Deleted
()
Ответ на: комментарий от Shaman007

Например, позволяет читать байты с кодами 128-255 в выхлопе «hexdump -C»:

00009590  0b 00 c7 05 20 f2 0b 00  00 00 00 00 48 c7 05 a1  |..г. Р......Hг.║|
000095a0  53 0b 00 da c0 48 00 e8  c4 11 02 00 48 8b 3d 2d  |S..зюH.Хд...H▀=-|
000095b0  f0 0b 00 e8 98 ed 01 00  e8 d3 31 02 00 e8 fe 3a  |П..Х≤М..Хс1..ХЧ:|
000095c0  05 00 31 f6 bf c0 f2 4c  00 c7 05 4d da 0b 00 01  |..1Ж©юРL.г.Mз...|
000095d0  00 00 00 e8 68 fb ff ff  85 c0 0f 85 2d fd ff ff  |...ХhШЪЪ┘ю.┘-ЩЪЪ|
000095e0  48 8b 44 24 10 48 89 05  3c 12 0c 00 48 8b 04 24  |H▀D$.H┴.<...H▀.$|
000095f0  48 8b 18 48 85 db 0f 84  13 02 00 00 48 89 df e8  |H▀.H┘ш.└....H┴ъХ|
00009600  cc f9 00 00 48 89 05 ad  d9 0b 00 80 3b 2d 0f 84  |лЫ..H┴.╜ы..─;-.└|
00009610  52 07 00 00 48 8b 05 9d  d9 0b 00 80 38 73 75 1f  |R...H▀.²ы..─8su.|
00009620  0f b6 50 01 80 fa 68 0f  84 58 07 00 00 80 fa 75  |.╤P.─Зh.└X...─Зu|
00009630  75 0d 80 78 02 00 75 07  83 05 05 da 0b 00 01 48  |u.─x..u.┐..з...H|
00009640  8b 3d 7a 14 0c 00 48 89  1d 6b d9 0b 00 48 85 ff  |▀=z...H┴.kы..H┘Ъ|
00009650  74 05 e8 19 ea ff ff 48  8b 1d 5a d9 0b 00 31 c0  |t.Х.ЙЪЪH▀.Zы..1ю|
00009660  48 83 c9 ff 48 89 df f2  ae 48 f7 d1 48 89 cf e8  |H┐иЪH┴ъР╝HВяH┴оХ|
00009670  6c be 05 00 48 89 de 48  89 c7 e8 21 eb ff ff 48  |l╬..H┴чH┴гХ!КЪЪH|
00009680  89 05 3a 14 0c 00 48 8b  05 2b d9 0b 00 48 85 c0  |┴.:...H▀.+ы..H┘ю|
00009690  0f 84 69 01 00 00 0f b6  10 84 d2 0f 84 5e 01 00  |.└i....╤.└р.└^..|
000096a0  00 80 fa 2d 0f 84 4b 01  00 00 31 ff e8 1f f3 ff  |.─З-.└K...1ЪХ.СЪ|
000096b0  ff 44 8b 74 24 28 48 89  05 4b 11 0c 00 44 39 74  |ЪD▀t$(H┴.K...D9t|
000096c0  24 0c 0f 84 d7 00 00 00  48 8b 14 24 49 63 c6 48  |$..└в...H▀.$IcфH|
000096d0  8b 1c c2 48 85 db 0f 84  c3 00 00 00 0f 1f 40 00  |▀.бH┘ш.└ц.....@.|

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от Harald

Это как с колесом. На данный момент — UTF-8 is good enough. Его хватает для всех языков, текст редачить можно, показывать можно, его понимают все девайсы, требуется всего один шрифт (а не по сотне на кодировку), новые языки добавлять можно ещё долго. Зачем нужно что-то ещё?

kirk_johnson ★☆
()
Ответ на: комментарий от saahriktu

KOI8-R очень многое облегчает. Это неочевидно только тем, кто не умеет с ним работать.

Если он облегчает написание подобных высеров:

Жил был на Северном полюсе жираф по имени Слоник Котофеевич. Он был очень высоким жирафом с очень больной шеей. Он никогда не смотрел ни вниз, ни вверх, а только прямо. Его любимой пищей были пилоты самолётов, хотя он не понимал, зачем это летающие котлеты заворачивают себя в такую толстую скорлупу.

то лучше бы не облегчал.

kirk_johnson ★☆
()
Ответ на: комментарий от saahriktu

UTF-8 is not the answer, UTF-8 is the question, the answer is no.

Это у вас в дурке там the answer is no, а у всех остальных как бы очевидное «да».

ptarh ★★★★★
()
Ответ на: комментарий от saahriktu

позволяет читать

|H┐иЪH┴ъР╝HВяH┴оХ

И как оно по МФА читается?

gremlin_the_red ★★★★★
()

KOI8-R - как любая однобайтовая кодировка - просто быстрее. Что важно при отработке текстов.
Других преимуществ не вижу.

record ★★★★★
()
Последнее исправление: record (всего исправлений: 6)
Ответ на: комментарий от record

На самом деле, мастдайные кодировки быстрей, т.к. там буквы идут в алфавитном порядке, поэтому для сортировки не нужно запускать промежуточную функцию, вычисляющую номер буквы. Но если потерять восьмой бит, КОИ остается читабельной. Правда, давно уже никто восьмой бит не теряет...

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от saahriktu

только идиот будет использовать хрюникод-8!

Если уж человек - китаец, и ему 8-битной кодировки в консольке не хватает (ну хочется ему зачем-то на родном языке писать в консольке!), то он пользуется хрюникодом-32.

А дебилы безмозглые мучаются с хрюникодом-8, где нет постоянной длины символа и просто невозможно по-человечески парсить тексты!!!

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от Eddy_Em

А дебилы безмозглые мучаются с хрюникодом-8, где нет постоянной длины символа и просто невозможно по-человечески парсить тексты!!!

Пишу в UTF-8, ни с чем не мучаюсь. Что я делаю не так?

kirk_johnson ★☆
()
Ответ на: комментарий от Eddy_Em

Я имел в виду, что однобайтовые кодировки, типа koi8-r, всяко быстрее большинства юникодных кодировок, что это весьма важный аргумент )
И, значит, нужен.

record ★★★★★
()
Ответ на: комментарий от kirk_johnson

А ты на божественной сишечке накатай простую программу, которая будет из текстового файла выбирать строки с N-го по M-й символ. Посмотрю, как запоешь!

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от te111011010

Я просто пишу о том, что мне интересно, а не для того, чтобы меня помнили.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от kirk_johnson

Блин, ну возьми, да проверь: сгенерь текстовый файл на 8-битной кодировке и на говнохрюникоде. А потом посмотри, как быстро там будет отрабатывать strchr, strstr, strcasecmp и прочее.

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от Eddy_Em

А ты на божественной сишечке накатай простую программу, которая будет из текстового файла выбирать строки с N-го по M-й символ. Посмотрю, как запоешь!

Я лучше возьму rust или Go. Если мне все-таки придется писать это на C, я возьму библиотеку для работы со строками и все равно не буду страдать.

kirk_johnson ★☆
()
Ответ на: комментарий от Eddy_Em

Блин, ну возьми, да проверь: сгенерь текстовый файл на 8-битной кодировке и на говнохрюникоде. А потом посмотри, как быстро там будет отрабатывать strchr, strstr, strcasecmp и прочее.

Нет, это вы кукарекаете, что KOI8-R нужен. Вы и доказывайте.

kirk_johnson ★☆
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.