LINUX.ORG.RU
ФорумTalks

Список ссылок на сайты в KOI8-R

 ,


0

3

Начал составлять сабж. Пока в списке 31 ссылка. Среди них «Институт Ядерной Физики им.Г.И.Будкера СО РАН», «Информационные научно-образовательные ресурсы ГАГУ», «Нижегородский Университетский Центр Интернет», «ивановский региональный портал», «МЦНМО: МОСКОВСКИЙ ЦЕНТР НЕПРЕРЫВНОГО МАТЕМАТИЧЕСКОГО ОБРАЗОВАНИЯ», «Институт лингвистических исследований», «„За науку!“ :: газета Алтайского государственного университета», «Переславль-Залесский — информационный портал города» и «Специальная астрофизическая обсерватория Российской академии наук». А также ресурсы с документацией по UNIX'ам.

Список здесь: http://saahriktu.org/koi8rsitez.html .

★★★★★

Последнее исправление: saahriktu (всего исправлений: 1)

Ответ на: комментарий от saahriktu

я и есть из ряда олдскульных хакеров

говнокод на C

Чтобы называться “олдскульным хакером”, недостаточно быть упоротым ретроградом, нужно иметь какую-никакую квалификацию (это касаемо “хакера”).

theNamelessOne ★★★★★
()
Ответ на: комментарий от te111011010

А теперь расскажи нам, как без юникода разместить текст, в котором присутствуют символы из разных языков? Ну например статья про слово греческого происхождения, где указано, от какого греческого слова оно происходит.

Транслитом же писать, что ты как маленький.

theNamelessOne ★★★★★
()
Ответ на: комментарий от te111011010

Почему ты хочешь, чтобы у меня не было выбора?

Я никого не заставляю юзать KOI8-R. Я за то чтобы сторонников KOI8-R не заставляли юзать UTF-8. А кто хочет юзать UTF-8 - пожалуйста, никто же не против. Юзеры обоих локалей могут сосуществовать мирно если не будут кричать про психиатров и экзорцистов при упоминании другой локали.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

А я разве говорил что-то про невозможность сортировки? Достаточно того, что приходится протаскивать через маппинг

Deleted
()
Ответ на: комментарий от Neurotizer

Fail

Если внимательно приглядеться к реализации, то будет видно что это демонстрационная версия алгоритма, которая выполняет сортировку _только по первой букве_. Для более полной сортировки нужно добавить в массив маленькие буквы и добавить ещё циклов по последующим индексам букв.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от imul

Какая разница какие задачи изначально стояли перед разработчиками стандарта если у него впоследствии появляются сторонники для этих самых сторонников? Если бы людям было неудобно, то они бы не становились сторонниками стандартов.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от theNamelessOne

нужно иметь какую-никакую квалификацию (это касаемо «хакера»).

У нас, видимо, разное понимание слова «хакер». Моё понимание этого слова ближе к Столлмановскому - тот, кому нравится программировать, изучать, исследовать, собирать и пересобирать, находить (не всегда стандартные) решения,... и т.д. В этом контексте «олдскульный хакер» - это продолжатель традиций тех, кто стоял у истоков Unix'ов в 70-80-е гг. Кто за простоту и удобство в понимании Unixway'я, кому очень нравится командная строка,... и т.д. Тот, кто после пересборки собственной сборки на основе LFS'а может произнести: «Давно так не веселился!». И т.п.

saahriktu ★★★★★
() автор топика
Последнее исправление: saahriktu (всего исправлений: 1)
Ответ на: комментарий от saahriktu

Зачем тем людям, которые не являются полиглотами, и живут в России зная не более чем русский и английский, ещё что-то сверх KOI8-R? Если только для смайликов.

а ничо, что люди пишущие программы думают о том, что эти программы могут использовать и ингостранцы?

Я вот допустим написал программу с поддержкой UTF и знаю, что ей без какого либо бубна могут пользоваться все.

dikiy ★★☆☆☆
()
Ответ на: комментарий от dikiy

ей без какого либо бубна могут пользоваться все

Юзеры России с локалью KOI8-R не могут. Для пользования внутри страны локаль «KOI8-R is preferred in Russia» (c) исходники ядра Linux 4.7.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

И это, не следует забывать, что универсальным юникодный софт может быть только или если перекладывает строки «as is» или если в нём есть куча языковых модулей для всех языков. А если код, как в примере выше, просто сортирует фамилии по буквам кириллицы в алфавитном порядке, то какой от неё толк арабам, индусам и китайцам? Тут нужно чтобы код и про их иероглифы знал, ведь, у них может быть тоже своё представлени об алфавитном порядке, совершенно не совпадающее с юникодным. А если код заточен под кириллицу, то он может быть реализован и под KOI8-R. И сортировать фамилии в кириллице он будет у всех - достаточно запустить под локалью KOI8-R.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

ей без какого либо бубна могут пользоваться все

Юзеры России с локалью KOI8-R не могут.

Юзеры США или Европы с локалью ASCII или ISO-какой-то тоже не могут. Поэтому ставят локаль UTF-8.

Юзеры России в этом время продолжают грызть кактус и писать костыли.

dikiy ★★☆☆☆
()
Ответ на: комментарий от saahriktu

Могут, если все программы (за исключением твоих собственных хеллоувордов, которые только для тебя самого предназначены) пишутся с поддержкой длинных символов. А в таком случае все преимущества однобайтных кодировок сходят на нет.

te111011010
()
Ответ на: комментарий от saahriktu

Зачем тем людям, которые не являются полиглотами, и живут в России зная не более чем русский и английский, ещё что-то сверх KOI8-R?

Многие в какой-то мере владеют украинским или белорусским, хотя бы прочитать слово могут.

te111011010
()
Ответ на: комментарий от te111011010

Это называется «юзеры юникода тянут одеяло на себя». А можно никому не тянуть. Кто хочет - юзает юникод и пишет юникодный софт, а кто не хочет - юзает KOI8-R и пишет софт под KOI8-R. И все счастливы.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

ffgj

а кто никому не нужен — юзает кой8

Откажись ещё от http — есть ведь ещё кошерный gopher и другие фидо.

beastie ★★★★★
()
Ответ на: комментарий от te111011010

Так и в KOI8-R можно читать:

Вийшла нова версiiя украyiнського орфографiiчного словника для hunspell 2.9.1.
...
Доступнii для завантаження образи систем Ubuntu*Pack 16.04 для платформ i386 ii amd64 в шести редакцiiях
   рiiзних графiiчних оболонок
...
   Оновлений один з найбiiльших неофiiцiiйних репозиторiiyiв iiгри та програми для Ubuntu, пiiдтримуваний командою
   UALinux.
   У репозиторiiyi представлено близько 390 iiгор ii 600 програм, з яких приблизно 340 iiгор ii додаткiiв ви не
   знайдете в офiiцiiйному репозиторiiyi Ubuntu ii в репозиторiiyi GetDeb.net.
И т.д.

saahriktu ★★★★★
() автор топика
Ответ на: ffgj от beastie

Некорректное сравнение, поскольку сетевые протоколы один другой не исключают. Этак можно дойти и до того, что «Юзаешь IRC - отказывайся от FTP!» или «Юзаешь SSH - отказывайся от POP3!».

Локаль здесь в корне отличается тем, что это одна из ряда кодировок, которую юзер выбрал в качестве системной, и выбрать 2, 3 или 8 нельзя - только одну. И здесь каждый исходит из своих соображений и предпочтений.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от te111011010

Юникодный софт не распарсит входные данные в KOI8-R, а при работе с юникодными данными как KOI8-R софт просто разобъёт символы не входящие в ASCII на 2 отдельных однобайтных символа. В любом случае входные данные можно конвертировать перед скармливанием, в т.ч. и в KOI8-R. Просто порежутся символы не входящие в KOI8-R.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от te111011010

Так я же и говорю: для этой задачи есть KOI8-U, которую и предпочитают жители Украины и Беларуси. А неявляющийся гражданином этих стран вполне может обходиться чтением их текстов в приведённом выше виде.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

В белорусском государстве ДВА государственных языка, белорусский и русский. Могут использоваться оба в одном тексте. Например, в шапках официальных документов. А правильно написанный «юникодный» софт ничего не режет, если системная кодировка отлична от юникода. Он считывает системную кодировку и обрабатывает входящие символы согласно ей.

te111011010
()
Последнее исправление: te111011010 (всего исправлений: 2)
Ответ на: комментарий от te111011010

Так KOI8-U ничего не обрезает. Для остальных есть KOI8-R. Заметьте, «KOI8-R» и «KOI8-U» - разные кодировки. Есть ещё «KOI8-T» (таджикский) и «KOI8-F» (KOI8-unified).

saahriktu ★★★★★
() автор топика
Последнее исправление: saahriktu (всего исправлений: 1)
Ответ на: комментарий от saahriktu

Я тебе ещё раз сказал. Я хочу, чтобы у меня в ОДНОМ txt-файлике были и русские, и белорусские буквы. Безо всяких обрезаний (и да, иврит тоже хочу). Это без юникода невозможно. А в html — через костыли, которые гораздо костыльнее utf-8.

te111011010
()
Ответ на: комментарий от saahriktu

А неявляющийся гражданином этих стран вполне может обходиться чтением их текстов в приведённом выше виде.

A mo>|<et voobw,e ispolzovat' tol'ko ASCII i pisat' na vseh yazykah translitom?

te111011010
()

Вот если koi8-фаги не троллят, то это реально какая-то секта типа веганов.

te111011010
()
Ответ на: комментарий от te111011010

Задача выше стояла совместить в одном тексте русские, украинские и белорусские тексты. KOI8-U с этим справляется. Остальное - другие задачи.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

KOI8-U с этим справляется.

Почему тогда её не использовать для русского языка вместо koi8-r?

te111011010
()
Ответ на: комментарий от beastie

Локалей, как и кодировок, тысячи. И у всех людей они разные по разным причинам. Не всем удобна UTF-8.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

Кому-то удобна utf-8 и неудобна koi8, кому-то наоборот. кому-то всё равно.

Тебе кто мешает использовать у тебя на компе твою любимую кодировку? К тебе домой приходят и ставят utf-8?

te111011010
()
Последнее исправление: te111011010 (всего исправлений: 1)
Ответ на: комментарий от te111011010

Кому они нужны? Стандартная таблица символов KOI8-R:

 |0123456789abcdef
-+----------------
0|
1|
2| !"#$%&'()*+,-./
3|0123456789:;<=>?
4|@ABCDEFGHIJKLMNO
5|PQRSTUVWXYZ[\]^_
6|`abcdefghijklmno
7|pqrstuvwxyz{|}~
8|─│┌┐└┘├┤┬┴┼▀▄█▌▐
9|░▒▓⌠■∙√≈≤≥ ⌡°²·÷
a|═║╒ё╓╔╕╖╗╘╙╚╛╜╝╞
b|╟╠╡Ё╢╣╤╥╦╧╨╩╪╫╬©
c|юабцдефгхийклмно
d|пярстужвьызшэщчъ
e|ЮАБЦДЕФГХИЙКЛМНО
f|ПЯРСТУЖВЬЫЗШЭЩЧЪ
Ещё там где-то есть символ '°' который постоянно ни скопировать ни вставить, и который постоянно пропадает. Неуловим прямо как символ номера (который выглядит как «No») в юникоде. Сохраняешь в текстовый файл, смотришь xxd, воспроизводишь в другом тексте бит в бит - а фига с маслом, пустое место. Так я и не понял как он там кодируется.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от te111011010

Нет, но когда я выкладываю своё творчество с/в KOI8-R и кидаю ссылку на ЛОР начинается балаган. Так было и 2 года назад когда я выложил Pisaahriktux 1.0 - Релиз Pisaahriktux 1.0 (Desolate Universe) . Казалось бы, не нравится KOI8-R - перенастрой и всего делов. Поддержку UTF-8 я не выпиливал. Но, нет, сразу начинается

Почему же не utf8? Когда зоопарк кодировок разгонят к такой-то матери?
Зачем так жить
давайте каждому дистру по кодировке. Да нет, давайте каждой софтине по кодировке.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от te111011010

Я ж не говорю, что оно никому не нужно, и что, якобы, все обязаны юзать KOI8-R. Я говорю, что есть люди которым KOI8-R выше крыши и удобнее. Для остальных есть UTF-8. Хотите юзать - пожалуйста, но позвольте остаться зоопарку кодировок навсегда и вежливо относитесь к юзерам других локалей. Быть просто взаимовежливыми это не так уж и сложно, главное желание.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

Я не знаю, я это не говорил. Но если бы был проект на гитхабе, который некорректно работает с юникодом, тебе бы предложили патчи для корректной работы, но ты бы отверг, то ты бы поступил нехорошо. И если такой проект форкнут — то всё правильно сделают.

te111011010
()
Ответ на: комментарий от te111011010

Так я и не против форков, и один из моих проектов - консольную игру - уже форкнули по причине разных взглядов на управление. Я сторонник классического «hjkl», в то время как другой человек стал предлагать патч для стрелок курсора. Так что, форкаться проекты могут не только из за кодировок, по самым разным причинам.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от te111011010

А вот исходники и github считают иначе. В них множество упоминаний KOI8-R, вплоть до «almost all Russian users use KOI8-R» ( https://github.com/radekp/qt/blob/master/src/corelib/codecs/qtextcodec.cpp ). К слову, даже автор languagetool почти год назад стал жертвой проталкивающих юникод людей в https://github.com/languagetool-org/languagetool/issues/321 .

saahriktu ★★★★★
() автор топика

Среди них «Институт Ядерной Физики им.Г.И.Будкера СО РАН», «Информационные научно-образовательные ресурсы ГАГУ», «Нижегородский Университетский Центр Интернет», «ивановский региональный портал», «МЦНМО: МОСКОВСКИЙ ЦЕНТР НЕПРЕРЫВНОГО МАТЕМАТИЧЕСКОГО ОБРАЗОВАНИЯ», «Институт лингвистических исследований»

О, отличная антиреклама этих УЗов. Наверняка в них до сих пор учат студентов на Borland C++, TurboPascal, C++ Builder и Delphi.

EXL ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.