LINUX.ORG.RU

Победное шествие Юникода

 ,


2

2

https://w3techs.com/technologies/history_overview/character_encoding/ms/y

Что думаете, скоро ли число юникодных сайтов приблизится к 100%, а из браузеров выпилят поддержку однобайтовых пережитков каменноугольного периода?

★★★★★
Ответ на: комментарий от mandala

Какого фига оно тогда в паблик торчит?

Этот вопрос нашему отделу информатики надо задать.

anonymous
()
Ответ на: комментарий от anonymous

Ну тогда не приводи в пример что-то кривое. Виндузяцкое извращение над ISO-8859-5 я там уже нашёл. Сколько там еще всякого разного может быть...

mandala ★★★★★
()
Последнее исправление: mandala (всего исправлений: 1)
echo 'КПРФ' | iconv -t cp1251 | iconv -f koi8-r
ashot ★★★★
()
Ответ на: комментарий от gasinvein

cp1251 хотя бы поддерживала русский язык на пристойном для того времени уровне, а заодно еще десяток других кириллических, в отличие от.

petrosyan ★★★★★
() автор топика
Ответ на: комментарий от anonymous

А все академики такие клоуны и коверкают язык?

Deleted
()
Ответ на: комментарий от Nikak

Каково это — посвятить всю жизнь мифическому KISS вместо работы за компьютером?

Deleted
()
Ответ на: комментарий от Deleted

saahriktu, перелогинься.

Вот и выросло поколение.

J ★★★★★
()
Ответ на: комментарий от anonymous_sama

Тут уже жаловался кто-то, что в Chrome додумались выпилить смену кодировок.

Значит скоро выпилят и в остальных браузерах.

petrosyan ★★★★★
() автор топика
Ответ на: комментарий от petrosyan

В Яндекс-браузере не выпилено, т.е. впилено взад.

mandala ★★★★★
()
Ответ на: комментарий от Nikak

Зато в соседней теме про художку прекрасный пример бредней пещерных людей.

takino ★★★★★
()
Ответ на: комментарий от petrosyan

Если нужно сослаться на статью, автора которой зовут, например, Vújko Hujakovič

Дадут в транслитерации. Причём в такой, что если автор увидит, как написали его фамилию, то откопает закопанный в 1996-м автомат и пойдёт в Россию мстить всему институту. Но он не увидит, потому что о существовании сайта института за пределами самого института никто не знает.

LittleKawaiiNeko ★★
()
Ответ на: комментарий от anonymous

Выдавать нот фаунд вместо пермишн денайда - это такая хитрая безопасность, чтоб никто не догадался?

LittleKawaiiNeko ★★
()
Ответ на: комментарий от Nikak

Для ряда людей факт, что KOI8-R архитектурно красивее.

Она без всякого «ряда людей» архитектурно стабильнее, так как не теряет читабельности при потере восьмого бита на семибитных терминалах.

AS ★★★★★
()
Последнее исправление: AS (всего исправлений: 1)

У меня 2 вопроса:

1. Стоит ли релизить свою собственную библиотеку детекта 5 кириллических кодировок, которая весит достаточно много и использует свою собственную как промежуточную? Распознает только русский язык, так как училось именно на нем, а не на разных диалектах с кириллицей.

2. Правильнее КАПСОТЕКСТ распознавать согласно лингвистическим особенностям, или пусть система обращает внимание на тот факт, что обычно текст в нижнем регистре, потому правильнее будет «йюоянрейяр», так как это больше похоже на тот текст, на котором система обучалась?

ruzisufaka
()
Ответ на: комментарий от AS

Она без всякого «ряда людей» архитектурно стабильнее, так как не теряет читабельности при потере восьмого бита на семибитных терминалах.

Насколько это актуально в 2017 г.? Много ли людей будут читать «литературные» опусы тов. saahriktu на этих IНЖАЛИД ЦОММАНД ОР СВИТЦХ?

petrosyan ★★★★★
() автор топика
Ответ на: комментарий от petrosyan

Насколько это актуально в 2017 г.?

Просто надо помнить, что koi8 - это кодировка, возникшая не от балды, а имеющая вполне конкретный технический смысл. В отличие от остальных однобайтовых.

AS ★★★★★
()
Ответ на: комментарий от petrosyan

Является ли код Морзе актуальным в 2017 году? Браузерам koi8 может быть и не столь уж и нужен, но есть и другие сферы, где можно использовать этот способ представления информации.

anonymous
()
Ответ на: комментарий от anonymous

Браузерам koi8 может быть и не столь уж и нужен, но есть и другие сферы, где можно использовать этот способ представления информации.

Какие такие сферы, где koi8 имеет преимущества перед юникодом или даже перед другими недокодировками? ИНЖВЛИД ДЕЖИЦЕ уже давно сгнили на свалках или пылятся в музеях. koi8 - костыль, которым уже нечего подпирать.

petrosyan ★★★★★
() автор топика
Ответ на: комментарий от Nikak

Для ряда людей факт, что KOI8-R архитектурно красивее

Вот тут как раз правильно было бы использовать слово «рахитектурно».

противоречит замыслу сторонников KISS

Зависит с какой стороны. Если подходить с ANSI C — наше всё и ничего не нужно, то да. Там операции с текстом в однобайтных кодировках (один глиф = один байт) KISS.

С точки зрения пользователя — сдиагностировать где же появилась «бНОПНЯ» — боль в одном месте.

KennyMinigun ★★★★★
()
Ответ на: комментарий от petrosyan

Вы ограничили свой кругозор современными компьютерами. И вы так и не ответили на вопрос про код Морзе. А ведь он должен навести вас на мысль, что все-таки маленькие кодировки чем-то могут быть полезны. Подсказка № 1. ASCII был создан не для компьютеров. Подсказка № 2. koi7 и koi8 совместимы с ASCII. Подсказка № 3. Информацию можно передавать не только через интернет. Вспомните про телеграммы и телетайп. Возможно, вы мне не поверите, но сообщение можно даже настучать, «наморгать» карманным фонариком,насвистеть, «прозвонить по проводу» и даже показать на пальцах рук. Вы в вышеперечисленных случаях будете использовать «устаревшие маленькие кодировки» вроде кода Морзе, koi7, koi8, дкои-8 или предпочтете какой-нибудь utf-32?

anonymous
()
Ответ на: комментарий от anonymous

Вы ограничили свой кругозор современными компьютерами.

1. Мы тут как бы изначально именно о компьютерах говорили. Поэтому «насвистеть фонариком в koi8» - не в кассу 2. Несовременные компьютеры интересны исключительно как музейные экспонаты. Как и граммофоны, паравозы, омнибусы и глиняные таблички с клинописью. 3. То, что где-то до сих пор используют морзянку, это ведь не значит, что надо поставить себе на современный компьютер локаль morze-ru и рассказывать на ЛОРе как это [-.-] [.-.] [..-] [-] [---] [#] [..] [#] [..-] [-..] [---] [-...] [-.] [---] 4. Если представить себе юзкейс, в котором «экономия на спичках» будет оправданной, то koi8 не имеет ровно никаких преимуществ перед другими недокодировками.

Вспомните про телеграммы и телетайп.

Можно про голубиную почту тоже вспомнить, че уж там.

anonymous
()
Ответ на: комментарий от Nikak

Для ряда людей факт, что KOI8-R архитектурно красивее.

Ватлол?!

erfea ★★★★★
()
Ответ на: комментарий от anonymous

Но привел в качестве примеров такие сферы, где русскоязычные 8-битные кодировки не применяются (и если я правильно понимаю, то и не применялись никогда). К чему были эти примеры?

TeopeTuK ★★★★★
()
Ответ на: комментарий от Nikak

Для ряда людей факт, что KOI8-R архитектурно красивее.

Все восьмибитные кодировки это ужасный компромисс между «Есть много разных нужных и полезных символов» и «Мы не умеем работать с символами длиннее одного байта (а может нам жалко памяти)». Они не могут быть архитектурно красивыми, это всего лишь вложение 256 кодов в мир письменности.

Как только аргументы в пользу бедных перестали работать, появились и 16-битные, и 32-битные, и UTF-8 как еще один компромисс, но вполне удачный.

А фраза «KOI8-R архитектурно красивее», скорее, характеризует тот самы «ряд людей», и не с лучшей стороны.

TeopeTuK ★★★★★
()
Ответ на: комментарий от LittleKawaiiNeko

Но он не увидит, потому что о существовании сайта института за пределами самого института никто не знает.

Как будто в самом институте про него в курсе.

ugoday ★★★★★
()
Ответ на: комментарий от TeopeTuK

А вот тут вы сильно ошибаетесь. Почитайте где применялся koi7. Особенно уделите внимание телетайпу и телеграфии.

anonymous
()
Ответ на: комментарий от anonymous

Хотя нет, правы. Koi7 семибитная.

anonymous
()
Ответ на: комментарий от anonymous

По телеграфу и телетайпу гуглится пятибитный МТК-2. Впрочем, вполне допускаю, что KOI-7 там где-то применялась, но KOI-7 не восьмибитная. И повсеместный отказ от неё почему-то не вызвал таких переживаний, как постепенное исчезновение KOI8-R. (Хотя о чём это я? Один шумный страдалец — не показатель.)

TeopeTuK ★★★★★
()
Ответ на: комментарий от anonymous

3. То, что где-то до сих пор используют морзянку, это ведь не значит, что надо поставить себе на современный компьютер локаль morze-ru и рассказывать на ЛОРе как это [-.-] [.-.] [..-] [-] [---] [#] [..] [#] [..-] [-..] [---] [-...] [-.] [---] 4. Если представить себе юзкейс, в котором «экономия на спичках» будет оправданной, то koi8 не имеет ровно никаких преимуществ перед другими недокодировками.

Ок. Ваше мнение очень интересное. Вот только в посте, на который вы отвечаете нечего об этом не говорится.
И, к слову, вы так много написали, но нигде не пытались оспорить, что небольшие кодировки в этих ситуациях лучше.

anonymous
()
Ответ на: комментарий от anonymous

И, к слову, вы так много написали, но нигде не пытались оспорить, что небольшие кодировки в этих ситуациях лучше.

Я и не собирался оспаривать, что в ситуации «светить фонариком соседу через дорогу» азбука Морзе целесообразнее юникода. Вопрос был в том, в каких случаях использования современного персонального компьютера разумно «экономить на спичках» и мириться с явными недостатками koi8. Второй вопрос был в том, чем koi8 лучше других похожих кодировок, например, cp1251. Еще раз подчеркну, речь идет о 2017 г. Чем оно было лучше при царе Горохе - понятно. Зачем оно нужно сейчас?

anonymous
()
Ответ на: комментарий от anonymous

Кстати, народ, в этом году ко мне в гости никто не хочет приехать?

Мы к тебе думали через год еще раз приехать. Мелкому когда год будет, с годовалым уже можно и ехать будет. Жена в восторге до сих пор от ваших мест, а я в поход в горы хочу всё таки.

Loki13 ★★★★★
()
Ответ на: комментарий от anonymous

Является ли код Морзе актуальным в 2017 году?

Несомненно. . . . — — — . . . ещё никто не отменял.

AS ★★★★★
()
Последнее исправление: AS (всего исправлений: 1)
Ответ на: комментарий от anonymous

Первый вопрос не ко мне - я писал про полезность «старых» кодировок в определенных ситуациях.Преимущества koi8-r перед cp1251 обусловленны 2-я ее особенностями. Первая - если интерпретировать текст, созданный с помощью koi8-r как ascii, то будет получен транслит, что лучше, чем нечего. Во вторых, эта кодировка может быть преобразована в 7-и битную. Что касается достоинств cp1251, то она имеет немного другой набор символов, включающий служебные. На практике я крайне редко использовал эти достоинства и мне не принципиально с какой кодировкой работать.
Зачем эти кодировки нужны? Мне - я в силу своего хобби иногда работаю с бинарными данными на самодельных (лучше сказать самосборных) устройствах, мне удобнее использовать компактные кодировки.Зачем оно нужно вам и нужно ли - решайте сами. Я никого за эти кодировки не агитирую.

anonymous
()
25 июля 2017 г.

Ты лучше скажи, как в случае с торрентами быть, когда всякие нехорошие люди именуют файлы хрюникодом. В mc ставлю «хрюникод» — названия файлов вижу, но не могу запустить, скажем, mplayer «файл», потому что файла «файл» не существует, а по альт-ентеру mc подставляет декодированное имя, собака такая!!!

Если же я своим скриптом в транслит всю эту срамоту переведу, заодно заменяя пробелы и прочую содомию на подчеркивание, то будут ли торренты работать на раздачу — список файлов-то уже другой!

anonymous
()
Ответ на: комментарий от Deleted

Это когда люди начнут завоёвывать Галактику.

iZEN ★★★★★
()

Как вы определяете длину строки символов в UTF-8 из потока байтов? Последовательно читая из буфера и декодируя каждый символ! Как определить требуемый объём буфера в памяти для размещения строки символов в однобайтовой кодировке? Посчитайте число переданных байтов!

iZEN ★★★★★
()
Ответ на: комментарий от anonymous

Слинкуйте своим скриптом в отдельный каталог и из него запускайте. И торренты целы, и глазки сыты.

bormant ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.