LINUX.ORG.RU
решено ФорумTalks

Кириллатиница

 


1

1

Продолжаем мозговой штурм по переводу кода на русский язык и восстановлению позиций кириллицы в ИТ. С Кои-7 идея, ясное дело, плоха отсутствием латиницы. Но её можно развивать в разных направлениях, чтобы латиница появилась.

Последняя идея, к-рая пришла в голову - следующая. Иногда нам не так уж важно, написан ли текст в кириллице или латинице. В этом случае мы просто возьмём да и добавим в кириллицу недостающие буквы из латиницы. А те, которые пересекаются, будем считать идентичными и присвоим им общий код. При идентификации будем использовать яролит взад, цитирую:

    a b c d e f g h i j k l m n o p q r s t u v w x y z
    а б ц д е ф г ш и й к л м н о п ь р с т у в ю х ы з

Но не весь, а часть букв выкинем (по ходу дела разберёмся, какие). Тут сразу есть проблема с b и p, которые при одинаковом написании имеет разные смыслы. Но на первый взгляд алфавит для представления латиницы получается такой:

a б ц д э ф г h i j к л м н о п q r s т u в w х y з

Итого мы добавили h i j q r s u w - всего 8 букв. Вся кириллица остаётся на месте, итого получается:

а б в w г д е ё ж з и i й j к л м н о п q р r с s т у u ф х ц ч ш h щ ъ ы ь э ю я

Протестируем:

Возьмём, например, произвольный текст из «Авторевю»

    Ездит на автомобилях Mitsubishi Lancer Evolution IX и ГАЗ-21Р

Текст набран одним шрифтом. На кириллатинице он будет выглядеть так:

    Ездит на автомобилях Мiтsuбishi Ланцеr Эволuтioн IХ и ГАЗ-21Р. 

Уффф. Хрень какая-то. Но на то и мозговой штурм, чтобы обсуждать хрень.

Плюсами является:

  • если впихнуть кириллатиницу в одну раскладку, будет гораздо удобнее печатать. Перевод с английского на русский такой масштабной вещи, как ОС, может быть только поэтапным, поэтому длительное время останется необходимость постоянно переключаться. Эта необходимость очень неприятна.
  • некоторые мнемоники (MOV какой-нибудь или ls) вообще вряд ли имеет смысл переводить. Поэтому, если не сделать единую раскладку, неудобство сохранится навсегда. Если же применить кириллатиницу и единую раскладку, то будет лучше.
  • если совпадающие буквы поместить в ASЦII, возникнет неявная кириллизация исходных текстов. Хотя предикат isАлпha станет сложнее. Но эта сложность коснётся только новых идентификаторов, содержащих непересекающиеся с латиницей буквы

Минусы:

  • для случаев, когда нам нужна именно латиница, придётся отвести отдельные коды букв и изменённые начертания. В Uнiцодэ вряд ли найдётся для них место, хотя я ХЗ. Но это не только минус, но и плюс. Т.к. проблема совпадения начертаний некоторых кириллических и латинских букв достаточно актуальна и всё равно то, что в шрифтах они пишутся одинаков - это баг современных шрифтов
  • не совсем ясно, как осуществлять поиск. По идее, поиск по кириллатинице может происходить так:
    • если по слову «жук» ясно, что это кириллица, ищем в кириллице
    • если по слову «worд» ясно, что латиница, ищем в латинице
    • слово «мама» ищем два раза (мама и mama)
    • слово «wой» ищем как слово в кириллатинице - не русское и не английское ,

Перемещено leave из development

★★★★★

Последнее исправление: den73 (всего исправлений: 4)
Ответ на: комментарий от den73

Мы потеряли часть выразительности русского языка, выкинув i, поэтому логично его вернуть, из соображений, далёких от ИТ.

Абсолютно согласен. Нужно вернуть і, ѵ (мѵро), ѣ обязательно, ѕ (зело), ѳ (ѳёдор), ѧ (ѧз забыл вѣры кр҃стьѧньские всее, праздники кр҃стьѧнскые); а так же добавить ђ, џ, ў, ґ (ўолт дисней ґоворит: раноћириличкоґ ћирилици хў). Я абсолютно серьёзно, русский язык многое теряет.

Jaga ★★★
()
Ответ на: комментарий от den73

ИТ не так уж сильно отличается от других областей знания: медицины, религии, литературы, машиностроения, мореплавания. Все эти области знания в конце концов были русифицированы.

И область IT русифицирована. Возьми любую книгу, man-ы, все термины IT так или иначе переведены на русский язык. Русифицирование самого программного обеспечения мало относится к русифицированнию области знаний. Это как математические формулы переводить на русский язык. Смысла в этом мало. Да и были прецеденты. С 60-х годов в союзе пытались сделать русские языки и системы программирования. И ничего из этого не вышло. Во-первых, всё равно всё копировали с запада. А во-вторых, потому что отставание было на десятилетие или больше. А десятилетие в IT - это как век в традиционных областях знаний. Ты пытаешься повторить их опыт.

rupert ★★★★★
()
Ответ на: комментарий от Jaga

Были слухи, что большевики только лишь воплотили реформу языка, которая была задумана до них. В целом я к истории русского языка лишь немного прикоснулся, не компетентен тут. Ё точно правильно вернули (кто не заметил, у нас ёфицированы в Москве все улицы).

den73 ★★★★★
() автор топика
Последнее исправление: den73 (всего исправлений: 1)
Ответ на: комментарий от rupert

И область IT русифицирована. Возьми любую книгу, man-ы, все термины IT так или иначе переведены на русский язык.

Есть фильм с субтитрами, а есть дублированный фильм. ИТ русифицировано как фильм с субтитрами. Машиностроение, морское дело, медицина русифицированы как дублированный фильм, хотя это полностью импортные области. В случае медицины процесс занял столетия. Екатерина открывает мед.училища с преподаванием на русском языке (XVIII век). В 1860-х перестают защищать диссертации по медицине на латыни. Сегодня латынь российским медикам по сути реально не нужна (я уточнял у медиков). Скорее нужнее английский.

А в ИТ ситуация идёт в обратную сторону. Сначала похерили автономную ИТ отрасль (стратегический просчёт СССР). Теперь открыли ИТ образование на английском языке в Иннополисе.

den73 ★★★★★
() автор топика
Последнее исправление: den73 (всего исправлений: 2)
Ответ на: комментарий от den73

Если уж мы тут за философию, у России должен быть свой центр компетенций по всему стеку технологий, и свой стек технологий, т.к. доверия западному софту быть не может: мы видим, сколько уязвимостей. Идея освоить линукс и приспособить его под какие-нибудь там ответственные системы полностью провальная. Потому что «освоить» и «найти все закладки» находятся друг от друга на астрономическом расстоянии. Даже «весь мир» объединёнными усилиями не успевает достаточно быстро находить закладки, раз башдор открыли через 20 лет, а heartbleed через два. Загадыватели задачек по ИБ явно обыгрывают разгадывателей. Значит, опираясь на любой импортный хард и софт, мы разрешаем себя держать за чувствительное место. А раз центр должен быть в России, то русский язык - это как раз пограничная полоса. Видите, как нервно на него народ реагирует. Значит, эта пограничная полоса очень осязаема, и кого-то её наличие больно бьёт. Ведь можно же было позволить одному «психу» тихонько этим заниматься, нет, стараются обязательно клюнуть :) Так что нет смысла меня разубеждать в том, что я делаю, давайте сэкономим наше с вами время.

den73 ★★★★★
() автор топика
Последнее исправление: den73 (всего исправлений: 3)
Ответ на: комментарий от den73

Проблема будет при взаимодействии с внешними системами. Если к нам придёт текст из кириллицы и латиницы и мы его преобразуем в кириллатиницу, то мы обратно во внешний мир этот текст уже не отправим. Например, если есть внешняя файловая система, мы никак не сможем адекватно отобразить её в кириллатинице, т.к. могут возникнуть неуникальные имена файлов в директории. Если это директория с нашими же исходными текстами, то это и нестрашно.

den73 ★★★★★
() автор топика
Последнее исправление: den73 (всего исправлений: 1)
Ответ на: комментарий от den73

Были слухи, что большевики только лишь воплотили реформу языка, которая была задумана до них.

Так и было. Но, например, в северных областях России ещё можно встретить бабушку, которая произносит разные звуки в словах, где раньше был ять (по сравнению с е).

Jaga ★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.