LINUX.ORG.RU
ФорумTalks

яролит взад

 ,


1

3

Про Яролит хорошая тема получилась (и даже очень полезная, а такое не всегда получается). Теперь - внимание! Я придумал обратный транслит. Он служит для кодирования латиницы кириллицей:

a b c d e f g h i j k l m n o p q r s t u v w x y z
а б ц д е ф г ш и й к л м н о п ь р с т у в ю х ы з
Здесь по возможности пары подобраны так, чтобы совпадать с яролитом. Некоторые буквы кириллицы кодируются диграфами и для них это невозможно. Но если записать все констрейнты и решить их, то по сути выбора нет - задача решается однозначно. Например, в яролите й = jj. Очевидно, что в обратном яролите j = й. ш = sh, отсюда вытекает, что в обратном яролите h = ш. И т.п. Вот как надо писать:
линух.орг.ру
йошн леннон
гит цлоне шттпс://гитшуб.цом/алтоцмс
гит цшекоут -ф девелоп
мосцою
спутник
новицшок
ыандех тахи 

Для устранения неоднозначности в чатах можно в неочевидных слуаях писать:

Вставим ,енглисш ,аббревиатион ,ОС в русское предложение
ОС здесь неоднозначно, т.к. может быть ОС в русском и OS в английском, и даже значит одно и то же. Запятая перед словом является грамматической ошибкой, что позволяет использовать её для обозначения того, что следующее слово - английское, записанное транслитом.

Самое смешное, что на работе мы его уже используем в чате. Т.е. по сути уже есть одно внедрение. Правда, я пока не знаю, что думает про нас третий русскоязычный пользователь :)

Экономия на двух переключениях вполне ощутима, всё понятно, информацию можно передать точно и иногда можно поржать над тем, что получается (вплоть до упадения под стол), что делает работу веселее. Правда, мой коллега предлагает другой вариант:

h x 
Х Ш 
Интересно узнать ваше мнение - какой вариант лучше. Ну и присылайте свои смешные переводы.

★★★★★

Последнее исправление: den73 (всего исправлений: 5)

Ясно всё с тобой. В игнор.

Deleted
()

Лучше c->ч. Более компромиссное звучание между «ц» и «к».

гит члоне шттпс://гитшуб.чом/алточмс
гит чшекоут -ф девелоп
чп там.ч тут.ч
no-such-file ★★★★★
()
Последнее исправление: no-such-file (всего исправлений: 1)
Ответ на: комментарий от den73

Чтобы w не осталось бездомной, что ли?

Да. Точнее W было В. А код для V тогда пропадает зря. Кроме того при приёме морзянки на большой скорости под запись рукой используются замены, в этом смысле V удобнее писать вместо Ж (и проще чем осваивать полную стенографию).

no-such-file ★★★★★
()
Ответ на: комментарий от no-such-file

Для тех, кто не смотрел предыдущие серии. Есть просто яролит. Это - обратимый и почти фонетический транслит для кириллицы, очень похожий на ISO/R 9 (1968) = ГОСТ 16876-71, таблица 2, и отличающийся только тем, что ь и ъ представлены как q и jq, а не апострофами. Я придумал его, чтобы использовать русский язык в логинах, идентификаторах, бат-файлах и других местах, куда кириллицу применить нельзя по техническим ограничениям. Случайно оказалось, что этот ,ИСО позволяет однозначно представить ещё множество кириллических алфавитов (за счёт соответствующих расширений, не затрагивающих q), поэтому получилось очень классно. Этот стандарт отменён, но более поздние стандарты с т.з представления русского языка хуже и их нельзя превратить в прагматичный обратимый без знаков препинания. Возможно, они чем-то лучше для других целей, но я пока не понимаю, в чём их смысл. «Яролит взад» предназначен для глумления над английским языком. Обычный транслит - это глумление над русским, значит, надо отомстить. Это не шутка, потому что за глумлением над языком в истории с большой вероятностью следует глумление и над его носителями, вплоть до физического истребления. Английский язык настолько довлеет в ИТ, что даже задуматься над этим, а тем более пытаться с этим бороться - это значит стать маргиналом и прослыть шизиком, что мы и видим в комментариях. Даже госчиновники не слёту понимают эту проблему, не то, что работающие на западных работодателей программисты. Ну и конечно, «яролит взад» нужен на практике для того, чтобы быстрее печатать в рабочих чатах, где половина русского, а половина профессиональных терминов на английском. В этом смысле у «яролита взад» узкая область применения и правила для него должны быть простыми. За базовый принцип взято соответствие прямому яролиту. Вот прямой яролит:

а б в г д е ё  ж  з и й  к л м н о п р с т у ф х  ц ч  ш  щ   ъ  ы ь э  ю  я 
a b v g d e jo zh z i jj k l m n o p r s t u f kh c ch sh shh jq y q eh ju ja
Отсюда однозначно вытекает кодировка для почти всех букв, а остальное описано здесь: http://вече.программирование-по-русски.рф/viewtopic.php?f=2&t=4

Любое отклонение от таблицы, приведённой вначале, ломает совместимость с прямым яролитом, а полной фонетической совместимости всё равно добиться нельзя. Поэтому лучший вариант - это тот, который приведён в начале темы. Хотя малочисленный голос народа пока за альтернативу.

den73 ★★★★★
() автор топика
Последнее исправление: den73 (всего исправлений: 2)

может по накурке и по-приколу начать изучать это язычее? Атмосфера всегда позитив и радость. А может ли этот язык быть полезным в бытовом применении? например, скрипт набросать для хозяйственных нужд?

Bruce_Lee ★★
()
Ответ на: комментарий от den73

ГОСТ ставит своей целью преобразование только в одну сторону. Т.е. чтобы однозначно и фонетически близко передавать русские слова на латинице. Если нужно преобразовывать и обратно тоже, да ещё сохранять фонетику, то нужна другая таблица и определённые компромиссы. В частности ч=c, ц=ts и щ=sch т.п.

no-such-file ★★★★★
()
Последнее исправление: no-such-file (всего исправлений: 1)

Не транслит, а говно. Где Ж? Ы в английском нет, выбрось. J->Ж, Y->Й. Хоть чуть получше будет.

Hertz ★★★★★
()
Ответ на: комментарий от no-such-file

ГОСТ ставит своей целью преобразование только в одну сторону.

Ознакомься с матчастью, пожалуйста.

den73 ★★★★★
() автор топика
Ответ на: комментарий от den73

Насколько фонетично получается?

Вполне фонетично

Я вашу мову не размовляю.

(Теоретически) неизвестные тебе буквы фонетически хорошо соответствуют латинице английского:

  • ґ — твердое, очень близкое к звучанию «к» (как «г» в русском), при том «г» - звучит как «х» с оттенком «г»
  • i — нуфф саід
  • ў — звучит как «w» в слове «water»
KennyMinigun ★★★★★
()
Последнее исправление: KennyMinigun (всего исправлений: 2)
Ответ на: комментарий от Bruce_Lee

Атмосфера всегда позитив и радость.

Это точно. "- У меня в Йенкинсе ЦИ упало - Заведи тицкет в Йире". И всё, уже можно улыбаться, хотя ничего весёлого не произошло. Не знаю, может быть со временем это войдёт в привычку и уже не будет смешно, но вчера я полдня ржал над тем, что выходило у меня в рабочем чате. Профит и бытовой смысл - в том, что не надо переключать раскладку, а рабочие чаты всегда отвлекают, и переключение раскладки отдельно отвлекает.

Для скриптов скорее нужен обычный транслит, но какой-нибудь Russkijj identifikator, записанный транслитом, вызывает уныние и раздражение. С одной стороны, хочется пользоваться родным языком, с другой, транслит плохо смотрится. Так что я везде, где можно, делаю идентификаторы просто на русском, и только где нельзя, думаю о транслите. И не всегда принимаю решение в пользу транслита.

den73 ★★★★★
() автор топика
Последнее исправление: den73 (всего исправлений: 1)
Ответ на: комментарий от KennyMinigun

Ну что, годная себе мова. Надо включить недостающие куски латиницы в кириллицу и тогда кириллица съест латиницу, т.к. будет болеее универсальной.

den73 ★★★★★
() автор топика
Ответ на: комментарий от KennyMinigun

Я думал, это украинский. Ну тогда в чём практический смысл? Нужно иметь раскладку клавиатуры, к-рая практически позволяет это печатать. Даже одной русской кириллицы много - кнопок не хватает.

den73 ★★★★★
() автор топика
Ответ на: комментарий от den73

Нужно иметь раскладку клавиатуры, к-рая практически позволяет это печатать.

У меня как раз такая:

  • Alt(Gr)+y -> ў
  • Alt(Gr)+і -> ы
  • Alt(Gr)+ї -> ъ
  • Alt(Gr)+ґ -> \
  • Alt(Gr)+є -> э
  • Alt(Gr)+е -> ё
KennyMinigun ★★★★★
()

Экономнее писать, но читать-то значительно сложнее. :)

mono ★★★★★
()
Ответ на: комментарий от KennyMinigun

Значит, ты можешь пользоваться своей версией :)

den73 ★★★★★
() автор топика
Ответ на: комментарий от den73

Ознакомься с матчастью, пожалуйста

Сам ознакомься.

ГОСТ 16876-71 Правила транслитерации букв кирилловского алфавита буквами латинского алфавита

Про обратное преобразование вообще речи нет.

no-such-file ★★★★★
()
Ответ на: комментарий от no-such-file

Хорошо, таких слов нет. Есть слово «соответствие», которое можно толковать по-разному. Но обрати внимание на два факта:

1. Де-факто обратимость есть, во всяком случае в рамках русского. Остальные я дотошно не проверял, но вроде тоже всё обратимо.

2. Следующий стандарт ГОСТ 7.79-2000, принятый взамен 16876-71, содежит следующие слова:

Правила согласно настоящему стандарту применяют везде, где требуется обеспечить однозначное представление кирилловского текста латинскими буквами и возможность алгоритмического восстановления текста в исходной кирилловской записи, в частности при передаче документов по компьютерным сетям.

Дальше каждый трактует как хочет. Либо ГОСТ 16876-71 случайно обратим, либо он создавался обратимым целенаправленно, но об этом не написано в документе за очевидностью. Либо ещё что-то. Как ни трактуй, обратимость никуда не девается.

den73 ★★★★★
() автор топика
Последнее исправление: den73 (всего исправлений: 3)
Ответ на: комментарий от bread

При создании такого транслита однозначного решения нет, вкусовщина неизбежна. Из чего я исходил, рассказано по ссылке в первой строке поста.

den73 ★★★★★
() автор топика
Ответ на: комментарий от den73

обеспечить однозначное представление кирилловского текста латинскими буквами и возможность алгоритмического восстановления текста в исходной кирилловской записи

Разумеется ГОСТ обеспечивает однозначность представления _русского_ текста. Но транслит латинского текста русским - это совсем другая тема, которую ГОСТ никак не покрывает. Тут нужны совсем другие соответствия, чтобы сохранять фонетику _английского_ при записи русским.

no-such-file ★★★★★
()
Ответ на: комментарий от no-such-file

А, понял тебя. Просто тут в прошлой теме было слишком много товарищей, неспособных даже заголовок прочитать, поэтому я уже на людей кидаюсь. Вижу, что ты сразу про обратимость написал. Задачи создания транслита можно ставить по-разному. Вот возможные требования (они одновременно не могут быть удовлетворены):

  • точная передача написания
  • по возможности точная передача звучания
  • сохранение количества букв

На сегодня ИТ - это всё же работа с текстами, а не со звуками. Английская письменность не передаёт звучание английских слов - общих правил для этого не существует. Поэтому, если мы передадим звучание, то мы передадим меньше информации, причём не в той форме, которая нужна в ИТ. Значит, если мы выбираем, передавать ли написание или звучание, то передавать начертание полезнее. На принимающей стороне расшифруют слово и узнают его звучание по английски (если знают, как это слово читается, и если им это вообще нужно). Дальше в рамках передачи начертания уже пытаемся передать звучание, но это лишь вспомогательная цель.

И, когда мы моделируем маленькую латиницу большой кириллицей, мы можем сохранить количество букв. Это явный профит и достижимая цель, а вот точная передача звучания недостижима (ведь сам английский этого не может). Поэтому я выбрал передачу «буква в букву». Можно было, небось и сжать при передаче, например, сделать ch = ч и т.п., но тут всё равно много не выиграешь.

И дальше, если у нас есть стандарт транслитерации кириллицы латиницей, который уже задаёт некоторые соответствия (например, в = v), то имеет смысл им воспользоваться, чтобы вся система из двух транслитов стала проще. Конечно, можно сделать и по-другому - это вкусовщина.

den73 ★★★★★
() автор топика
Последнее исправление: den73 (всего исправлений: 7)
Ответ на: комментарий от den73

меня не интересует русский, ты не делай упор на русский, интересует кириллица, всё-таки 1000 лет на ней пишем.

Там где русский — там страдание, боль, порабощение и кромешная безнадега, я надеялся на благословенную кириллицу жи

Bruce_Lee ★★
()
Ответ на: комментарий от den73

При наличии стандарта, всегда лучше ему следовать, если нет веских причин не следовать.

Выглядит оно не более странно, чем q = ь

monk ★★★★★
()
Ответ на: комментарий от monk

Нда, фиговая ситуация получается. Нет оснований отвергнуть азбуку Морзе (не считая соображения о совместимости с прямым яролитом). И, я так понял, что ИНЖАЛИД ДЕЖИЦЕ - это такой элемент фольклора. Надо будет завтра попробовать в этот ИНЖАЛИД всё перекодировать.

den73 ★★★★★
() автор топика
Последнее исправление: den73 (всего исправлений: 1)

Это курсач на филфаке!

dann
()
Ответ на: комментарий от Bruce_Lee

Bruce Lee писал

Там где русский — там страдание, боль, порабощение и кромешная безнадега

Два чая этому господину.

Deleted
()
Последнее исправление: Deleted (всего исправлений: 1)
Ответ на: комментарий от den73

Как я понял, он просто не любит русский язык. В принципе, нечего незаконного в этом нет.

Leupold_cat ★★★★★
()

Ненужно, есть КОИ.

Экономия на двух переключениях вполне ощутима

Ты не там проблему ищешь, вы просто через жопу раскладку переключаете. В любом случае, префиксирование ,-ми куда больше нажатий съедает.

bodqhrohro_promo
()
Ответ на: комментарий от i-rinat

Действительно, зачем записывать слова английского языка письменностью римлян, а слова русского — письменностью болгар?

bodqhrohro_promo
()
Ответ на: комментарий от Hertz

Y->Й

Неча вместо буквы без диакритики предлагать букву с диакритикой. Впрочем, Ы тоже великовата, я в своей письменности вместо неё внедрил Ү.

bodqhrohro_promo
()
Ответ на: комментарий от bodqhrohro_promo

Да я не ищу проблему. На самом деле эта идея родилась как-то сама собой. Как не переключай раскладку, через жопу ли, через другое ли место (какое?) всё равно нужно её либо переключать, либо не переключать. Переключать в любом случае дороже. Префиксирование "," в разговорной речи оптионал.

den73 ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.