LINUX.ORG.RU
ФорумTalks

Вышел однобайтный текстовый редактор GNU moe 1.9. Также вышел мой патч для любой однобайтной локали, включая KOI8-R.

 , ,


2

4

Сабж. Текстовый однобайтный редактор GNU moe (My Own Editor) вот уже 12 лет пилит Antonio Diaz Diaz (http://savannah.gnu.org/users/antonio).

Из коробки текстовый редактор заточен под ISO-8859-15. Свой выбор автор обосновывает так:

Moe uses ISO-8859-15 instead of UTF-8 because an 8-bit character set
(combined with romanization if needed) can convey meaning safely and
more efficiently than UTF-8 can.

UTF-8 is a great tool for tasks like writing books of mathematics or
mixing Greek with Chinese in the same document. But for many other
everyday computing and communication tasks, an 8-bit code like
ISO-8859-15 is much more practical, efficient and reliable. There is no
such thing as an "invalid" or "out of range" ISO-8859-15 character.

UTF-8 is fine for non-parsable, non-searchable documents that must look
"pretty", but not so fine for things like configuration files or C++
source code. UTF-8 greatly hinders parsability (and may even become a
security risk) by providing multiple similar-looking variations of basic
alphabetic, punctuation, and quoting characters. UTF-8 also makes search
difficult and unreliable. For example, searching for a word like "file"
in an UTF-8 document may fail if the document uses the compound
character 'fi' instead of the string "fi".

В новой версии:

Changes in version 1.9:

Moe now loads recursively all the regular files in each directory passed
in the command line. This feature makes it easier to edit a whole tree
containing thousands of files.

The new help key 'C-a' has been added because 'F1' is intercepted by
some terminal emulators, and 'C-h' is interpreted as backspace by
others.

The UTF-8 decoder now converts some more characters.

Cursor positions (+line,column) given in the command line are now
adjusted for tab characters.

The command 'goto matching delimiter' now skips delimiters inside /**/
comments.

The 'N' command ('Find next' in reverse direction) has been added to the
basic less emulation.

Standard input is now read just once, the first time it appears in the
command line.

'Remove duplicate lines' is now a 20% faster.

Long file names are now cut to fit in messages like this:
"File '...end_of_long_file_name' saved".

An 8-bit "C" locale is now used in Cygwin so that ncurses can show
characters higher than 127.

A configure warning happening on some shells when testing for g++ has
been fixed.
Скачать: ftp://ftp.gnu.org/gnu/moe/moe-1.9.tar.lz

Патч для любой однобайтной локали, включая KOI8-R: http://saahriktu.org/downloads/patches/moe-1.9_any8bit.patch.lzma

Скриншот после применения патча: http://saahriktu.org/tmp/scr1498513368.png

★★★★★

ты, я вижу, единомышленника себе откопал

Harald ★★★★★
()

Скриншот

Если там типа стихи, то или переводчик дура и пусть переводит только прозу, или если это оригинал — автору лучше не писать ни чего, ни когда.

mandala ★★★★★
()
Последнее исправление: mandala (всего исправлений: 1)
Ответ на: комментарий от mandala

Подозреваю, что оригинал. Ты просто завидуешь литературному мастерству саахрикту!

Harald ★★★★★
()
Ответ на: комментарий от Deleted

Небольшие текстовые файлы xz и lzma жмут одинаково, но заголовок у lzma меньше. Отсюда и привычка руками небольшие текстовые файлы жать именно lzma (один лишний байт - и вот уже один лишний сектор/сетевой пакет).

saahriktu ★★★★★
() автор топика
Последнее исправление: saahriktu (всего исправлений: 2)

Да что за народ пошёл. То угонят аккаунт, то вернут.

з.ы. ладно, я просто никак не уйму сегодняшний поток искромётного юмора на все темы - от рекламы используемого в рабочем проекте мессенджера, до личных.

alex4321
()
Ответ на: комментарий от saahriktu

один лишний байт - и вот уже один лишний сектор/сетевой пакет).

Дык имя файла получается на 2 байта больше! Оно ж тоже по сети передаётся.

Точно! Нужен компрессор с однобувенным стандартным расширением, например x. А лучше пустым! Точно. Будет programname.tar. (с точкой на конце, типа сжато и точка!)

Psych218 ★★★★★
()
Последнее исправление: Psych218 (всего исправлений: 1)

GNU moe (My Own Editor)

«Гну'тое моё» — как редактор назовёте, так оно и скурвит стих. // Врунгель :)

P.S. Таких одержимо-красноглазых стихоплётов «Святая Инквизиция»™ поджаривала на костре...

quickquest ★★★★★
()
Ответ на: комментарий от saahriktu

Ну если у человека настроено без юникода, окей, он юзает этот редактор. Захотел человек юникод, ему что, бросать любимый редактор? По-моему, лучше, чтобы редактор умел и так, и этак.

Тем более, что проблем то особых нет с этим. Основное внутри libc сделано. Или я чего-то не понимаю? Какие сложности?

hibou ★★★★★
()
Последнее исправление: hibou (всего исправлений: 1)
Ответ на: комментарий от mandala

Если там типа стихи, то или переводчик дура и пусть переводит только прозу, или если это оригинал — автору лучше не писать ни чего, ни когда.

У автора, видимо, родной язык koi8-r. На юникоде такого не напишешь.

petrosyan ★★★★★
()
Ответ на: комментарий от hibou

Просто некоторые люди — дегенераты. И считают, что разные кодировки в конфигах и *.tex файлах это нормально и удобно.

kirk_johnson ★☆
()

Вышло ненужно для ненужно. Также вышел мой патч для любой ненужно.

*fixed*

thunar ★★★★★
()
Ответ на: комментарий от hibou

Им не работать, а малафить надо — потому юникод не подходит.

thunar ★★★★★
()
Ответ на: комментарий от hibou

Захотел человек юникод, ему что, бросать любимый редактор?

Что значит «захотел»? «Не всем нужен юникод» == «Не все переходят на юникод вообще». Нет смысла. А если человек продолжает юзать однобайтную локаль, то больше чем однобайтный текстовый редактор ему и не нужно.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от te111011010

Транслит никто не отменял. Для того же японского языка существует ромадзи, и эту форму записи даже крайне рекомендуют изучать:

   Необходимость изучения ромадзи диктуется прежде всего тем, что эта азбука используется как в Японии, так и в
   России и зарубежных странах. Кроме того, знание ромадзи дает возможность правильно передавать в практической
   русской транскрипции японские названия, имена и фамилии, встречающиеся на языках, пользующихся латинской
   графикой.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

Предлагаю тогда запилить 7-битный текстовый редактор. ASCII хватит всем! А все файлы станут меньше ещё на 12.5%.

KivApple ★★★★★
()
Ответ на: комментарий от te111011010

Вы не видите разницы между тремя разными явлениями: вывесками, текстами в интернете и локальными текстами? Вывески - это графические изображения, которые каждый рисует как хочет. Тексты в интернете пускай почти везде будут в юникоде, никто не возражает. Но, вот локально работать со своими и чужими текстами удобнее и практичнее в однобайтных кодировках (что решается однобайтной локалью; такой как ISO-8859-15 или KOI8-R).

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

Если изучать язык сугубо по транслитерации, то далеко не уедешь. Пример с вывесками как раз это и поясняет - выучил ты такой японский по ромадзи, приехал в Японию, а прочитать не можешь ни одной вывески. Учить язык надо по наиболее общеупотребимому его представлению, а не по самому удобному лично для тебя. А при детальном изучении языка на компьютере неизбежно появятся локальные документы на этом языке.

KivApple ★★★★★
()
Последнее исправление: KivApple (всего исправлений: 1)
Ответ на: комментарий от KivApple

Невозможно выучить неизвестный язык по собственным текстам. Язык изучают по чужим текстам. По бумажным книгам, по книгам в PDF/DJVU форматах (которые спокойно конвертируются в наборы jpeg'ов),... и т.д. А вот после этого набирать свои собственные тексты можно в однобайтной кодировке. А именно тексты именно в юникоде тут совсем не обязательны.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

Да можно всё, что угодно. Только вот это дополнительные трудности, влияющие на качество обучения, вызванные твоей упёртостью.

Вот смотри, многие ЛОРовцы свалили в Чехию и работают в местном филиале РедХата. В компании рабочий язык английский, родной язык самих ЛОРовцев — русский, в стране официальный — чешский. Им приходится работать с текстами на трёх разных языках. Что им по-твоему делать?

te111011010
()
Ответ на: комментарий от saahriktu

Невозможно выучить неизвестный язык по собственным текстам. Язык изучают по чужим текстам.

Это только в совдепии так было, чтобы не свалили. Как там было, Lena Stogova and her family? Любой учитель скажет, что нужно не только читать и слушать, но и самому говорить и писать.

te111011010
()
Ответ на: комментарий от te111011010

самому говорить и писать

При этом писать в тетрадке, а не на компьютере. Так неизвестная до этого момента письменность запоминается лучше. После чего спокойно можно юзать её аналоги. Для того же японского включая Shift-JIS и ромадзи.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от te111011010

Что им по-твоему делать?

localedef -i cs_CZ -f CP1251 cs_CZ.CP1251

Кстати,

localedef -i cs_CZ -f KOI8-R cs_CZ.KOI8-R
тоже работает.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от te111011010

Какими лоровцы все-таки пытаются быть мажорами! И языки-то они знают, и в страны каждый день переезжают.

А на самом деле наверняка в какой-нить деревне Зуевка живут, где что от Рязани до Зуевки, что от Зуевки до Рязани почти так же далеко. И сортир на улице. Да? )

hibou ★★★★★
()
Ответ на: комментарий от hibou

Ну я не знаю, может Шаман и Пост-Фактум живут в какой-нибудь Зуевке на самом деле, я не проверял.

te111011010
()
Ответ на: комментарий от te111011010

Вы уж определитесь: изучать или переписываться. Чтобы переписываться нужно уже знать иероглифы. И японских первоклассников учат определённому порядку их написания в бумажных тетрадках. И только после этого они начинают переписываться, а не наоборот. При этом большинство японцев знают далеко не все родные иероглифы, а только наиболее употребительные, и если начать писать сложные тексты японскими иероглифами, то никакой переписки с большинством японцев не получится. А оставшиеся наиболее грамотные японцы вполне прочитают и ромадзи.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от te111011010

Нет. Первая часть локали отвечает за язык локализованных сообщений. Например, vim при локали ru_RU.KOI8-R читает файл /usr/share/vim/vim80/lang/ru/LC_MESSAGES/vim.mo, а при локали cs_CZ.cp1251 будет вместо него читать файл /usr/share/vim/vim80/lang/cs/LC_MESSAGES/vim.mo .

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

Найти средненьких носителей языка готовых общаться с тобой проще, чем высококвалифицированных и образованных. И наиболее важным является как раз таки освоить язык на их уровне, чтобы не сесть в лужу в поездке из-за невозможности прочитать вывеску, указатель или какой-нибудь официальный документ.

KivApple ★★★★★
()
Ответ на: комментарий от te111011010

Это ответ на вопрос что определяет локаль. Как ни странно, локаль первой её частью определяет нужную локализацию. А набор символов для отображения готовых и набираемых текстов определяет вторая часть локали - кодировка.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от KivApple

Это всё туристопроблемы. Это никак не отменяет того, что можно более качественно выучить язык другими путями, а затем на практике юзать альтернативные формы записи для текстовых файлов.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

Угу, не всем нужно путешествовать.

Я вообще не понимаю, в чём заключается твоя жизнь, если тебе и то не нужно, и это не нужно, и, главное, ты уверен, что тебе это никогда не будет нужно. Ты вообще рассказал бы о своей личной жизни. Ты работаешь? У тебя есть хобби, кроме как писать на ЛОР о единственно правильной кодировки и патчить софт для её поддержки?

te111011010
()
Ответ на: комментарий от te111011010

Вообще-то, то, о чём я пишу, применимо и к коренным жителям Японии, Китая, Индии,... и т.д. Тем более, что свои родные языки они и так уже знают. Понятное дело, что официальные книги и документы тем, кто их готовит, придётся их делать с использованием оригинальной письменности, но это не отменяет того, что как для личных так и служебных нужд они могут находить наиболее удобными именно альтернативные формы записи текстов в т.ч. и в однобайтных кодировках. Те же китайцы столкнулись с проблемами ещё во времена пишущих машинок, а со временем стали разбивать иероглифы на отдельные части. И собирать этот конструктор - дело не такое уж и быстрое. Набрать нужный текст транслитом может быть гораздо быстрее и эффективнее.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от hibou

И языки-то они знают, и в страны каждый день переезжают.

Nem tudok te111011010-ról, de én Budapesten lakom, és most magyarul tanulok.

Miguel ★★★★★
()
Ответ на: комментарий от hibou

Это те, которые три строчки? Ну это сложно назвать полноценными стихами, скорее такой средневековый твит японский.

mandala ★★★★★
()
Последнее исправление: mandala (всего исправлений: 1)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.