LINUX.ORG.RU

n7t328IIpnwd 0.3

 , ,


3

4

Состоялся релиз n7t328IIpnwd 0.3 — утилиты для lossless дампа UTF-32 данных в KOI8-R/ASCII.

Название утилиты является производным от «utf-32 to koi8-r dump», где «n7t» и «pnwd» являются зеркальными отражениями (по вертикали) «utf» и «dump» соответственно. Утилита является более мощным и более современным аналогом таких утилит, как utfinfo.pl и uniname из набора утилит uniutils. В число особенностей утилиты входят отключаемость режима «один символ на строку» (по умолчанию выключен), который является единственным рабочим режимом для перечисленных утилит, а также наличие обёртки KOI8-R, которая позволяет дампить символы из состава 2-й половины кодовой таблицы KOI8-R как они есть, в соответствующих кодах KOI8-R (по умолчанию включена). При отключении обёртки KOI8-R как они есть дампятся только символы из состава ASCII.

Для получения информации о названиях символов Юникода утилита использует библиотеку libunistring, которая является чуть ли не единственным современным решением. utfinfo.pl использует модуль CharName.pm из состава Unicode-String, который не содержит информацию о ряде новых символов из состава юникода, соответствует данным о стандарте не новее чем 2005 г. uniname использует собственную таблицу и не обновлялась с 2009 г.

Примеры результатов:

   В своей формулировке теоремы о неполноте Гёдель использовал понятие
   [GREEK SMALL LETTER OMEGA]-непротиворечивой формальной системы [EM DASH] более сильное условие, чем
   просто непротиворечивость. Формальная система называется
   [GREEK SMALL LETTER OMEGA]-непротиворечивой, если для всякой формулы A(x) этой системы
   невозможно одновременно вывести формулы А(0), А(1), А(2), [HORIZONTAL ELLIPSIS] и [THERE EXISTS]x [NOT SIGN]A(x)
   (другими словами, из того, что для каждого натурального числа n
   выводима формула A(n), следует невыводимость формулы [THERE EXISTS]x [NOT SIGN]A(x)). Легко
   показать, что [GREEK SMALL LETTER OMEGA]-непротиворечивость влечёт простую непротиворечивость
   (то есть, любая [GREEK SMALL LETTER OMEGA]-непротиворечивая формальная система
   непротиворечива)^[6].
Vine Linux [HIRAGANA LETTER NI][HIRAGANA LETTER TU][HIRAGANA LETTER I][HIRAGANA LETTER TE]

   Vine Linux [HIRAGANA LETTER HA][IDEOGRAPHIC COMMA]Project Vine[HIRAGANA LETTER O][HIRAGANA LETTER YO][HIRAGANA LETTER BI][591a][HIRAGANA LETTER KU][HIRAGANA LETTER NO][5354][529b][8005][HIRAGANA LETTER NI][HIRAGANA LETTER YO][HIRAGANA LETTER SMALL TU][HIRAGANA LETTER TE][958b][767a][HIRAGANA LETTER GA][884c][HIRAGANA LETTER WA][HIRAGANA LETTER RE][HIRAGANA LETTER TE][HIRAGANA LETTER I][HIRAGANA LETTER RU][IDEOGRAPHIC COMMA]
   [KATAKANA LETTER KO][KATAKANA LETTER N][KATAKANA LETTER PA][KATAKANA LETTER KU][KATAKANA LETTER TO][HIRAGANA LETTER DE][8efd][91cf][HIRAGANA LETTER NA][65e5][672c][8a9e]Linux[KATAKANA LETTER DE][KATAKANA LETTER SMALL I][KATAKANA LETTER SU][KATAKANA LETTER TO][KATAKANA LETTER RI][KATAKANA LETTER BI][KATAKANA LETTER SMALL YU][KATAKANA-HIRAGANA PROLONGED SOUND MARK][KATAKANA LETTER SI][KATAKANA LETTER SMALL YO][KATAKANA LETTER N][HIRAGANA LETTER DE][HIRAGANA LETTER SU][IDEOGRAPHIC FULL STOP] [KATAKANA LETTER I][KATAKANA LETTER N][KATAKANA LETTER SU][KATAKANA LETTER TO][KATAKANA-HIRAGANA PROLONGED SOUND MARK][KATAKANA LETTER RU][HIRAGANA LETTER NO][76f4][5f8c][HIRAGANA LETTER KA][HIRAGANA LETTER RA][5feb][9069][HIRAGANA LETTER NA][65e5][672c][8a9e][74b0][5883][HIRAGANA LETTER DE][4f5c][696d][HIRAGANA LETTER GA][HIRAGANA LETTER DE][HIRAGANA LETTER KI][HIRAGANA LETTER RU][HIRAGANA LETTER YO][HIRAGANA LETTER U][HIRAGANA LETTER NI][IDEOGRAPHIC COMMA]

В состав архива входит также скрипт n7t328IIpnwd_lynx.sh, который дампит текст со страницы по ссылке в KOI8-R (UTF-8 -> UTF-32 -> KOI8-R) через lynx.

>>> Скачать (2257 байт)

★★★★★

Проверено: Shaman007 ()
Последнее исправление: sudopacman (всего исправлений: 3)
Ответ на: комментарий от te111011010

У меня нет коллекции текстовых файлов. У многих тут тоже нет.

А у меня есть.

И большинство не прыгало. Просто при установке дистрибутива был utf-8.

Когда я пришёл никаким UTF-8 по дефолту и не пахло. В том же ядре переменная default_utf8 в vt.c появилась только почти через 4 года, в следующем году после того как я отказался от иксов и начал во всю юзать ядерную консоль, а в true её выставили ещё через полгода. Так что, я прекрасно помню времена когда в моём /etc/inittab не было строчки

r2::wait:/bin/echo 0 > /sys/module/vt/parameters/default_utf8

saahriktu ★★★★★
() автор топика
Последнее исправление: saahriktu (всего исправлений: 1)
Ответ на: комментарий от saahriktu

А у меня есть.

Переконвертируй один раз и забудь. В ближайшие годы не ожидается появление новой стандартной кодировки.

Когда я пришёл никаким UTF-8 по дефолту и не пахло.

И ты ни разу не переустанавливал систему?

te111011010
()
Ответ на: комментарий от te111011010

Переконвертируй один раз и забудь.

Зачем, если я продолжаю юзать локаль KOI8-R?

И ты ни разу не переустанавливал систему?

Представьте себе, сейчас я пишу из системы, которая была получена обновлениями со сборки 2007-го года, когда переменная default_utf8 в ядре уже была, но ещё не была выставлена в true. При этом это вообще LFS, а не какая-нибудь Убунта, которая из коробки многое решает за юзера. На Raspberry Pi у меня сборки свежее, поскольку основаны на сборках PILFS, но это не мешает мне и там настраивать всё аналогично.

saahriktu ★★★★★
() автор топика

💀👻🚽💍📐😈🍆🏥✈️📷🍲🍙🐼🏤🚢🃏🎌🚈🚓⏳🚟🐧💴🔲🚅7️⃣🚅⚽️👀📡📬🐼🏦⛲️⚽️⏳🚞📹🏩📓☑️📬☑️📓🐦🚓💀🏂🚟⏳🚏 🚠🎐👿👿🍛📟🔊🐼🌗📟🚓🍲🔉🐘🚀🔲🔊🐐📬👀🌗▫️🔧🍠📼😈🐦🚞🚐👽✈️🔉🍛🚟🚋🏤🚋🐘⌛️🎌📬🏤📟🔲🛀🚓☑️🍆 💺💺🍆🚓▫️🏤🚐🏤▫️🍛▫️🔧▫️🔲🔲🚋🔧🚞🍛💴🔳🚉🐗🌊🎬🔩🔪👤🚉🏦🔉🍲🚽🚿🚄✈️🚈🏂🍲🎹🍲🔉⏳🚄🚀⛄️🚋🔮 🎐👿🔈🚈🚓🐼⌛️🚞🏤🏠✈️🔈⏳🚄🚿📷🍙🐧🛁🚷🏃🚷🏃🔍📵🚶🚂❕🐡🎎🍆🐧🐘🏦🚋📬🎹🚄🛀☑️▫️🐧⏳🏁📟⛲️🚈👚 🚝👚☑️🚈🐦🚓🔧🚓🐘🍲🚓🚓✈️🚽🐼👀💴🚦◾️🏇💂🔎💻🔌🚲⬛️™🎋🏃🔎🚩💒📟🚟📬🐘🚢👟📬📷📟🐨💴🚈📬📷📡👿 🚝👿📹🍛🐐🚀🚞📡🐐📬👽📟🚢📬👽🍙🍠🚂🔫🚲✖️🚁👞🏃👞🚶🏃🚧🚊📞✖️🎩🚓🏁🏦⛄️🚿🌗🔲🚄❄️🔖🐐📡🐦🔖🏂🏁 🍆👚⚽️🏂📡☑️🏦🏩📹⚽️⛲️🃏🐼🚋❄️⏳🎳🐗🐙🍘🍘🐙🎯🍄🍳🍫💩🚡🚶📞⛳️⚫️🎬📷🔖🔈🏂🚟🔖🐨🐼⏳🔲🚄🚟📷🚽👀 😈🏯🐦🔖🔉📷🃏✈️🔉🍲🐨🍛💴🚈❄️🔪💒👝🐵🆎🈲🈵💌🈲💌🍮🚗🍘⛺️🏃💻🔛⬛️📹💀📡⛲️👽👽💴🍙🚐⚽️📷🚄🐐🏯🚢 🍆👾🐼👽✈️🚈🃏🔖⛲️🚟📬🚿🐦📡👮👫🆘🔸🈵🈲🈵📔🆎💌🈵🈴💄🏀🌜🐺🚶♠️🎤🐄👻🚽⚽️🔧💀🔖🏦☑️▫️🐨🚿🏩🐼⚽️ 👾👚🐨▫️🚄🍲👀🎹📹📟🌗📷🔧⛲️🎣🐙🍄💏🆎🈺📈🚼🐖🆎🆎🍮📮❤️🐴🐒🎸🚁🏇♠️🐊👀🚄📡📟7️⃣🆓🚽🏠🍲🚐📡🏥🚽 🍆🍆🐼🌗⛲️🚋📓👟🏤👽🔧🍙🏤👿🐀💐💄🚵🆎🈶🐔🚼😷💌🆎🍻🚒🆑👹🐒🍕🔩🎓🔫🔍🔖🐐👀🎡🏬7️⃣📷🔈🚓🚋🎌🔧🚢 📹🏠⌛️🏥🃏👽👽📷⏳🔖⛄️🔉☑️🎍🍠🎯🎁😺💌💌📔🈺🈲💌🆎😸🐣🚒🚒🐌🍗💒🚳📞✖️🍛👀🎡🌗🚽👟🃏🏠🔈🎌🐘❄️⚽️ ✈️🔖📬🛀🏤👽⌛️🔲🎌🎌💴🚓🔊📼🍠🆘🍮💏💌🆎🆎🈲🈲🈵🆎💌🍌🍝🍄⛵️🐂🐗🏆™🔗👿🚢🏥🚈🚄🛀🚄👀👽🌗🐼🏯🏠 🏤☑️▫️⛲️☑️🚓📬🚓📷⌛️⏳🚈👀🐗🎴🍄🚌🈲💌🈲🆎🆎🆎🈵💌🚕🎯🆑📮🐗🍘🍗🚳🔗🏇🐐🚢🏯🍙📓🚢🃏🔉❄️💴🚓📬🏯 💀🏩🐐🏠🔖🔖🃏⛲️🏩🚐🏤⛄️⚽️👿⛵️🚗🍄👝🌄📅🈲🈵💌💸🐰🐌🐗🏈🐒⛵️💐🌹🎋▪️🐜🔪⏳👟🐼🆒🆓📟🔤📓🏂🏤✈️⌛️ 📟🚀🌗🐐❄️🏩🚓🏯🚞🔊🃏🚞🌗🚢🔑🐗🔇🙅⛔️🐗🎅🈵🈵🚒🚜🆘🚵😹🐗🚜🍠⛺️🎋💂🎋💐🏥🔉🚅🚅🆒🎡⛲️🔊📡🔈⚽️📷 🐧▫️📷🔈🔊💀🚄🔉🐧🍙🚢🏦🏩🚿🐗💄🚵⛔️💒🐙🆘🆎🌄🔑⛔️🍢🎱🐅👺🔇💄🐂🚩🚶🐞👜💀🍛

anonymous
()
Ответ на: комментарий от inchallah

КОИ8 нужен, т.к. является хорошей рабочей локалью. А хрюникод нужен только вускоглазым обезьянам!

anonymous
()
Ответ на: комментарий от anonymous

Да поймите вы, дураки, многие англоязычные разработчики так же думают про ВСЕ другие локали отличные от en. Результат: все, млть, на английском и хер переведешь.

anonymous
()
Ответ на: комментарий от anonymous

Так no problems же. Английский - самый международный язык круче эсперанто. Знающего английский язык найти проще. Вот и надо всем, кто ещё не знают английский, его выучить. И всё, никаких проблем.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

Так почему у тебя локальных не асци1250 и ты тут? Иди на линукс.орг.сом но проблем.

Совсем шизанутые люди.

anonymous
()
Ответ на: комментарий от anonymous

Потому, что я ещё и русский язык знаю, а потому 13 лет назад выбрал локаль KOI8-R.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

Для русского и английского есть.

Полноценных — нету. Пример неполноценности — данный комментарий, не воспроизводимый ни в одной из существующих однобайтовых кодировок для русского языка.

dexpl ★★★★★
()
Ответ на: комментарий от TeopeTuK

В банальной кодировке cp1251 вполне воспроизводится, если я ничего не напутал.

Да, действительно.

dexpl ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.