Форум — General Geany: чтение us-ascii файлов с кириллицей geany 0 1 Как?Открывается текст а-ля «\u0421\u0441\u044B\u043B\u043A\u0430» Ссылка
Ответ на: комментарий от beastie 25.04.18 21:44:28 MSK Это очень ценная информация. Что это тогда и как в итоге прочитать?file -bi ru.properties text/plain; charset=us-ascii Ghostwolf ★★★★★ (25.04.18 22:11:18 MSK) автор топика Показать ответы Ссылка
Ответ на: комментарий от Ghostwolf 25.04.18 22:11:18 MSK IIRC, file читает только первые N byte. Русский текст похоже что выпадает за границы.Добавь в начало BOM (\uFEFF), может поможет. beastie ★★★★★ (25.04.18 22:17:38 MSK) Показать ответ Ссылка
Ответ на: комментарий от Ghostwolf 25.04.18 22:11:18 MSK Это очень ценная информация. Что это тогда и как в итоге прочитать?Только ты ценности этой информации не видишь. Как только ты ответишь на вопрос «что это?» — это и будет половиной решения твоей проблемы.В Geany диалог «Open file» позволяет указать кодировку открываемого файла. Укажешь правильную — и будет тебе щастье.А вообще, man geany. debugger ★★★★★ (25.04.18 23:06:51 MSK) Последнее исправление: debugger 25.04.18 23:08:06 MSK (всего исправлений: 1) Ссылка
Открывается текст а-ля «\u0421\u0441\u044B\u043B\u043A\u0430»Скорее всего, у тебя реально там текст «\u0421\u0441\u044B\u043B\u043A\u0430». Не представляю, с какой стати Geany будет подобным образом кодировать текст. i-rinat ★★★★★ (27.04.18 00:43:22 MSK) Показать ответ Ссылка
Ответ на: комментарий от beastie 25.04.18 22:17:38 MSK file читает только первые N byteУ меня он читает первые 1048576 байт. Для текстовых файлов — с запасом. Правда, не известно, сколько из них он проверяет. i-rinat ★★★★★ (27.04.18 00:45:43 MSK) Ссылка
Ответ на: комментарий от i-rinat 27.04.18 00:43:22 MSK «\u0421\u0441\u044B\u043B\u043A\u0430»tclsh8.6 [~]puts "\u0421\u0441\u044B\u043B\u043A\u0430" Ссылка Т.е. это UCS-2 или UTF-16. ABW ★★★★★ (27.04.18 05:58:31 MSK) Показать ответ Ссылка
Ответ на: комментарий от ABW 27.04.18 05:58:31 MSK Прогони свой файл через hexdump, вот так: hexdump -C yourfile.txt Скорее всего, у тебя там просто байты, кодирующие ASCII-символы \, u, 0, 4, 2, 1. i-rinat ★★★★★ (27.04.18 15:15:45 MSK) Показать ответ Ссылка
Ответ на: комментарий от i-rinat 27.04.18 15:15:45 MSK Только я здесь при чём? У меня нет никакого файла. ABW ★★★★★ (27.04.18 16:09:14 MSK) Показать ответ Ссылка
Ответ на: комментарий от ABW 27.04.18 16:09:14 MSK Я тебя с ТС спутал. i-rinat ★★★★★ (27.04.18 16:23:38 MSK) Ссылка