Подскажите, пожалуйста, кроссплатформенное решение проблемы русского ввода и русского вывода на c++?

В ASCII ты русский язык никак не выведешь. Проще всего будет взять Qt и не страдать.

hateyoufeel ★★★★★
(29.09.18 22:44:09 MSK)

как это всё заставить работать в кодировке ASCII?

В ASCII нет русских букв, там только коды от 0 до 127.

bormant ★★★★★
(29.09.18 22:44:45 MSK)

Ссылка

Строки из Qt или GLibmm

meliafaro ★★★★★
(29.09.18 22:52:50 MSK)

Ссылка

Ответ на: комментарий от hateyoufeel 29.09.18 22:44:09 MSK

Окей, хорошо тогда можно обойтись без ASCII, если да то как?

blbulyandavbulyan ★
(29.09.18 22:56:50 MSK) автор топика

Ссылка

Ответ на: комментарий от hateyoufeel 29.09.18 22:44:09 MSK

Можно ли использовать Unicode или там тоже будет проблема с русскими буквами?

blbulyandavbulyan ★
(29.09.18 23:00:17 MSK) автор топика

QString - UTF-16

std::string - набор произвольных байт.

Делаем выводы.

~~RazrFalcon~~ ★★★★★
(29.09.18 23:07:56 MSK)

Ссылка

сохраняй файлы в cp866? (нет)

ASCII

никак, лол. Уже все признали что без уникода никуда, хватит страдать хернёй. Ты ещё бы koi-7 взял. Причём, обычно берут utf16 в памяти (спасибо корпорациям, блин), и utf8 везде.

anonymous
(29.09.18 23:09:28 MSK)

Ссылка

если пользователь ввёл строку, то её можно было корректно вывести ему обратно

Для этого ничего не нужно делать вообще, со строкой можно работать как с байтами.

чтобы если в программе была проинициализирована строка, содержащая русские буквы, то чтобы и её можно было также корректно вывести

Тут много вариантов. man wstring, setlocale. Можно обойтись iconv. А чтобы было удобно лучше взять что-нибудь повыше уровнем типа icu или Qt.

slovazap ★★★★★
(29.09.18 23:54:34 MSK)

Ссылка

Use QString, Luke!

XMs ★★★★★
(30.09.18 00:18:36 MSK)

Ссылка

https://docs.microsoft.com/en-us/windows/console/console-code-pages

или кодируй строку для CP866 в libiconv

anonymous
(30.09.18 06:36:07 MSK)

Ссылка

Если подразумевается консольный ввод-вывод и нужна совместимость с Linux и Windows, то можно использовать boost-nowide.

vodka2
(30.09.18 07:59:12 MSK)

Ответ на: комментарий от vodka2 30.09.18 07:59:12 MSK

Если подразумевается консольный ввод-вывод и нужна совместимость с Linux и Windows, то можно использовать boost-nowide.

А с помощью стандартных библиотек C++ нельзя это сделать?

blbulyandavbulyan ★
(30.09.18 10:20:37 MSK) автор топика

если пользователь ввёл строку, то её можно было корректно вывести ему обратно

- использование narrow потоков ввода-вывода(если не трогать локали, или трогать со знанием дела - там по умолчанию ввод-вывод «как есть», без преобразований)

- использование wide потоков + user-preffered локаль

если в программе была проинициализирована строка, содержащая русские буквы, то чтобы и её можно было также корректно вывести

- char + narrow I/O: при этом кодировка исходника дожна соответствовать таковой в user-preffered локали(в линуксах более-менее просто - в большинстве мест UTF-8, работает так: литералы char/char[] компилятор пишет в объектник «как есть»)

- wchar_t + wide I/O: здесь надо перед компиляцией перегнать исходник в кодировку из user-preffered локали: что-то типа `iconv -f $SOURCE_IN_ENCODING < $SOURCE_IN > $SOURCE`, "-t" не нужно, и уже его компилять(про то, что надо в приложении локализовать потоки тоже забывать не стоит)

А вообще да, use qt/boost/icu/libiconv

Deleted
(30.09.18 10:54:00 MSK)
Последнее исправление: dllmain 30.09.18 10:54:39 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от blbulyandavbulyan 30.09.18 10:20:37 MSK

Едва ли можно. Если не хочется подключать даже такую небольшую библиотеку (там есть вариант без boost), то можно убрать из неё то, что не нужно.

Вообще, наверно, самый правильный вариант вывода в консоль не ASCII текста в Windows — это использование WriteConsoleW. (остальные варианты описаны на RuSO) Соответственно, можно реализовать свой std::streambuf, в котором конвертировать строку из char в wchar и потом выводить с помощью WriteConsoleW. Далее, этот streambuf передаётся std::istream и полученный istream можно использовать, так же, как и std::cout. В Linux же UTF-8 просто выводится с помощью std::cout. Собственно, в boost-nowide как-то так и сделано.

vodka2
(30.09.18 11:14:56 MSK)

Ссылка

как это всё заставить работать в кодировке ASCII?

ASCII уже давно протухла. Использовать 8 бит под национальный алфавит оказалось не очень удобно. Обратная совместимость с US-ASCII есть в UTF-8, ее и советую использовать.

кроссплатформенное решение проблемы русского ввода и русского вывода на c++?

std + utf-8. Вот мой маленький экземпл, который прояснит многие моменты: https://gist.github.com/RotiVP/41475739072a5ebddaa82b9c23664ea4

Rot1 ★
(30.09.18 13:01:21 MSK)

Ответ на: комментарий от Rot1 30.09.18 13:01:21 MSK

std + utf-8. Вот мой маленький экземпл, который прояснит многие моменты: https://gist.github.com/RotiVP/41475739072a5ebddaa82b9c23664ea4

Твой эксепл кидает исключение на 10 строке, если скомпилировать его при помощи Visual Studio 2015, а вот если компилить с помощью g++ под Ubuntu Server то никаких исключений нет и всё работает корректно, почему?

blbulyandavbulyan ★
(30.09.18 21:31:32 MSK) автор топика

puct' vvodiat latinicoi !

anonymous
(30.09.18 22:21:58 MSK)

Ответ на: комментарий от blbulyandavbulyan 30.09.18 21:31:32 MSK

наверно в венде локали устанавливаются не так, ну и к чёрту эту венду, правда?

anonymous
(30.09.18 22:27:39 MSK)

И да, кстати, сейчас на самом деле в большинстве случаев можно (и нужно) просто наплевать на локали (шарикту и его восьмибитные друзья могут проследовать куда хотят), выкинуть mb* функции и работать везде исключительно с utf-8. В новом стандарте и тип специально для этого появился. А уж если что-то дополнительно понадобится, типа нормальзиции или трансформаций (upper/lower case) я бы взял icu.

slovazap ★★★★★
(30.09.18 23:41:33 MSK)

Ответ на: комментарий от anonymous 30.09.18 22:21:58 MSK

Русский язык невозможно латинизировать. Но не потому, что технически невозможно, а потому что каждый первый анонимус чешет любой лапой как попало.

post-factum ★★★★★
(30.09.18 23:44:41 MSK)

Ссылка

Ответ на: комментарий от slovazap 30.09.18 23:41:33 MSK

работать везде исключительно с utf-8. В новом стандарте и тип специально для этого появился.

char8_t уже приняли в стандарт?

utf8nowhere ★★★
(01.10.18 00:33:16 MSK)

Ответ на: комментарий от utf8nowhere 01.10.18 00:33:16 MSK

Зачем? Это char.

slovazap ★★★★★
(01.10.18 00:35:30 MSK)

Ответ на: комментарий от slovazap 01.10.18 00:35:30 MSK

В char уже гарантировано лежит UTF-8?

utf8nowhere ★★★
(01.10.18 00:39:15 MSK)

Ответ на: комментарий от utf8nowhere 01.10.18 00:39:15 MSK

Не менее гарантировано чем ASCII.

slovazap ★★★★★
(01.10.18 00:59:37 MSK)

Ссылка

Если нужен транслит, то я как раз сегодня страничку обновил:

http://программирование-по-русски.рф/яролит.яргт/

den73 ★★★★★
(01.10.18 01:23:12 MSK)

Ответ на: комментарий от den73 01.10.18 01:23:12 MSK

фальшивый

falqshivyyyi

Понедельник начался с тяжёлых наркотиков

UPD: это ещё не самый эпик — о нас:

Not Found

The requested URL /Ð¾-Ð½Ð°Ñ.ÑÑ€Ð³Ñ‚ was not found on this server.
Apache/2.4.10 (Unix) Server at xn-----6kcajervcdvqarhfgengcekya4c.xn--p1ai Port 80

Кириллизация, которую мы заслужили.

Deleted
(01.10.18 11:11:19 MSK)
Последнее исправление: ecko 01.10.18 11:14:09 MSK (всего исправлений: 2)

Ссылка

подскажу. UTF8

~~darkenshvein~~ ★★★★★
(01.10.18 11:50:18 MSK)

Ответ на: комментарий от blbulyandavbulyan 29.09.18 23:00:17 MSK

Можно ли использовать Unicode

Зачем Юникод когда есть KOI8-R? В виндовом cmd.exe тогда можно просто выполнить «chcp 20866», и он переключит кодировку на KOI8-R.

saahriktu ★★★★★
(01.10.18 11:58:33 MSK)

Ответ на: комментарий от saahriktu 01.10.18 11:58:33 MSK

Зачем Юникод когда есть KOI8-R?

Зачем жить в нормальном жилье, когда есть старый сарай?

В виндовом cmd.exe тогда можно просто выполнить «chcp 20866», и он переключит кодировку на KOI8-R

Не всем нужно усложнять себе жизнь ради такого неоправданного фанатизма

XMs ★★★★★
(01.10.18 12:22:13 MSK)

Ссылка

Ответ на: комментарий от den73 01.10.18 01:23:12 MSK

Это можно считать разве что машинно-читаемым транслитом, ибо человеку читать такое невозможно.

Славянские языки без диакритики не латинизируются!

post-factum ★★★★★
(01.10.18 15:34:50 MSK)
Последнее исправление: post-factum 01.10.18 15:34:55 MSK (всего исправлений: 1)

Ответ на: комментарий от anonymous 30.09.18 22:27:39 MSK

наверно в венде локали устанавливаются не так, ну и к чёрту эту венду, правда?

Мне нужно кроссплатформенное решение, используя только стандартные библиотеки.

blbulyandavbulyan ★
(01.10.18 16:25:11 MSK) автор топика

Ссылка

Ответ на: комментарий от post-factum 01.10.18 15:34:50 MSK

На самом деле, смотря сколько за это будут платить. Если выбор стоит между двуязычием и транслитом в отдельных местах, которых не так уж много, я выберу такой транслит.

den73 ★★★★★
(01.10.18 16:50:40 MSK)

Ответ на: комментарий от den73 01.10.18 16:50:40 MSK

Но ладно, не буду больше загружать эту тему офтопиком :)

den73 ★★★★★
(01.10.18 17:04:57 MSK)

Ссылка

Ответ на: комментарий от den73 01.10.18 01:23:12 MSK

Пожалуйста НЕТ! Во всем нормальном мире пишут и код и коменты на английском. Что б прогер из другой страны мог понять о чем речь. Кроме того, что ты физически уменьшаешь количество потенциальных разработчиков способных поддерживать твой код, твое решение еще и просто уродливо. Я даже не знаю что выглядит хуже
Это?

falqshivyyyi ehkzemplyar

Или это?

jHjejljljo

Пол беды если б это решение было некрасивым, но действительно облегчало где-то жизнь. Но ты только делаешь хуже, внося несовместимость там, где она была. Это будут использовать только маргиналы вроде Эдди или могут попробовать ввести в проект какие-нибудь поехавшие менеджеры, которые сами не шарят в разработке.

Aswed ★★★★★
(02.10.18 10:49:58 MSK)

Ответ на: комментарий от Aswed 02.10.18 10:49:58 MSK

Если хочешь всерьёз поговорить, то, пожалуйста, уклоняйся от использования определения «весь нормальный мир».

den73 ★★★★★
(02.10.18 11:17:00 MSK)

ASCII

KOI-7

slapin ★★★★★
(02.10.18 11:24:53 MSK)

Ссылка

Ответ на: комментарий от den73 02.10.18 11:17:00 MSK

уклоняйся от использования определения «весь нормальный мир»

Не буду уклоняться. Не в контексте этого изобретерия.

Aswed ★★★★★
(02.10.18 11:25:25 MSK)

Ответ на: комментарий от Aswed 02.10.18 11:25:25 MSK

Тогда разговаривай с кем-нибудь другим.

den73 ★★★★★
(02.10.18 12:18:22 MSK)

Ссылка

Ответ на: комментарий от saahriktu 01.10.18 11:58:33 MSK

Хрюникодофилы не поймут. Потреблядям невозможно объяснить, что они - потребляди!

anonymous
(02.10.18 12:31:26 MSK)

Ссылка

Ответ на: комментарий от Aswed 02.10.18 10:49:58 MSK

Во всём нормальном мире пишут и код и коменты на китайском. В принципе всё равно, меня как носителя языка не слишком напрягают нормальные комментарии на русском (они куда лучше плохих на английском). Кому надо воспользуются гуглопереводчиком.

anonymous
(02.10.18 12:40:11 MSK)

Ответ на: комментарий от anonymous 02.10.18 12:40:11 MSK

Меня тоже не особо напрягают коменты на русском(так как я сам русский и легко их читаю), если, конечно, исходники в юникоде. Так как иначе еще и начинается проблема с кодировками. Но надо понимать, что если твой код документирован на русском, то никто кроме русских его использовать не сможет. Если это закрытый софт и масштабирование команды не планируется - все ок. Если ты делаешь опен сорс или не знаешь, кто будет поддерживать твой код - документировать на русском не правильно.
Однако же писать коменты или код транслитом это всегда ужасно.

Aswed ★★★★★
(02.10.18 13:32:24 MSK)

Ссылка

русский язык
Не подскажите

Моя твоя не понимай!

anonymous
(02.10.18 14:01:54 MSK)

Ссылка

Ответ на: комментарий от anonymous 02.10.18 12:40:11 MSK

Комменты не на английском пишут только начинающие быдлокодеры и те, кому насрать на окружающих. Если хочется, чтобы увидев твой код люди не начали тебя материть на чем свет стоит, а сказали спасибо, воспользовавшись кусками твоего кода, комментарии надо делать на английском.

И вообще, в исходных кодах не должно быть символов, выходящих за пределы таблицы ASCII.

anonymous
(02.10.18 14:03:47 MSK)

Возьми Qt с его QString и не парься, это лучшее что есть на сегодняшний день.

Хотя даже в них будут проблемы на различных операционках, особенно в поделии Билли:

Русские буквы в консольных приложениях Qt под Windows

Как в Qt работать с русскими именами файлов и директорий под Windows

Как в Qt узнать системную кодировку локали под Windows

Xintrea ★★★★★
(02.10.18 15:07:18 MSK)

Ссылка

Ответ на: комментарий от anonymous 02.10.18 14:03:47 MSK

Посты не на английском пишут только недалёкие и те, кому насрать на окружающих. Если хочется, >чтобы увидев твой пост люди не начали тебя материть на чем свет стоит, а сказали спасибо, >воспользовавшись информацией из него, посты надо делать на английском.
И вообще, в постах не должно быть символов, выходящих за пределы таблицы ASCII.

Надеюсь, это упырит мел пуристов(и, кстати, начинающих быдлокодеров тоже, лол:-)

anonymous
(02.10.18 18:00:40 MSK)

Ссылка

кроссплатформенное

C++

не бывает такого
пиши костыль на каждую ОС

~~missxu~~
(02.10.18 18:01:37 MSK)

Ответ на: комментарий от darkenshvein 01.10.18 11:50:18 MSK

подскажу. UTF8

двухбайтовый чар с C++
сложно сказать что может быть хуже

~~missxu~~
(02.10.18 18:03:09 MSK)

Ссылка

Ответ на: комментарий от missxu 02.10.18 18:01:37 MSK

Тот самый случай, когда пожар не потушить...

anonymous
(02.10.18 18:11:06 MSK)

Ссылка

Не подскажите

Так и быть, не подскажем.

anonymous
(02.10.18 18:17:35 MSK)

Ответ на: комментарий от anonymous 02.10.18 18:17:35 MSK

Так и быть, не подскажем.

Теперь подсказывай, я изменил название темы.

blbulyandavbulyan ★
(02.10.18 22:36:19 MSK) автор топика

Ссылка

Похожие темы