Не получается работать с кириллицей из плюсовой программы:
Если вхардкодить кириллическую строку, она и в файл и в stdout выводится как надо, в нужной локали, и все верно,
но стоит попытаться прочитать оную кирилицу из файла, stdin или, как в моем случае - получить от tesseract-ocr, вся кириллица (но не цифры) превращается в d0 (или 208) - символ Ð
Первый раз понадобилось, и тут такая ересь Оо
Скрин из дебагера
UPD: Товарищ с stackoverflow подсказал что у меня юникод невалидный - русские символы должны занимать 2 байта - d0 + код символа.
Очевидно, что-то в моей генте не так, но что?
Локали есть:
(1/4) Generating en_US.ISO-8859-1 ...
(2/4) Generating en_US.UTF-8 ...
(3/4) Generating ja_JP.UTF-8 ...
(4/4) Generating ru_RU.UTF-8 ...