LINUX.ORG.RU

и снова iconv

 


0

1

Всем доброго времени суток! Всех с праздником! :)

Возник вопрос по использованию iconv. Стоит задача конвертнуться из utf8 в latin1( iso-8859-1 ), но при этом - что возможно - конвертировать, что нельзя - оставить как есть ( т.е. не полная конвертация - например Ü - конвертируем в одно-байтный символ, т.к. есть аналог в latin1; а вот 儒 - оставляем в виде утфных 2 байтов ).

К моему сожалению кроме iconv/recode в голову ничего не приходит. У обеих одна и та же болезнь -c( //TRANSLIT ) / -f( -d ) - и нет проблем - они заменят иероглифы на вопросики. Если же убрать ключ -c / -f - он вылетит с ошибкой и не произведёт конвертацию..

А хочется как говорится и рыбку съесть и на дерево залезть.

Спасибо за ваше время и внимание! Хорошего всем вечера!


Исходники доступны, просто доработайте утилиту.

Sorcerer ★★★★★
()

ICU не приходит в голову? А чё так? Iconv жто от бедности.

anonymous
()

Брять icu, гуглить про режимы нормализации юникода - кажется там есть как раз подходящий.

slovazap ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.