LINUX.ORG.RU

[gentoo] UTF ломает текст из Бразилии

 


0

1

В папке Contrib от пакета NLucene есть исходник в UTF, в котором используются три символа 'a' с разными умляутами.

Linux не может правильно представить эти символы и из-за этого ломается компиляция. Что докрутить?



Последнее исправление: StrongDollar (всего исправлений: 1)
Ответ на: комментарий от Xenesz

Ссылку дай на текст

http://svn.apache.org/repos/asf/lucene/lucene.net/trunk/C%23/contrib/Analyzers/BR/BrazilianStemmer.cs

в функции

private string changeTerm(string value)

как-то так получается, что символ 'a' сливается с закрывающей кавычкой
и компилятор выдает сообщение, что образуется незакрытая символьная константа

StrongDollar
() автор топика
Ответ на: комментарий от Xenesz

не понял, как это проверить, но команда locale выдает такое:

LANG=
LC_CTYPE=«C»
LC_NUMERIC=«C»
LC_TIME=«C»
LC_COLLATE=«C»
LC_MONETARY=«C»
LC_MESSAGES=«C»
LC_PAPER=«C»
LC_NAME=«C»
LC_ADDRESS=«C»
LC_TELEPHONE=«C»
LC_MEASUREMENT=«C»
LC_IDENTIFICATION=«C»
LC_ALL=C

StrongDollar
() автор топика
Ответ на: комментарий от StrongDollar

Видимо, компилятор ожидает, что там будет ASCII, раз локаль POSIX. Сделайте, например, LC_ALL=ru_RU.UTF-8 emerge...

ArtSh ★★☆
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.