LINUX.ORG.RU

Вышел ASPSeek 1.2.5


0

0

Это наиболее долгожданный релиз, не считая 0.9.9. Добавлено: сохранение в UTF-8 вместо просто UNICODE (помогает сэкономить, если слова на английском); почти полный набор документации в формате man, опция MaxDocsAtOnce для более быстрого индексирования в случае очень большого кол-ва серверов. Пофиксено большое количество багов и коредампов.

>>> Качать отсюда



Проверено:

Под просто UNICODE подразумевается UTF-16?

Havoc ★★★★
()

IMHO просто UNICODE - это когда символ кодируется 16-ти битным словом (для UNICODE BMP) или 32-разрядным. Даже для символов, описанных в ASCII, тратится не менее двух байтов. А utf8 и ASCII совпадают для семибитных символов, что позволяет для латиницы тратить один байт на символ. Речь идёт именно об этой экономии.

anonymous
()

Не, UNICODE - это целое семейство, а UTF-8 только один из членов.
А вот как раз в UTF-16 используется по 2 байта на каждый символ.
Еще есть всякие приколы с разным порядком байтов.

Havoc ★★★★
()

Хрен с ней, с экономией. Как мне проиндексовать чешский сайт? Вместо чешских букв имею вопросительные знаки. В charsets.conf все чешские кодировки открыты. LocalCharset - cp1250. Хрен пашет.

bormann
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.