Выпущена новая версия Elasticsearch — современного распределенного движка полнотекстового поиска и выполнения аналитических запросов реального времени.
Одной из основных целей при выпуске этой версии — повышение стабильности и надежности сервиса:
- Значительно улучшен алгоритм управления кластером и выбора master-узла, ранее имевший ряд известных проблем
- Добавлена проверка контрольных сумм хранимых данных для определения «битых» сегментов индекса и журналов операций
- Механизм прерывания исполнения запроса при превышении лимита на потребление оперативной памяти
Также в этой версии:
- Оптимизирован механизм doc values — поколоночного хранилища данных для быстрого извлечения значений по первичному ключу. Механизм заменяет field cache — структуру в памяти, выполняющую аналогичную функцию. Использование doc values позволяет уменьшить потребление памяти процессом Elasticsearch и лучше использовать функции кеширования диска операционной системой. До оптимизации хранилище заметно уступало по производительности field cache.
- Query cache — кеш результатов аналитических запросов, сохраняющий результаты выборок при отсутствии изменений. Кеш рекомендуется использовать в задачах анализа журналов в сочетании с партиционированием индексов по дате события. В этом случае финальный результат запроса будет получен комбинацией кешированных результатов из исторических партиций и выполненного запроса по свежей секции в которую идет запись.
- Flake ID — новый алгоритм генерации идентификаторов документов, который снижает количество случайного ввода-вывода (оптимизация добавления в индекс документов без заданного пользователем идентификатора).
- Эффективная поддержка HTTP Pipelining в пользовательском API
>>> Подробности