13 ноября, после более года разработки, состоялся выпуск 2.4.0 высокопроизводительной библиотеки парсинга HTML5 и CSS lexbor, написанной на языке C без сторонних зависимостей, и распространяемой по лицензии Apache 2.0.
Библиотека разделена на модули (Core, CSS, DOM, Encoding, HTML, NS, Punycode, Selectors, Tag, Unicode, URL, Utils), которые могут быть скомпилированы и использованы раздельно (с опцией CMake LEXBOR_BUILD_SEPARATELY=ON
).
Для библиотеки есть сторонние биндинги и врапперы для языков Elixir, Crystal, Python, D, Ruby и PHP.
Список изменений:
- Core: увеличена производительность с помощью SWAR (
packed SIMD
); - URL: добавлен API для изменения объекта URL;
- URL: добавлена возможность клонирования url;
- URL: удаление новых строк и табуляции перед парсингом;
- Encoding: обновлён индекс
GB18030-2022
; - Encoding: уменьшен размер статических данных;
- URL: увеличение производительности;
- исправления ошибок и улучшения тестов.
>>> Сайт проекта
>>> Документация
>>> Исходный код
>>> Подробности