13 ноября, после более года разработки, состоялся выпуск 2.4.0 высокопроизводительной библиотеки парсинга HTML5 и CSS lexbor, написанной на языке C без сторонних зависимостей, и распространяемой по лицензии Apache 2.0.
Библиотека разделена на модули (Core, CSS, DOM, Encoding, HTML, NS, Punycode, Selectors, Tag, Unicode, URL, Utils), которые могут быть скомпилированы и использованы раздельно (с опцией CMake LEXBOR_BUILD_SEPARATELY=ON
).
Для библиотеки есть сторонние биндинги и врапперы для языков Elixir, Crystal, Python, D, Ruby и PHP.
Список изменений:
- Core: увеличена производительность с помощью SWAR (
packed SIMD
); - URL: добавлен API для изменения объекта URL;
- URL: добавлена возможность клонирования url;
- URL: удаление новых строк и табуляции перед парсингом;
- Encoding: обновлён индекс
GB18030-2022
; - Encoding: уменьшен размер статических данных;
- URL: увеличение производительности;
- исправления ошибок и улучшения тестов.
>>> Сайт проекта
>>> Документация
>>> Исходный код
Автор библиотеки, Александр Борисов, ранее работал в NGINX, и участвовал в разработке JavaScript-движка NJS:
-- $ git-summary
authors :
1575 Dmitry Volyntsev 64.2%
313 Igor Sysoev 12.8%
156 Alexander Borisov 6.4%
108 hongzhidao 4.4%
>>> Подробности