LINUX.ORG.RU

Ответ на: комментарий от fernik

Да вроде как не всегда:

... performs significantly worse for documents with higher proportions of text.

Vond ★★
()
Ответ на: комментарий от anonymous

Sablotron вообще-то xslt процессор.

chucha ★★★☆
() автор топика

Забыли скорость основного парсера для XML проверить - человека и сравнить со скоростью парсенья plain текста.

Evgueni ★★★★★
()
Ответ на: комментарий от kagor

как-то странно, что такое Perl ты не спрашиваешь, а что такое парсер спрашиваешь :)

парсер - это библиотека или программа, переводящая или помогающая перевести один формат данных в другой. Примером формата данных может быть INI, XML, а так же внутреннее представление данных в программе. Обычно парсеры пишутся с помощью регулярных выражений || лексических || синтаксических анализаторов. То, как авторы парсера смогут распорядится этими средствами и влияет в итоге на скорость работы программы.

В данном контексте рассматривались парсеры, имеющие возможность использоваться в Perl, и дающие функционал разгреба XML.

зачем я все это написал ? наверно хочу паскарей домой :)

stroganoff
()

Заголовок-то говенный. Не просто XML парсеры, а именно с помощью SAX2.

anonymous
()
Ответ на: комментарий от stroganoff

Это не странно, Перл не парсер, а ИНТЕРПРЕТАТОР, 
Я считаю, что он задал корректный вопрос.

ManJak ★★★★★
()

Ктоб сделал НЕ КРИВУЮ поддержку FB2! =)))
Енто респект!
Нето, поддержка есть, а иллюстраций НЕТ!
Не показывает =(

ManJak ★★★★★
()
Ответ на: комментарий от stroganoff

>парсер - это библиотека или программа, переводящая или помогающая перевести один формат данных в другой

сторого говоря, парсер - синтаксический анализатор.

derevo
()
Ответ на: комментарий от kagor

> Народ извените за глупый вопрос, но что такое парсер.

Это процедура, разбирающая некоторое представление данных (xml, mail, html, config, etc) на примитивные составные части, в удобном для использования виде (массив, хэш, список, структура и т.д.).

anonymous
()
Ответ на: комментарий от anonymous

>> Народ извените за глупый вопрос, но что такое парсер.

>Это процедура, разбирающая некоторое представление данных (xml, mail, html, config, etc) на примитивные составные части, в удобном для использования виде (массив, хэш, список, структура и т.д.).

Ерунду порите, это работа лексера (лексического анализатора).
Парсер же предназначен для перевода _структуры_ документа в удобоваримое для программы представление (обычно дерево).

anonymous
()
Ответ на: комментарий от fernik

Вообще-то expat самый МЕДЛЕННЫЙ
PARS 129%
EXPXS 169%
XERC 186%
LXML 202%
LXMLP 393%
EXP 695%
The average proportional time in the last column has no universal relevance as it strongly depends on the selection of documents. This is simply a way to express how the parsers have performed in this test with a single number, but don't take it too seriously, please.

NonHuman ★★★
()
Ответ на: комментарий от ManJak

Если не на перле то посмотри pybookreader.narod.ru. Там есть скрипт, который и иллюстрации вытаскивает.

anonymous
()

Немного Offtop.

А ни у кого нет что--то типа сабжа, но для C/C++. Какой сейчас парсер в основном используют???

anonymous
()
Ответ на: комментарий от NonHuman

> Вообще-то expat самый МЕДЛЕННЫЙ

Читать надо внимательнее: expat в тесте обозначен как PARS, а не EXP

Vond ★★
()
Ответ на: комментарий от anonymous

>А ни у кого нет что--то типа сабжа, но для C/C++.
>Какой сейчас парсер в основном используют???

msxml :)
xerces-c, тот же expat.

anonymous
()
Ответ на: комментарий от anonymous

>>> Народ извените за глупый вопрос, но что такое парсер.

>> Это процедура, разбирающая некоторое представление данных (xml, mail, html, config, etc) на примитивные составные части, в удобном для использования виде (массив, хэш, список, структура и т.д.).

> Ерунду порите, это работа лексера (лексического анализатора). Парсер же предназначен для перевода _структуры_ документа в удобоваримое для программы представление (обычно дерево).

Имею удовольствие несогласиться. Лексический анализатор производит разбор по категориям и ассоциациям. Парсер же поизводит разделение структуры (некоторое представление данных) на примитивы, действительно, "в удобоваримое для программы представление", но без анализа лексических связей примитивов, просто, на компоненты. А "дерево" не всегда удобно.

anonymous
()
Ответ на: комментарий от anonymous

parser - синтаксический анализатор

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.