LINUX.ORG.RU

Велосипед для парсинга статичного HTML-контента


0

0

Имеется в наличии раздел "файлы", свёрстанный вручную, и задача перегнать всё это в базу данных. Раздел достаточно большой, и вбивать данные вручную недопустимо. Вопрос: есть ли какой-либо софт для такой задачи? Не хочется изобретать велосипед.

Я не понял, зачем тебе HTML-parser ? Ты хочешь загнать в базу какие-то части файлов ?

golodranez ★★★★
()

HTML::TreeBuilder

anonymous
()
Ответ на: комментарий от bugmaker

Ы... Я когда пробовал подобное решить, то уперся в то, что парсить SGML (который не XML) практически нечем.

shimon ★★★★★
()

Существует в мире такое извращение, как http://search.cpan.org/~autrijus/Template-Extract-0.40/

Если Perl-ом и TT2 владеешь - самое то; если нет - то тоже, в общем-то, можно попробовать заюзать...

anonymous
()

1. OOo Calc: Вставка->ссылка на внешние данные
2. OOo Base: Создать базу из Calc таблицы можно в мастере.
А из Base можно попробовать скопировать таблички в mysql :)

cobold ★★★★★
()
Ответ на: комментарий от cobold

Сюрприз: Calc умеет сохранять в CSV, а MySQL - читать.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.