Велосипед для парсинга статичного HTML-контента

0

0

Имеется в наличии раздел "файлы", свёрстанный вручную, и задача перегнать всё это в базу данных. Раздел достаточно большой, и вбивать данные вручную недопустимо. Вопрос: есть ли какой-либо софт для такой задачи? Не хочется изобретать велосипед.

Ссылка

←	Perl DBI mysql_auto_reconnect, переменные сбрасываются при переподключении

С++ gcc ссылка на массив

→

Я не понял, зачем тебе HTML-parser ? Ты хочешь загнать в базу какие-то части файлов ?

golodranez ★★★★
(24.07.06 04:34:36 MSD)

Ссылка

ИМХО можно распарсить например этим http://www.cliki.net/pxmlutils и либо перевести в список строк, который легко сувается в бд скриптом на баше, либо сразу оттуда...

~~bugmaker~~ ★★★★☆
(24.07.06 05:57:32 MSD)

HTML::TreeBuilder

anonymous
(24.07.06 10:13:53 MSD)

Ссылка

Ответ на: комментарий от bugmaker 24.07.06 05:57:32 MSD

Ы... Я когда пробовал подобное решить, то уперся в то, что парсить SGML (который не XML) практически нечем.

shimon ★★★★★
(24.07.06 19:37:39 MSD)

Ссылка

Существует в мире такое извращение, как http://search.cpan.org/~autrijus/Template-Extract-0.40/

Если Perl-ом и TT2 владеешь - самое то; если нет - то тоже, в общем-то, можно попробовать заюзать...

anonymous
(24.07.06 22:25:05 MSD)

Ссылка

1. OOo Calc: Вставка->ссылка на внешние данные
2. OOo Base: Создать базу из Calc таблицы можно в мастере.
А из Base можно попробовать скопировать таблички в mysql :)

cobold ★★★★★
(25.07.06 01:30:35 MSD)

Ответ на: комментарий от cobold 25.07.06 01:30:35 MSD

Сюрприз: Calc умеет сохранять в CSV, а MySQL - читать.

anonymous
(26.07.06 13:21:24 MSD)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Perl DBI mysql_auto_reconnect, переменные сбрасываются при переподключении

Development

С++ gcc ссылка на массив

→

Похожие темы