LINUX.ORG.RU

Можно посмотреть на HTML::FormatText - форматмрует HTML как plain text.

Потом можно глянуть HTML::Scrubber - он удаляет только "опасные" тэги, таким образом все же разрешая использовать HTML форматирования.

Ну и конечно - HTML::Parser как универсальное средство :-)

Да, и не надо придумывать свой regular expression...

Если хочешь почитать мегатонны дискуссий на эту тему, добро пожаловать в comp.lang.perl.misc, можно поиском через groups.google.com.

HTH

anonymous
()

$text =~ s/<.*?>//gi;

И нет тебе никаких тэгов.

anonymous
()
Ответ на: комментарий от lg

вот это наиболее правильно, "вырезать все не закрывающие символы тегов между открывающим и закрывающим". Хотя HTML::Parser в некотором конечно лучше. Но это проще и быстрее.

vilfred ☆☆
()
Ответ на: комментарий от vilfred

>$txt=s/<[^>]*?>//igs;

символ вопроса после звездочки совершенно лишнее и ненужное.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.