добрый день
наборосал скрипт, в первом приближении работает, чистит, вроде как, то, что надо ... :о)
посмотрите, какие могут быть подводные камни или что нужно подзакрутить в «настройках» скрипта?
скрипт для локального использования, обработка сохраненных страниц и последующего просмотра/чтива
спасибо за пендили :о)
#!/usr/bin/perl
use strict;
use HTML::Laundry;
my $file ;
my $laundry ;
my $html ;
my $html_clr;
$file = shift or die "need a file $!\n";
open (FH,"< $file" );
read (FH, $html, -s FH);
close FH;
$laundry = HTML::Laundry->new();
$laundry->add_acceptable_element(['img','h1','h2','style','stylesheet','href',
'link','html','head','body','meta','title','div','span');
#
# <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
#
$laundry->add_acceptable_attribute(['http-equiv','content','charset']);
$html_clr = $laundry->clean($html);
open (OH, '>', $file);
print OH $html_clr ;
close OH;
exit;
p.s. в модуле есть возможность использовать base_url, для более тонкой настройки, руки не дошли дотошно потестировать...