1. Есть столбцы с содержимым
/html/body/div/a=Темы по интересам.
/html/body/div/span=(+34)
sed 's/\///g'
2. После выполнения скрипта получаю такое содержимое:
htmlbodydiva=Вопросы - ответы.
htmlbodydivspan=(+34)
htmlbodydiva=Неофициальные помощники сайта.
htmlbodydivspan=(+25)
htmlbodydiva=Архив
htmlbodydivspan=(>100)
Вопросы - ответы.
(+34)
Неофициальные помощники сайта
(+25)
Скрипт:
#! /bin/bash
# -*- coding: utf-8 -*-#
wget -qO- --load-cookies=/tmp/cookies.txt "http://бла-бла" |
grep -o '<div class="even">.*</div>' | html2 | iconv -t latin1 | grep -B6 'span=(.*)' |
grep 'a=\|span=(' | sed 's/\///g'
Получаю:
htmlbodydiva=Вопросы - ответы.
htmlbodydivspan=(+34)
htmlbodydiva=Неофициальные помощники сайта.
htmlbodydivspan=(+25)
htmlbodydiva=Архив
htmlbodydivspan=(>100)