LINUX.ORG.RU
ФорумTalks

Как вам такая идея?


0

0

Почти каждый день я посещаю определённый набор сайтов с интересующей меня информацией, т.е. читаю новости, lorquotes, узнаю погоду, смотрю курсы акций и т.п. Думаю, это дело обыденно многим.
Идея заключается в упрощении доступа к этой информации путём генерации одной комплексной страницы из выбранного контента разных страниц.
Т.е. я предварительно выделяю на странице интересующую меня область, после чего система сама фильтрует контент и оставляет только то, что мне интересно.
В результате это напоминает страницу iGoogle, но даёт больше свободы: выбирать информацию с любого сайта.
Механизм выборки произвольной информации со страницы пока неясен, это тема для исследования.
Кто-нибудь встречал уже готовые решения таких задач?

★★

Тоже была такая идея, только в виде небольшой программки в трее и набора плагинов для разных сайтов... Полезная вещь бы была

Dolfer
()
Ответ на: комментарий от Dolfer

Для парсинга ибаша можно юзать такой регэксп --

#!/bin/sh
wget -q ibash.org.ru

cat index.html | grep quotbody | head -n $1| sed 's/\n/\n\n/g;s/\<div//g;s/\<\/div\>/\n\n/g;s/<//g;s/>//g;s/class//g;s/=//g;s/"q uotbody"//g;s/\///g;s/br/\n/g;s/\&lt;/\</g;s/\&gt;/\>/g;s/\&quot;/\"/g;s/;/\"/g; s/\t\t /\n/g'

rm index.html

anonymous
()
Ответ на: комментарий от Dolfer

Для парсинга ибаша можно юзать такой регэксп --

#!/bin/sh
wget -q ibash.org.ru

cat index.html | grep quotbody | head -n $1| sed 's/\n/\n\n/g;s/\<div//g;s/\<\/div\>/\n\n/g;s/<//g;s/>//g;s/class//g;s/=//g;s/"q uotbody"//g;s/\///g;s/br/\n/g;s/\&lt;/\</g;s/\&gt;/\>/g;s/\&quot;/\"/g;s/;/\"/g; s/\t\t /\n/g'

rm index.html

anonymous
()

Ага и будет смесь погоды, новостей и лора:

Синоптики обещают завтра ... американский спецназ в эстонии ... так что одевайтесь теплее и берите ... новая версия сетевого средства безопасности Condom ... (ну и немного контекствной порнухи от гугля).

wfrr ★★☆
()
Ответ на: комментарий от mono

>Парсить RSS и выстраивать страничку

Работать через RSS - это вариант, но Он есть не всегда + не всегда приходит то что я хочу видеть. К примеру, я выбираю на странице всего одно число - текущий курс акций, и больше ничего не хочу видеть на комплексной странице от этого сайта.

+ Эта задача меня привлекает вопросом реализации механизма выборки произвольного контента со страницы. Кстати, интерфейс выборки можно сделать аналогичным анализатору FireBug, кто использовал его.

>в виде небольшой программки в трее и набора плагинов для разных сайтов...

Можно поподробнее? Я себе это больше представляю в виде плагина для FireFox.

Vitel ★★
() автор топика

интересная идея, сам задумывался. RSS в пролёте - каналы есть далеко не везде. Только wget + набор плагинов для каждого сайта + простенький демон.

jcd ★★★★★
()
Ответ на: комментарий от jcd

>Только wget + набор плагинов для каждого сайта

только лучше не режекспами парсить а написать\найти нечно вроде xpath для html, это быстрее и проще.

wfrr ★★☆
()

> Кто-нибудь встречал уже готовые решения таких задач?

В Леопарде можно выделить мышкой произвольный кусок web-страницы и превратить его в виджет с помещением в dashboard. Соответственно, по нажатию F12 будете видеть все свои нарезки в режиме реального времени.

Relan ★★★★★
()

Воообще задача интересная, можно написать )

Стучись если что в аську - сделаем из этого красивый проект ))

vahvarh ★★★
()

Вот такая же идея у меня как-то возникла... Осилить не смог. Пока остановился на том же iGoogle + GoogleReader. Если появятся какие наработки, с удовольствием бы посмотрел, да и поучавствовал в решении по мере сил.

anonymous
()
Ответ на: комментарий от anonymous

На базе xulrunner наверняка за полчаса, но кому оно такое нужно? *)

wfrr ★★☆
()

>Механизм выборки произвольной информации со страницы пока неясен, это тема для исследования.

XPath </thread>

anonymous
()

>> puts Hpricot(open("http://www.linux.org.ru/group.jsp?group=8404")).search("//a[@rev='contents']/")[0..9]
lorquotes.ru - Цитатник LOR
Инвайты
Talks
портирование SMath
Студенту за размещение в торренте компьютерной игры дали два года условно
Куда отиметь Linux шоб он быстрее грузился!
[ЖЖ] И они кричат о переводе на опенофис
Как вам такая идея?
[опрос] Какую воду вы пьёте?
[Новосибирск][Семинар] Семирар по СПО и Linux в Новосибирске
==> nil


не?

volh ★★
()
Ответ на: комментарий от wfrr

Всем спасибо за советы

Кто хочет присоединиться к разработке - приветствую, мои координаты:
jabber: vitel@jabber.ru
icq: 286895364

Vitel ★★
() автор топика
Ответ на: комментарий от Vitel

>Кстати, интерфейс выборки можно сделать аналогичным анализатору FireBug, кто использовал его.

ну вот да, там как раз "copy to xpath" есть.

volh ★★
()

> Механизм выборки произвольной информации со страницы пока неясен, это тема для исследования.

BeautifulSoup?

anonymous
()
Ответ на: комментарий от Vitel

до массового внедрения микроформатов все попытки сделать это будут костылем - слегка поменялась верстка, и регекспы можно выбрасывать

anonymous
()
Ответ на: комментарий от anonymous

>до массового внедрения SPARQL

fixed. микроформаты - тоже костыль. насчет регекспов уже сказали - xpath. а верстка должна быть семантической, тогда многих проблем можно избежать с самого начала.

volh ★★
()

1. Похапе.
2. Поднимаешь сервант.
3. Раскручиваешься.
4. Продаешь рекламные места.
5. ?????
6. PROFIT!

iiizxc
()

Вчера бухал, седня здовать бутыльки, завтро опять бухать после опять здавать бутыльки... все,переезжаю в вино-водочный! Как вам такая идея?

ihl
()
Ответ на: комментарий от Komintern

я так делал посылалку смс для нескольких операторов на одной старнице

lazyklimm ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.