LINUX.ORG.RU
ФорумTalks

Свой новостной опенсорсный агрегатор бывает ли

 


0

2

Речь не о RSS, а примерно хотя бы о части функционале Яндекс Новости, но под полностью своим контролем на своем сервере. Чтобы я сам включал сайты, где ищутся новости, сам задавал какие из них какой ранг имеют и т.д

Такой агрегатор должен много чего уметь, в том числе парсить сайты (те которые rss и другие публичные апи не дают или многого хотят).

Есть ли что такое пригодное хотя бы частично?

★★★★★

Такой агрегатор должен много чего уметь

Есть ли что такое пригодное хотя бы частично?

А ты немного захотел?) Это же не wordpress для говносайтов. А достаточно нишевый продукт. Пили свой.

th3m3 ★★★★★
()
Ответ на: комментарий от Valeg

Первое выглядит интереснее. Но похоже продукт действительно нишевый

praseodim ★★★★★
() автор топика

Что именно вас неустраивает в RSS-агрегаторе?

в том числе парсить сайты

Вероятней всего, парсер все равно придется писать самому. В случае RSS-агрегатора можно написать парсер, отдающий результаты в виде размещенного на localhost RSS-канала.

Leupold_cat ★★★★★
()
Последнее исправление: Leupold_cat (всего исправлений: 1)
Ответ на: комментарий от Leupold_cat

Что именно вас неустраивает в RSS-агрегаторе?

То, что не все сайты его отдают. Да, универсального парсера скорее всего быть не может. Но могут быть настраиваемые шаблоны, годящиеся для большинства сайтов.

Ну и парсер для того новостного агрегатора, что мне хочется - это даже не полдела, а 1/10 дела, нужно чтобы еще мог вести поиск среди новостей, в идеале вообще смысловой поиск, используя синонимы, а также с использованием байесовского или какого-то другого фильтра делал бы примерную классификацию новостей по темам. Естественно, пришлось бы обучить на каких-то примерах, если нужны свои темы. Ну или хотя бы автоматически выделять типичные группы новостей по одному событию, потому что если например вышло новое ядро линукса, об этом очень многие напишут (среди линуксовых сайтов)

praseodim ★★★★★
() автор топика
Последнее исправление: praseodim (всего исправлений: 1)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.