LINUX.ORG.RU

LORgate - mail-гейт для форумов LOR


0

0

Собственно, сабж =) Как и обещалось в Talks, релиз первой альфа-бета-пре-тест версии - используйте на свой страх и риск.

Качать здесь: http://www.webfile.ru/213284

Прежде чем в меня полетят помидоры, сразу покаюсь:

- оно тормозное

- исходники просто кошмарны

- есть масса мелких глюков и недочетов

Основные причины - писалось это чудо на коленке, по принципу "лишь бы работало", так как тратить много своего времени на такое не хотелось. В свое оправдание: в перспективе есть планы переписать это дело по-нормальному, с полноценным парсингом HTML и прочими делами. Но это еще не скоро... а пока - enjoy =)

Кстати, модераторов прошу обратить внимание на ссылку для удаления, автоматически добавляемую в конец каждого сообщения. Надеюсь, это нехитрое приспособление повысит КПД тех из вас, кто рискнет им воспользоваться ;)

>>> Просмотр (1152x864, 168 Kb)

★★★★

Проверено: Shaman007 ()

> с полноценным парсингом HTML

А не проще бы было веб-мастеру(ам) экспорт в XML делать ?

anonymous
()
Ответ на: комментарий от anonymous

> А не проще бы было веб-мастеру(ам) экспорт в XML делать ?

Вообще - проще. Но надежда слабая.

int19h ★★★★
() автор топика
Ответ на: комментарий от int19h

добавляю новый аккаунт в evolution, какой тип сервера выбрать?

если выбрать Maildir-format, то в Inbox одни пустые папки :(

JB ★★★★★
()

респект! будем заценивать и надеяться на продолжение банкета ;)

uj2 ★★★
()
Ответ на: комментарий от JB

> добавляю новый аккаунт в evolution, какой тип сервера выбрать? если выбрать Maildir-format, то в Inbox одни пустые папки :(

А ты уже сделал fetch?

Если да, то почитай внимательно комментарии в конфиге - там написано, что надо сделать для bincimap, а что - для Evolution (кстати, никто не мешает использовать их в связке - я именно так и делаю). По умолчанию там настроено под bincimap. Если конкретно - убери начальные точки из имен каталогов.

int19h ★★★★
() автор топика
Ответ на: комментарий от int19h

>Но надежда слабая.

Всё лежит в постгресе, сам сайт на JSP, там вобще часа три посидеть и можно всё экспортуть

anonymous
()
Ответ на: комментарий от anonymous

> Всё лежит в постгресе, сам сайт на JSP, там вобще часа три посидеть и можно всё экспортуть

Да все можно... только вот все равно вряд ли будет. Исходники не дают, а сами все занятые =(

int19h ★★★★
() автор топика
Ответ на: комментарий от int19h

> Если конкретно - убери начальные точки из имен каталогов.

точки убрал и снова запустил fetchlor

и сразу возник вопрос, в этом скрипт случайно парсит не _весь_ форум начиная с 1999 года?

а то у меня с этими точками в конфиге fetch проходит за минуту, а без них уже 5 минут и конца этому не видно :)

JB ★★★★★
()
Ответ на: комментарий от anonymous

> Хех, а как-же ГПЛ ?

А где ты здесь видел GPL?

int19h ★★★★
() автор топика
Ответ на: комментарий от anonymous

>Хех, а как-же ГПЛ ? Или там дыряво/криво всё настолько ?

На счёт дыряво не знаю, но криво это без сомнения. Жутко неудобное ушлёпище. Лучше бы уж Drupal какой взяли, честное слово.

dsx
()
Ответ на: комментарий от JB

> и сразу возник вопрос, в этом скрипт случайно парсит не _весь_ форум начиная с 1999 года?

Нет, только последние 30 тредов в каждом форуме (включая новостные группы) =)

> а то у меня с этими точками в конфиге fetch проходит за минуту, а без них уже 5 минут и конца этому не видно :)

С точками он проходит за 5 минут, потому что ты его уже один раз выкачал. Дальше качаются только новые сообщения. А так ты в конфиге пути поправил, он теперь выкачанных им раньше сообщений не видит, и качает все по новой.

Да, в первый раз качает долго. Я предупредил - тормозное оно =)

int19h ★★★★
() автор топика
Ответ на: комментарий от anonymous

> А с Kmail можно использовать?

По идее можно использовать со всем, что понимает Maildir (или же, через bincimap - IMAP), и восьмибитные заголовки писем. Попробуй - расскажешь =)

int19h ★★★★
() автор топика
Ответ на: комментарий от int19h

прошло уже 20-25 минут, все еще парсится )))

у меня даже при самом первом запуске так долго не парсилось

JB ★★★★★
()
Ответ на: комментарий от JB

> прошло уже 20-25 минут, все еще парсится )))

У тебя часом не ext3? ;)

Там же maildir - для каждого сообщения по файлу. ~20 форумов. 30 тредов из каждого - это уже 600 HTTP-запросов, так что учитывай и скорость соединения. В треде - от 5 до 500 =) мессаг. Дальше считай сам...

И еще, ты max_threads не выставил больше 30 случайно?

int19h ★★★★
() автор топика
Ответ на: комментарий от int19h

> У тебя часом не ext3? ;)

reiserfs

> И еще, ты max_threads не выставил больше 30 случайно?

неа, оставил 30

просто интересно, если точки перед папками в конфиге не убирать, то парсится очень быстро

специально проверил, запустил отдельно еще одну копию с дефолтным конфигом, за 2 минуты прошло

JB ★★★★★
()
Ответ на: комментарий от JB

> просто интересно, если точки перед папками в конфиге не убирать, то парсится очень быстро

> специально проверил, запустил отдельно еще одну копию с дефолтным конфигом, за 2 минуты прошло

Маразм 8|

А ты можешь посмотреть общий размер папок с точками?

int19h ★★★★
() автор топика
Ответ на: комментарий от dsx

> На счёт дыряво не знаю, но криво это без сомнения. Жутко неудобное ушлёпище. Лучше бы уж Drupal какой взяли, честное слово.

гон, ЛОР - лучший движок!

anonymous
()
Ответ на: комментарий от int19h

А у меня вообще ничего не качает, только создает иерархию директорий.

anonymous
()
Ответ на: комментарий от AP

> Оффтопик: какой шрифт используется для отображения текста писем в Evo?

Terminus 14pt

int19h ★★★★
() автор топика
Ответ на: комментарий от JB

> 97 метров :\

Странно, он и правда все выкачал... не знаю даже =) вроде ему совершенно пофиг, есть там точки или нет. Может это какие незадокументированные фичи reiserfs? ;)

int19h ★★★★
() автор топика
Ответ на: комментарий от int19h

ну и ладно ;)

сейчас буду пробовать связку evolution + bincimap

JB ★★★★★
()

Маэстро! А когда будет выпущен гкреллм для ЛОРА и когда тут наконец сделают тени и прозрачность ?

anonymous
()
Ответ на: комментарий от anonymous

Наверно только после перехода на XML... :)

sin_a ★★★★★
()
Ответ на: комментарий от int19h

Для товарищей типа меня, которые пользуются связкой Exim(Sendmail и пр.) + Amavisd + Opera предлагаю применить на fetchlor.py слудеющий diff-файл:

---cut---

23a24,25
> mail_to = "key@localhost"
> MAIL = "/usr/sbin/sendmail -bm -t"
34c36
< def scan_thread(dir, processed, thread_id):
---
> def scan_thread(subj_group, dir, processed, thread_id):
102a105
> msg.write("To: %s\n" % mail_to);
110c113
< msg.write("Subject: %s\n" % subj)
---
> msg.write("Subject: [linux.org.ru: %s] %s\n" % (subj_group, subj$
114a118,129
>
> f = open(new_msg_file, 'r')
> mssg = f.read()
> f.close()
>
> p = os.popen("%s -t" % MAIL, 'w')
> p.write(mssg)
> exitcode = p.close()
> if exitcode:
> print "Exim exit code: %s" % exitcode
> p = os.popen("rm %s" % new_msg_file)
>
118c133
< def scan_group(dir, group_id, offset=0):
---
> def scan_group(subj, dir, group_id, offset=0):
159c174
< scan_thread(dir, processed, thread_id)
---
> scan_thread(subj, dir, processed, thread_id)
173c188
< scan_group(dir, group_id, offset)
---
> scan_group(subj, dir, group_id, offset)
184c199
< scan_group(maildir + "/" + folder, str(group_id))
---
> scan_group(folder, maildir + "/" + folder, str(group_id))


---/cut---
В
mail_to = "key@localhost"
MAIL = "/usr/sbin/sendmail -bm -t"
пропишите ваш e-mail локальный/глобальный и ваш mail-agent с параметрами для потокового файлового режима. Далее в Opere создайте фильтры на subject'ы типа [linux.org.ru: Admin],
[linux.org.ru: Deveplopment] etc. Настройте в фильтрах показ в потоковом режиме (View -> Threaded). В fetchrc удалите точки (.) перед .Admin, .Development etc...
Ну а далее все просто:
./fetchlor.py

Если еще будет время - покурю доку по Exim'y и прикручу отправку сообщений.

ЗЫ: За Python'вский код не судите строго - я на нем сегодня впервые в жизни пишу... ;)

SteelKey
()
Ответ на: комментарий от SteelKey

Забыл! Большой РЕСПЕКТ int19h!!! Спасибо за отличную прогу ;).

SteelKey
()
Ответ на: комментарий от SteelKey

КХМ-КХМ... Господа а ньюс-сервера и ньюс-клиенты уже вроде как отменили ? Или если начнем рисовать костыли на яве рискуем свалить сервак ?

anonymous
()

за такое морду бить надо, парсят они панимаишь..

anonymous
()

Огромный Respect
Очень нужная вещь

Fedor ★★★
()
Ответ на: комментарий от anonymous

> Маэстро! А когда будет выпущен гкреллм для ЛОРА и когда тут наконец сделают тени и прозрачность ?

Как только LOR перепишут на OpenGL =)

int19h ★★★★
() автор топика
Ответ на: комментарий от anonymous

> КХМ-КХМ... Господа а ньюс-сервера и ньюс-клиенты уже вроде как отменили ? Или если начнем рисовать костыли на яве рискуем свалить сервак ?

Да кто ж нам даст эти костыли рисовать... я вообще-то очень даже не против, но дык исходников все нет.

int19h ★★★★
() автор топика

Пофиксенная версия:

http://www.webfile.ru/214030

Теперь в конец сообщения добавляются ссылки на само сообщение, а не на весь тред =) (спасибо Михаилу за неявный багрепорт).

int19h ★★★★
() автор топика
Ответ на: комментарий от int19h

> теперь большая часть постов будет содержать Now Playing ... :)
>А ты думал, зачем я его делал? =)
>int19h (*) (10.03.2005 17:19:25)
Обьясните шутку не просвещенному )))))

anonymous
()

int19 --- молодец. Как говорится: афтар, пиши исчо ;). Большое спасибо, в общем!

ugoday ★★★★★
()

int19h: респектище

geek ★★★
()
Ответ на: комментарий от anonymous

> Обьясните шутку не просвещенному )))))

Оно позволяет постить на лор через SMTP, т.е. любым почтовиком. А там обычно есть фича, позволяющая автоматом вставлять в письмо строку "Now Playing ..." =)

int19h ★★★★
() автор топика

молодец

Pi ★★★★★
()

Интересно как сильно траффик вырос на сервере лора. А то ить не шутка, если целиком все форумы и новости за 1998...2005 год выкачать.

anonymous
()
Ответ на: комментарий от anonymous

Типа такого.

--
np: Jimi Hendrix -- Are You Experienced? -- Manic Depression

anonymous
()
Ответ на: комментарий от anonymous

> Интересно как сильно траффик вырос на сервере лора. А то ить не шутка, если целиком все форумы и новости за 1998...2005 год выкачать.

никак: http://linuxhacker.ru/stats/eth0-usage.html

ivlad ★★★★★
()
Ответ на: комментарий от anonymous

> А то ить не шутка, если целиком все форумы и новости за 1998...2005 год выкачать.

По дефолту там стоит смотреть не более 30 последних сообщений в каждом форуме.

int19h ★★★★
() автор топика

молодец чувак! так держать, на таких как ты держится весь ИТ-ворлд имхо

anonymous
()

Помниться lg форум гнусом читал иль я че путаю? И без парсилок вроде всяких.

bdancer ★★
()
Ответ на: комментарий от anonymous

>гон, ЛОР - лучший движок!

Ага. Ага. Среди худших.

dsx
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.