LINUX.ORG.RU
ФорумAdmin

score BAYES_??


0

0

подскажите пожалста, КАК ОН РАБОТАЕТ !?

собственно вопрос -фигня : -как spamd выбирает какой score BAYES_00..99 назначить письму?,..и почему 4 поля (score BAYES_99 0 0 3.5 3.5), и чё они означают?

- и чё означают поля в "sa-learn --dump magic"? (на man-странице и spamassassin.org конкретно этого ненашел)


ну если грубо

ломаем письмо на слова. у каждого слова есть некий вес в базе данных (которую обучаем скармливая ей письма через sa-learn. чем больше раз слово попало в спам-базу, тем больше у него спам-вес. для хам -- тоже самое)

потом неким хитрым образом подбиваем бабки, типа чем больше слов с отрицательной кармой, тем вероятнее это спам. вот эта вероятность в диапазоне [.00:.99] и есть байесовская оценка

четыре поля -- это если мне не изменяет склероз оценка вероятности спама в разных контекстах (содержимое письма, содержимое заголовка, ну и еще чего там разработчики придумали)

совет

выкинь это спамассассин в жопу ибо глюкалово и перловый сакс. а возьми ты лучше хороший dspam

anonymous
()
Ответ на: комментарий от anonymous

>выкинь это спамассассин в жопу ибо глюкалово и перловый сакс. а возьми ты лучше хороший dspam

>вы наверное его просто готовить не умеете

)) спасибо за совет, я вобщем то ни.. готовить пока толком не умею, да и нехочу если честно, хочу сразу взять уже готовое, мне в этом плане SA сначала понравился, - ставишь и настройки поумолчанию сразуже отшибают 80% спама, ..но вот когда дело дошло до обучения баеса ... вощем пока Он меня обучает, а не я его :( , хотя он после sa-learn добавляет баллы к спам-письмам, но следующий раз всеравно пропускает это же письмо в нормальную почту и при этом приписывает что это спам

X-Spam-Level: ***** X-Spam-Status: Yes, score=5.1 required=4.1 tests=BAYES_99

вот этого фокуса я непонял, можт кто знает? - поделитесь секретом

flat
() автор топика
Ответ на: комментарий от flat

во первых, sa-learn надо делать не только для спама, но и для нормальной почты! то есть обучать как ham , а иначе смысла нет.

во вторых, поиграйтесь с score правил. в документации SA написано, что лучше письмо пройдет по 2-м (или более правилам) с меньшими score, чем по одному но с большим. показанный вами пример именно это и демонстрирует.

anonymous
()
Ответ на: комментарий от anonymous

>..вами пример именно это и демонстрирует.

пример деМОНСТРирует что письмо превысило допустимый предел и по логике должно было попасть в спам,( spamass-milter ... -b spam@box.ru) но попало всетаки в ящик пользователя.

//а может кто знает где взять русский мануал или книжку на эту тему ? - я не очень силен в оригинале переваривать (типа more then less for better worth :-0) - в общих чертах кон. понятно, но все эти "тонкости" - это всего лишь недомолвки в мануале,- нечестно получается (это как играть незная правила игры)

flat
() автор топика
Ответ на: комментарий от flat

> X-Spam-Status: Yes

...

> пример деМОНСТРирует что письмо превысило допустимый предел и по логике должно было попасть в спам (spamass-milter) но попало всетаки в ящик пользователя.

1) так, а причем тут тогда SA если он свое дело сделал, то есть выставил вам флаги верно, а то что у вас следующий за ним компонент это письмо пропустил в inbox пользователю, это уже не SA виноват.

2) книжек о SA на русском я не видел, да и сомневаюсь что они нормальные будут. Пытайтесь все-таки читать оригинал на английском, заодно и язык подтяните.

anonymous
()
Ответ на: комментарий от anonymous

> 2) книжек о SA на русском я не видел, да и сомневаюсь что они нормальные будут.

один из минусов спамассассина -- безобразная документация в сети

вроде есть какая-то бумажная книжка, ОРейлевская что ли, там вот как будто все по уму написано. но на русский она конечно не переведена

впрочем, я его глядел года три-четыре назад, может быть сейчас что-то изменилось в лучшую сторону

anonymous
()
Ответ на: комментарий от anonymous

согласен, но есть и неопределившийся спам, (хотя и обученный как спам)

вопрос- при пересылке письма в спам-ящик (из которого учится баес) сколько же очков добавляется письму? по количеству очков после пройденных тестов?, или однозначно score BAYES_99 ?

score BAYES_00 0 0 -2.312 -2.599

score BAYES_05 0 0 -1.110 -1.110

score BAYES_20 0 0 -0.740 -0.740

score BAYES_40 0 0 -0.185 -0.185

score BAYES_50 0 0 0.001 0.001

score BAYES_60 0 0 1.0 1.0

score BAYES_80 0 0 2.0 2.0

score BAYES_95 0 0 3.0 3.0

score BAYES_99 0 0 3.5 3.5

вот ЭТОГО Я КАК РАЗ И НЕНАЙДУ, так что буду очень благодарен за ответ

flat
() автор топика
Ответ на: комментарий от anonymous

> один из минусов спамассассина -- безобразная документация в сети

дауж, вобще странно - "самый популярный..самый эфективный..самый самый sa", - и нет конкретной инфы как работает его баес.. одна вода

flat
() автор топика
Ответ на: комментарий от flat

> и нет конкретной инфы как работает его баес...

так bayes алгоритм везде одинаковый! ;)
немного отличаются только реализации.
далее читать
- http://wiki.apache.org/spamassassin/BayesAccuracy
- man Mail::SpamAssassin::Bayes
- man sa-learn ( раздел INTRODUCTION TO BAYESIAN FILTERING )

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.