LINUX.ORG.RU

[python]фильтрация спама на GAE

 


0

1

Подскажите, пожалуйста, оптимальное решение следующей задачи. Есть приложение на google app engine (ЯП - python), которое принимает входящую электронную почту. Задача отфильтровать спам. В принципе, я нашел хороший байесовский классификатор http://spambayes.org/, который вроде работает, написан на чистом питоне и написать бекенд, хранящий базу в гугловском датасторе довольно просто. Но весь вопрос в том, что база пустая, и как ее учить с нуля - вопрос сложный. Где можно найти хорошую начальную спамовскую баесовскую базу?

Если кто может предложить лучшее решение задачи другим способом - буду очень благодарен.

★★★★★

Ответ на: комментарий от provaton

я повторюсь, я не в теме, но разве нельзя ее через гмаил гнать? без этой штуки, с гмаилом работать?

trashymichael ★★★
()

Где можно найти хорошую начальную спамовскую баесовскую базу?

Нигде. База от другого пользователя работать у тебя не будет. Обучайся на своих письмах.

Vovka-Korovka ★★★★★
()
Ответ на: комментарий от Vovka-Korovka

База от другого пользователя работать у тебя не будет

Ну тот же гмейл же как-то сразу начинает спам фильтровать без обучения.

provaton ★★★★★
() автор топика
Ответ на: комментарий от provaton

Ну тот же гмейл же как-то сразу начинает спам фильтровать без обучения.

Кэп намекает, что существуют не только баесовские фильтры.

Vovka-Korovka ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.