Подскажите, пожалуйста, оптимальное решение следующей задачи. Есть приложение на google app engine (ЯП - python), которое принимает входящую электронную почту. Задача отфильтровать спам. В принципе, я нашел хороший байесовский классификатор http://spambayes.org/, который вроде работает, написан на чистом питоне и написать бекенд, хранящий базу в гугловском датасторе довольно просто. Но весь вопрос в том, что база пустая, и как ее учить с нуля - вопрос сложный. Где можно найти хорошую начальную спамовскую баесовскую базу?
Если кто может предложить лучшее решение задачи другим способом - буду очень благодарен.