История изменений
Исправление AEP, (текущая версия) :
Список слов, фраз, и прочего представимого регулярными выражениями зла можно получить из архива по ссылке, как уже было сказано.
По вопросу «считать ли это первоисточником» - ответ «нет». По большому счету, первоисточником является спам, но в спаме есть еще много хороших слов, поэтому еще нужен неспам, в котором хорошие слова есть, а плохих нет. Но корпус спама и неспама - это не «500-800 слов», которые вы ищете, а миллионы сырых писем.
Я утверждаю, что базы SpamAssassin - это наиболее близкая к первоисточнику, из бесплатно доступных, вручную созданная выжимка спам-слов и фраз, на которую уже ориентируются почтовики.
По вопросу «все ли почтовики берут это за основу» - ответ однозначно «нет».
Исходная версия AEP, :
Список слов, фраз, и прочего представимого регулярными выражениями зла можно получить из архива по ссылке, как уже было сказано.
По вопросу «считать ли это первоисточником» - ответ «нет». По большому счету, первоисточником является спам, но в спаме есть еще много хороших слов, поэтому еще нужен неспам, в котором хорошие слова есть, а плохих нет. Но корпус спама и неспама - это не «500-800 слов», которые вы ищете, а миллионы сырых писем.
Я утверждаю, что базы SpamAssassin - это наиболее близкая к первоисточнику, из бесплатно доступных, выжимка спам-слов и фраз, на которую уже ориентируются почтовики.
По вопросу «все ли почтовики берут это за основу» - ответ однозначно «нет».