LINUX.ORG.RU

История изменений

Исправление AEP, (текущая версия) :

Список слов, фраз, и прочего представимого регулярными выражениями зла можно получить из архива по ссылке, как уже было сказано.

По вопросу «считать ли это первоисточником» - ответ «нет». По большому счету, первоисточником является спам, но в спаме есть еще много хороших слов, поэтому еще нужен неспам, в котором хорошие слова есть, а плохих нет. Но корпус спама и неспама - это не «500-800 слов», которые вы ищете, а миллионы сырых писем.

Я утверждаю, что базы SpamAssassin - это наиболее близкая к первоисточнику, из бесплатно доступных, вручную созданная выжимка спам-слов и фраз, на которую уже ориентируются почтовики.

По вопросу «все ли почтовики берут это за основу» - ответ однозначно «нет».

Исходная версия AEP, :

Список слов, фраз, и прочего представимого регулярными выражениями зла можно получить из архива по ссылке, как уже было сказано.

По вопросу «считать ли это первоисточником» - ответ «нет». По большому счету, первоисточником является спам, но в спаме есть еще много хороших слов, поэтому еще нужен неспам, в котором хорошие слова есть, а плохих нет. Но корпус спама и неспама - это не «500-800 слов», которые вы ищете, а миллионы сырых писем.

Я утверждаю, что базы SpamAssassin - это наиболее близкая к первоисточнику, из бесплатно доступных, выжимка спам-слов и фраз, на которую уже ориентируются почтовики.

По вопросу «все ли почтовики берут это за основу» - ответ однозначно «нет».