возникла необходимость очистить текущую базу sa и заново натравить на письма, которые он либо ошибочно определял спамом, либо ошибочно пропускал, не определяя как спам:
# su amavis -c "sa-learn --clear"
# su amavis -c "sa-learn --ham /var/vmail.ham/"
# su amavis -c "sa-learn --spam /var/vmail.spam/"
проверил:
# su amavis -c "sa-learn --dump magic"
0.000 0 3 0 non-token data: bayes db version
0.000 0 329 0 non-token data: nspam
0.000 0 12 0 non-token data: nham
0.000 0 54994 0 non-token data: ntokens
0.000 0 1277081269 0 non-token data: oldest atime
0.000 0 1288147040 0 non-token data: newest atime
0.000 0 0 0 non-token data: last journal sync atime
0.000 0 1288149903 0 non-token data: last expiry atime
0.000 0 0 0 non-token data: last expire atime delta
0.000 0 0 0 non-token data: last expire reduction count
после этого sa стал пропускать письма, которые раньше успешно определял как спам
заголовки практически идентичного письма до вышеперечисленных действий:
...
X-Spam-Status: Yes, score=9.381 required=6.31 tests=[BAYES_99=6.5,
DOS_HIGHBIT_HDRS_BODY=1, HTML_MESSAGE=0.001,
HTML_TAG_BALANCE_BODY=1.157, MIME_HTML_ONLY=0.723] autolearn=no
...
и после:
...
X-Spam-Status: No, score=2.818 required=6.31 tests=[DOS_HIGHBIT_HDRS_BODY=1,
HTML_MESSAGE=0.001, HTML_TAG_BALANCE_BODY=0.712, MIME_HTML_ONLY=1.105]
autolearn=unavailable
...
проанализировав заголовок «X-Spam-Status» в остальных письма, выяснил что в них пропали оценки BAYES_xx.
поясните пожалуйста, с чем это связано и как вернуть былые знания, имея только файлы спама/хама без базы sa?
з.ы.: часть конфига sa, касательно Bayesian classifier:
use_bayes 1
use_bayes_rules 1
bayes_auto_learn 1
bayes_auto_expire 0
bayes_auto_learn_threshold_spam 10
bayes_auto_learn_threshold_nonspam -2