Описание подключения SpamProbe на exim и результат работы


Судя по всему, в марте прошлого года подключил к своему почтовому серверу на Exim спамфильтр SpamProbe.

По виду, все делалось по статье -  SpamProbe - фильтруем спам

Схема работы следующая:

  • Подключен к Exim через system_filter, который по необходимости сам как-то дергает SpamProbe. Хорошо это или плохо не знаю, но SpamProbe не висит демоном, а запускается каждый раз на проверку письма.
  • В Exim настроен роутер, который передает в транспорт по доставке писем пользователям в папочку Spam в случае если:
    • У получателя включен спамфильтр
    • SpamProbe определил письмо как спам
    • адрес отправителя не находится в белом листе
  • Транспорт по доставке спама передат письма dovecot с указанием положить в папку Spam.

Обучение идет с использованием dovecot, протокола imap и Antispam плагина к dovecot по следующей схеме:

  • Определены папки пользователей для спама и удаленных писем.
  • При перемещении письма из папок для спама в папку не для удаленных писем или наоборот с помощью модуля 'spool2dir plugin' письмо копируется на сервер в отдельную папку spam или ham для обучения.
  • Периодически по крону запускается скрипт, который проходится по папкам для обучения, передает письма на обучение SpamProbe и перемещает в архивную папку для анализа в случае необходимости.
  • Отдельный скрипт периодически чистит архивную папку .

Данная схема возможно не оптимальна, но при наличии нескольких пользователей (секретарей) c Thunderbird и его фильтром с приемлемым уровнем фильтрацию спама для всего сервера получилось обеспечить.

К тому же как оказалось в дальнейшем, наличие скрипта обучения удобно, для передачи писем разным спам фильтрам.

Статистика за апрель 2015
Определено Объем Количество
спам 544MB 7700
нормальные письма 21GB 34566

Есть подозрение, что на большое количество нормальных писем повлияли служебные письма от техники. Их много, но объем они создают маленький.

P.S. Как сейчас выясняется, у некоторых пользователей не совпадали папки корзины с тем, что используется на сервере, что вносило некоторые коррективы в неправильную работу спам фильтра.