На днях столкнулся с такой интересной практической задачкой, как написать почтовый спам-фильтр. С самого начала бросилась в глаза вот эта статья. Следом за ней наткнулся на еще одни интересные замечания и размышления.
Все хорошо, но интересно следующее:
1) Как борется со спамом прогрессивное человечество? (Также пользуется байесовым классификатором, варьируя законами распределения, тренировочным материалом и другими эвристиками)
2) Может ли кто подсказать хороший "тренировочный(обучающий) материал", для системы, либо уже какую-то готовую статистическую инфу (пускай не очень свежую). Сам лишь нарыл вот такой кладезь зла.
3) Есть ли какой бесплатный или не очень дорогой и в то же время удобный онлайн сервис для проверки писем на спам.
Спасибо за внимание.