Yahoo! фильтрует спам с помощью "суперкомпьютера"

23/01/2009 10:49

Компания Yahoo! предпринимает всё возможное и невозможное, для того чтобы усовершенствовать антиспамовую систему своей почтовой службы Yahoo! Mail. Последними шагами в этом направлении поделился в корпоративном блоге Марк Ришер (Mark Risher), занимающий в этом сервисе важнейшую должность "антиспамового царя". По его словам, для борьбы с потоками спама в Yahoo! решили слегка потеснить открытый проект Hadoop, который заключается в создании среды для облегчения написания и выполнения программ, требующих обработки огромных массивов данных, и в котором компания принимает живейшее участие. "Суперкомпьютер", состоящий из нескольких тысяч персоналок, использующихся в этом проекте, с недавних пор выполняет задачи, связанные с фильтрацией почтового мусора. Подробности Ришер не раскрывает, упомянув лишь о сотрудничестве в этом благородном деле с несколькими ведущими университетами. Вместе они "ищут новые пути для поиска и блокирования плохих парней ещё до того, как они смогут нанести урон". Другие антиспамовые меры Yahoo! заключаются в сотрудничестве с компаниями Abaca и Return Path. Первая уверяет, что её антиспамовая система, базирующаяся, в частности, на так называемой "репутации адресатов" (а не более традиционной репутации отправителей), продемонстрировала на независимых тестах точность в 99,997%. Ришер надеется, что совместными усилиями они "смогут блокировать ещё больше спама, изучая поведение спамеров в дополнение к анализу их сообщений". Ну а компания Return Path помогла Yahoo! Mail запустить бесплатный сервис Complaint Feedback Loop, предназначенный для коммерческих партнёров. Его суть состоит в том, чтобы уведомлять компании, занимающиеся легитимными рассылками, о случаях, когда пользователи почтового сервиса помечают их сообщения как спам, чтобы те могли предпринять в этой связи какие-то меры. Например, внести исправления в рассылочные списки. Отметим, что, несмотря на наличие у Yahoo! Mail собственного "царя", спам-фильтры здесь всегда считались проблемными: доля продирающихся сквозь них спам-сообщений, равно как и доля застревающей в них легитимной корреспонденции были слишком высоки. Судя по комментариям пользователей к этой записи Ришера, ситуация и в настоящий момент оставляет желать лучшего.
Подробности