Welcome to TechNet Blogs Sign in | Join | Help

Новое... и из истории борьбы со спэмом в Майкрософте.

С 1го сентября с.г., я больше не работаю в Семейной Безопасности. Снова буду в команде, занимающейся так или иначе спэмом. На этот раз наша команда будет заниматься распознованием БотНэтов. Все видимо знают, что такое БотНэты и не стоит об этом много говорить. Наши исследователи разработали кучу всяких алгоритмов для выявления и классификации этих вредных вещей. Все эти процессы основаны на обработке гигабайт данных в секунду, поэтому система, которую мы строим, фактически суперкомпьютер. В идеале, увиденном создателем всего этого Натаном Хауэллом, 100 000 машин работающих вместе...

И вот кстати... Натан Хауэлл покидает нашу компанию и идет дальше куда-то заниматься дистрибутивынми исчислениями и машинным обучением. О нем нельзя не сказать пару слов. Пришел Натан в нашу компанию 10 лет назал, 18летним парнишкой, без какого либо "верхнего" образования. Первая написанная им в Майкрософте программа, в течение 15 минут удаляла всю почту, шедшую через MSN. По его словам: "true != false, поди разберись!" Видимо тут и проявилась его любовь к спэму. Т.е. фактически удалению 90% почты, идущей на данный домэйн.

Натан начал заниматься спэмом, точно не знаю в каком году, но встречал огромное противодействие мэнеджмента. Мол знай свою работу и не суйся куда не просят. Вместе с двумя сослуживцами и друзьями, в гостинной одного из них, начали они создавать первый спэм фильтр и обучающую его систему. К концу 2002 года, написали письмо Биллу с просьбой выделить им место под оффисы и 6 млн. Получили согласие. Так и родилась к 2003му году MSN ATS (Anti-spam Technology and Strategy) в которую в декабре 2003го года пришел и я. Потом были довольно нервозные полгода, когда ребят таскали на ревью к Биллу каждый месяц. Спэм вдруг стал приоритетом.

Написанный Нэйтом спэм фильтр вышел, Хотмэйл и Аутлук во всю им пользовались и получали восторженные отзывы в прессе. Сейчас (я конечно же необъективен, но) мне кажется это лучший из фильтров на рынке (в комбинации со всеми блок-списками и т.д). На свой МС адрес я практически не получаю никакого спэма, впрочем как и на хотмэйловский. Г-мэйл работает неплохо, хотя Нэйт ворчит, мол, слишком много все-таки приходит под ярлык с названием "Спэм". Яху! меня совсем не впечатляет. И сегодня ядром этого фильтра является код, написанный тогда.

Еще Нэйт учил меня различать виды Текилы. Из поездки в Мексику привез 26 бутылок. Мы разошлись в оценке лучшей водки. Он предпочитает Левел, а я - Серого Гуся. Возвращаясь из разных поездок, мы обмениваемся историями о разных смешных мартини, приготовленных в местах посещения. Вот решили недавно, что это надо фотографировать: (маслины вместо оливок, оливки вместе с лимонной кожурой, коктейльная вишенка вместо оливок, пластиковый стаканчик и т. д.)

Нэйт знает все и сразу. Я могу сегодня забежать к нему и спросить: Как пользовться счетчиком средних значений (perfromance counter) в .NETe. И он мне сразу расскажет, как обойти имеющийся там баг. А через минуту с такой же легкостью может рассказать что-то о Kernel APIs. Ну кто из программистов точно помнит как писать event handling в ATL COM. Для этого же есть документация. Ну допустим не делал я этого уже более полу года. Так всех деталей и не помню. А Нэйт помнит.

Жалко терять такого парня. Завтра отходная, приношу бутылку Левела.

Published Thursday, September 11, 2008 11:16 PM by borisk

Comments

# re: Новое... и из истории борьбы со спэмом в Майкрософте.

Friday, September 12, 2008 1:44 AM by pnagaev

Очень хорошо, что Вы продолжите писать про спам и я надеюсь технических постов в блоге на эту тему будет больше, т.к. спам — это очень серьезная тема для разговоров в ИТ сообществе в России.

Ведь именно пользователи страдают от этого и выливают свой гнев на ИТ специалистов компаний. Поэтому борьба со спамом должна быть эффективной, но далеко не все знают как это сделать с помощью MS Exchange.

Я часто пишу об этом в своем блоге и разговариваю с людьми на лайвмитингах или при живом общении.

Тема контентных фильтров пока остается загадкой, т.к. во все эти байесовы алгоритмы и их эффективность я просто не верю. Одно ложное срабатывание и все идет к чертям.

Ну да ладно, надеюсь это все разговоры для будущих тем в блогах.

Anonymous comments are disabled
 
Page view tracker