Почта Mail.ru обрабатывает 600 млн писем в день с помощью ML-моделей
Почта Mail.ru ежедневно обрабатывает 600 млн писем и каждое из них проходит путь минимум из 10 ML-моделей, которые помогают защитить пользователя от фишинга, спама, разобрать письма по папкам и многое другое.
Как сообщили в команде разработки, всего в почтовом сервисе функционирует около 50 моделей машинного обучения. Все они делятся на 3 большие группы: авторегистраций, антиспама и категоризации.
ML-модели Авторегистраций
Первая ML-модель была разработана в 2009 году в качестве инструмента для борьбы с ботами и спамерами в Почте. Сегодня усовершенствованная ML-система Авторегистраций блокирует около 130 000 подозрительных регистраций в день. При этом система определения взломов анализирует аккаунт в течение нескольких секунд после получения сигнала об угрозе.
ML-модели Антиспама
Системы Антиспама детектируют около 100 млн писем со спамом в сутки. На данный момент насчитывается 10 верхнеуровневых моделей для проверки писем на предмет спама. Сегодня ML-модели защищают пользователя от вредоносного контента, к которому относится: мошенничество, фишинг, кибератаки, призыв к заработку, помощь несуществующему родственнику и др. Алгоритмы машинного обучения анализируют текст и метаданные писем, а затем выявляют подозрительные схемы и защищают пользователей от возможных угроз.
ML-модели Категоризации
Умные ML-системы почтового сервиса помогают наводить порядок в почтовом ящике: сортируют письма по папкам, помечают важные письма знаком «молния», предлагают отписаться от рассылок. Ежедневно пользователи получают 300 млн писем в папку «Рассылки», до 200 млн в папку «Входящие» и до 15 миллионов в папку «Чеки». Также Почта напоминает о 2,5 млн важных событий из Календаря. Около 2,3 млн пользователей начинают разбор ящика именно с важных писем.
«Внедрение ML-моделей позволяет расширять возможности Почты, защищать данные пользователей, структурировать массив входящих писем, а также формировать новые продуктовые сценарии», – комментируют разработчики сервиса.