ВКонтакте создала нейросеть для генерации новостных заголовков
Команда прикладных исследований ВКонтакте разработала нейросеть, которая создаёт новостные заголовки на русском и английском языках. Об этом сообщила пресс-служба компании.
Презентация нейросети состоялась ранее в этом месяце на Европейской конференции по информационному поиску (European Conference On Information Retrieval 2019) в Кёльне.
Заголовок генерируется на основе текста новости. Модель обрабатывает его и формулирует заголовок из фрагментов слов — так она добивается правильных падежей и склонений и в итоге получает связное предложение.
Чтобы создать нейросеть, разработчики использовали архитектуру Universal Transformer и технику компрессии данных BPE (Byte Pair Encoding) — они обычно применяются в машинном переводе и позволяют ограничиться небольшим словарём для генерации заголовков. Для обучения нейросети использовались тексты агентства «РИА Новости» и издания The New York Times.
При этом сотрудники ВКонтакте – первые, кто использовал BPE для модели суммаризации текста, а также первые, кто обучал такую модель на русскоязычных новостных материалах.
Чтобы проверить качество работы модели, разработчики провели отдельное исследование, в котором показывали добровольцам новость и два заголовка к ней. По словам опрошенных, в 45% случаев машинный заголовок был не хуже оригинального, а в 15% — даже лучше.
Даниил Гаврилов, разработчик-исследователь ВКонтакте:
«Наша и другие разработки помогут быстро выделять главную мысль из длинных текстов — это действительно полезно, ведь информации вокруг нас уже много и становится только больше. Использоваться технология может для самых разных задач, связанных с удобством потребления контента — например, ВКонтакте её потенциально можно применить для умного сокращения постов в ленте пользователя или для создания новостных дайджестов».
Подробное описание того, как создавалась эта модель, доступно в статье (на английском языке).
Команда прикладных исследований ВКонтакте была создана в 2018 году. Она занимается исследованиями и разработкой методов машинного обучения и искусственного интеллекта, а также решает широкий спектр задач: от классификации видео до машинного перевода.