Американская корпорация Microsoft представила новую нейросеть VASA-1, которая может создавать видео на основе одного изображения. Для использования нужно предоставить картинку и аудиодорожку, и алгоритм сгенерирует говорящего человека с естественной мимикой и широким спектром эмоций.
В представленном примере Microsoft заставила говорить, например, Мону Лизу, а главным отличием нейросети разработчики назвали целостную модель генерации движений головы и лицевой мимики.