В Google создали систему машинного обучения, которая способна выделять отдельные голоса, анализируя лица людей в то время, когда они говорят.
Исследователи компании обучили нейросеть распознавать отдельных говорящих людей, а затем создали виртуальных «собеседников» (в комплекте с фоновым шумом), чтобы научить искусственный интеллект выделять несколько голосов в отдельные звуковые дорожки. В итоге ИИ создаёт видео, в котором голоса отдельных людей усиливаются, а все другие звуки подавляются.