Инженеры опытного азиатского подразделения Microsoft создали нейросеть VASA-1, способную генерировать реалистические видео говорящего человека с естественной мимикой, используя для этого только одно фото и аудиодорожку. Как сообщила компания Microsoft, нейросеть VASA-1 обучалась на наборе данных VoxCeleb2, содержащем «свыше 1 млн высказываний 6112 знаменитостей» из видео на Ютубе. Главной особенностью нейросети, по сравнению с другими алгоритмами... Читать далее
408070