Специалисты по машинному обучению компании M*ta (признана экстремистской организацией в России) представили нейросеть Make-A-Video. Она работает схожим образом, что и популярные нейросети вроде DALL-E 2 и Midjourney, но вместо статичных изображений создаёт короткие ролики по текстовому описанию.
Для создания роликов достаточно нескольких слов или строк текста. Также Make-A-Video может добавлять движение к статичным изображениям.
На данном этапе удаётся получать видео продолжительностью не более 5 секунд низкого качества с артефактами и без звука, однако в будущем разработка может помочь существенно продвинуться в сфере создания контента с помощью ИИ.
«Исследования генеративного ИИ продвигают вперёд творческое самовыражение, предоставляя людям инструменты для быстрого и лёгкого создания нового контента. С помощью всего нескольких слов или строк текста Make-A-Video может воплотить в жизнь воображение и создать уникальные видеоролики, полные ярких цветов и пейзажей», — говорится в сообщении M*ta.
В случае с алгоритмами генерации изображений по описанию, подобные инструменты могут нести опасность. Это связано с тем, что такие алгоритмы могут использоваться для дезинформации, пропаганды и др. Ознакомиться с большим числом видеопримеров можно здесь.
Сообщается, что нейросеть обучали на миллионах роликов, в том числе и стоковых. Сейчас доступа к технологии нет даже по приглашениям. Однако, похоже, в будущем такая возможность появится, ведь уже есть форма регистрации.