Нейросеть Make-A-Video может генерировать видеоролики по текстовому описанию

Специалисты по машинному обучению компании M*ta (признана экстремистской организацией в России) представили нейросеть Make-A-Video. Она работает схожим образом, что и популярные нейросети вроде DALL-E 2 и Midjourney, но вместо статичных изображений создаёт короткие ролики по текстовому описанию.

Для создания роликов достаточно нескольких слов или строк текста. Также Make-A-Video может добавлять движение к статичным изображениям.

На данном этапе удаётся получать видео продолжительностью не более 5 секунд низкого качества с артефактами и без звука, однако в будущем разработка может помочь существенно продвинуться в сфере создания контента с помощью ИИ.

«Исследования генеративного ИИ продвигают вперёд творческое самовыражение, предоставляя людям инструменты для быстрого и лёгкого создания нового контента. С помощью всего нескольких слов или строк текста Make-A-Video может воплотить в жизнь воображение и создать уникальные видеоролики, полные ярких цветов и пейзажей», — говорится в сообщении M*ta.

В случае с алгоритмами генерации изображений по описанию, подобные инструменты могут нести опасность. Это связано с тем, что такие алгоритмы могут использоваться для дезинформации, пропаганды и др. Ознакомиться с большим числом видеопримеров можно здесь.

Сообщается, что нейросеть обучали на миллионах роликов, в том числе и стоковых. Сейчас доступа к технологии нет даже по приглашениям. Однако, похоже, в будущем такая возможность появится, ведь уже есть форма регистрации.