В феврале компания Open AI представила нейросеть Sora, способную по текстовому описанию генерировать сверхреалистичные видео в разрешении FullHD. Возможности нейросети потрясли общественность — ролики получались практически не отличимы от реальных съемок. Однако несмотря на ажиотаж ее инструментарий пока доступен лишь ряду создателей контента: художникам, дизайнерам и кинематографистам. Сейчас технический директор OpenAI Мира Мурати сообщила, что нейросеть Sora станет доступна широкой публике позже в текущем году.
Нейросеть Sora, заявила техдиректор Open AI, сможет генерировать звуковое сопровождение к роликам. Финальный результат станет еще более качественным. Однако уже сейчас функционал продвинутой нейросети может содержать некоторые риски.
Компания HarrisX проводила опрос с участием более 1000 американцев. Им предложили отличить сгенерированное ИИ видео от настоящего. Оказалось, что большая часть опрошенных ошиблась в 5 из 8 предлагаемых роликов.
Исследование указывает на то, что создаваемый с помощью генеративных нейросетей контент становится все более реалистичным. Отличить его от реальных съемок становится все сложнее.
Китай стал первой страной, в которой ввели регулирование генеративных нейросетей. Общедоступные ИИ-генераторы должны будут получать специальную лицензию. К слову, Илон Маск и Стив Возняк (основатель Apple) еще год назад подписали открытое письмо, в котором содержались потенциальные риски развития ИИ для человечества.
По словам технического директора Open AI Миры Мурати, нейросеть Sora не сможет создавать изображения общественных деятелей, как и нейросеть DALL-E. Видео от Sora также будут включать водяные знаки, но они не являются идеальной защитой и могут быть удалены из видео при помощи других ИИ или традиционных технологий.
Сейчас OpenAI работает над возможностью редактирования контента в видеороликах Sora, поскольку инструменты искусственного интеллекта не всегда создают точные изображения. «Мы пытаемся выяснить, как использовать эту технологию в качестве инструмента, с помощью которого люди смогут редактировать медиаконтент», — заявили в Open AI.
Мурати уклонилась от ответа на вопрос, какие данные OpenAI использовала для обучения Sora.
«Я не собираюсь вдаваться в подробности использованных данных, но это были общедоступные или лицензированные данные», — заявила она изданию The Wall Street Journal. Мурати не подтвердила и не опровергла использование видео с крупных видеохостингов: YouTube и ряда запрещенных в России социальных сетей.
Видео с примерами работ, сделанных нейросетью Sora:
Технический директор отметила, что Sora использует контент фотохостинга Shutterstock, с которым у OpenAI заключено партнерское соглашение.
Мурати рассказала, что на сегодняшний день нейросеть Sora отличается от других моделей ИИ повышенными требованиями к вычислительным ресурсам. Стоимость доступа к нейросети пока не уточняется, но, по всей видимости, она будет сопоставима с платой за использование DALL-E (10 долларов в месяц).