18.05.2024

С появлением генератора видео от Sora — «кина» не будет

Сегодня каждый человек, выходя в сеть Интернет не может быть уверенным, что общается с себе подобным, а не с роботом. Видео, генерируемые искусственным интеллектом, делают эту грань еще тоньше. Создатель ChatGPT, компания Sora из Сан-Франциско, представила в минувший четверг цифровой продукт под названием OpenAI, который использует генеративный искусственный интеллект для мгновенного создания коротких видеороликов на основе письменных команд.

Sora — не первая, кто демонстрирует технологию такого рода, но отраслевые аналитики отмечают высокое качество производимых видеороликов.

Генератор видео от Sora, продолжительностью до 60 секунд, создающийся на основе письменных подсказок с использованием генерирующего искусственного интеллекта, также может генерировать видео из существующего неподвижного изображения.

Генеративный ИИ — это ветвь искусственного интеллекта, которая может создавать что-то новое.

Примерами могут служить чат-боты, такие как OpenAI ChatGPT, и генераторы изображений, такие как DALL-E и Midjourney.

Создание системы искусственного интеллекта для производства видеороликов, является более новой и сложной задачей, но опирается на некоторые из тех же технологий.

Впрочем, изделие от Sora пока недоступно для публичного использования.

Руководство OpenAI пока взаимодействует с политиками и художниками перед официальной презентацией инструмента.

Однако, в минувший компания все же поделилась несколькими примерами видеороликов, созданных Sora, чтобы продемонстрировать свои возможности.

Генеральный директор OpenAI Сэм Альтман также обратился к X, платформе, ранее известной как Twitter, с просьбой к пользователям социальных сетей присылать оперативные идеи.

Позже он поделился реалистично детализированными видеороликами, которые отвечали на такие запросы, как “подкастинг двух золотистых ретриверов на вершине горы» и «велогонка по океану с участием разных животных в качестве спортсменов, катающихся на велосипедах с помощью камеры дрона».

В то время как видео, сгенерированные Sora, могут изображать сложные, невероятно детализированные сцены, OpenAI отмечает, что все не преодолены определенные недостатки, включая некоторые пространственные и причинно-следственные элементы. Например, OpenAI добавляет на своем веб-сайте: “человек может откусить кусочек печенья, но после этого на печенье может не остаться следа от укуса”.

Напомним еще раз, что Sora от OpenAI не первая в своем роде: Google, Meta и стартап Runway ML входят в число компаний, продемонстрировавших аналогичную технологию.

И все же, отраслевые аналитики подчеркивают очевидное качество и впечатляющую продолжительность видеороликов Sora, опубликованных на данный момент.

Фред Хавмейер, глава отдела исследований искусственного интеллекта и программного обеспечения в Macquarie в США, сказал, что запуск Sora знаменует собой большой шаг вперед для отрасли.

— Вы можете не только снимать более длинные видеоролики, я понимаю, до 60 секунд, но и создаваемые видеоролики выглядят более естественными и, кажется, на самом деле больше уважают физику и реальный мир, — отметил Хавмейер.

Несмотря на то, что за последний год в видео, созданном с помощью искусственного интеллекта, был достигнут “огромный прогресс”, включая внедрение Stable Video Diffusion в ноябре прошлого года, старший аналитик Forrester Роуэн Карран считает, что такие видео требуют большего “сшивания” для согласованности персонажей и сцен.

При этом, последовательность и продолжительность видеороликов Sora представляют «новые возможности для креативщиков включать элементы видео, созданного с помощью искусственного интеллекта, в более традиционный контент, а теперь даже создавать полноценные повествовательные видеоролики из одной или нескольких подсказок».

Таков комментарий Каррана репортеру Associated Press, направленного им по электронной почте в минувшую пятницу.

Хотя способности Sora вызвали восторг зрителей во время демонстрации в минувший четверг, беспокойство по поводу этических и социальных последствий использования видео, сгенерированного искусственным интеллектом, также сохраняется.

Хавмейер указывает, например, на существенные риски в потенциально опасном избирательном цикле 2024 года.

Наличие “потенциально волшебного” способа создания видеороликов, которые могут выглядеть и звучать реалистично, создает ряд проблем в политике и за ее пределами, добавил он, указывая на проблемы мошенничества, пропаганды и дезинформации.

“Негативные внешние эффекты генеративного ИИ станут важнейшей темой для обсуждения в 2024 году”, — считает Хавмейер.

“Это существенная проблема, с которой каждому бизнесу и каждому человеку придется столкнуться в этом году”.

Технологические компании по-прежнему принимают решения, когда дело доходит до управления ИИ и связанных с ним рисков, поскольку правительства по всему миру работают над тем, чтобы наверстать упущенное.

В декабре Европейский союз достиг соглашения о первых в мире всеобъемлющих правилах в области ИИ, но закон вступит в силу только через два года после окончательного утверждения.

Руководство OpenAI неустанно подчеркивает, что ими предпринимаются важные меры безопасности, прежде чем сделать Sora массово доступной.

— Мы работаем с Red Teamers — экспертами в таких областях, как дезинформация, ненавистнический контент и предвзятость, — которые будут проводить состязательное тестирование модели. Мы также создаем инструменты, помогающие обнаруживать вводящий в заблуждение контент, такие как классификатор обнаружения, который может определить, когда видео было сгенерировано Sora, — уверяют в компании.

Вице-президент OpenAI по глобальным вопросам Анна Маканджу подтвердила неизменность позиции руководства, выступая в минувшую пятницу на Мюнхенской конференции по безопасности, где OpenAI и 19 других технологических компаний пообещали добровольно сотрудничать в борьбе с искусственными фальсификациями выборов.

Она отметила, что компания выпускала Sora “довольно осторожно”.

В то же время OpenAI раскрыл ограниченную информацию о том, как была создана Sora.

В техническом отчете OpenAI не сообщается, какие изображения и видеоисточники использовались для обучения Sora, и компания не сразу ответила на запрос о дальнейших комментариях в пятницу.

Релиз Sora также выходит на фоне судебных исков против OpenAI и ее делового партнера Microsoft со стороны некоторых авторов и New York Times за использование защищенных авторским правом произведений для обучения ChatGPT.

OpenAI платит нераскрытую плату информационному агентству AP за лицензию своего текстового новостного архива.

Поделиться

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Яндекс.Метрика