Сегодня каждый человек, выходя в сеть Интернет не может быть уверенным, что общается с себе подобным, а не с роботом. Видео, генерируемые искусственным интеллектом, делают эту грань еще тоньше. Создатель ChatGPT, компания Sora из Сан-Франциско, представила в минувший четверг цифровой продукт под названием OpenAI, который использует генеративный искусственный интеллект для мгновенного создания коротких видеороликов на основе письменных команд.
Sora – не первая, кто демонстрирует технологию такого рода, но отраслевые аналитики отмечают высокое качество производимых видеороликов.
Генератор видео от Sora, продолжительностью до 60 секунд, создающийся на основе письменных подсказок с использованием генерирующего искусственного интеллекта, также может генерировать видео из существующего неподвижного изображения.
Генеративный ИИ – это ветвь искусственного интеллекта, которая может создавать что-то новое.
Примерами могут служить чат-боты, такие как OpenAI ChatGPT, и генераторы изображений, такие как DALL-E и Midjourney.
Создание системы искусственного интеллекта для производства видеороликов, является более новой и сложной задачей, но опирается на некоторые из тех же технологий.
Впрочем, изделие от Sora пока недоступно для публичного использования.
Руководство OpenAI пока взаимодействует с политиками и художниками перед официальной презентацией инструмента.
Однако, в минувший компания все же поделилась несколькими примерами видеороликов, созданных Sora, чтобы продемонстрировать свои возможности.
Генеральный директор OpenAI Сэм Альтман также обратился к X, платформе, ранее известной как Twitter, с просьбой к пользователям социальных сетей присылать оперативные идеи.
Позже он поделился реалистично детализированными видеороликами, которые отвечали на такие запросы, как “подкастинг двух золотистых ретриверов на вершине горы” и “велогонка по океану с участием разных животных в качестве спортсменов, катающихся на велосипедах с помощью камеры дрона”.
В то время как видео, сгенерированные Sora, могут изображать сложные, невероятно детализированные сцены, OpenAI отмечает, что все не преодолены определенные недостатки, включая некоторые пространственные и причинно-следственные элементы. Например, OpenAI добавляет на своем веб-сайте: “человек может откусить кусочек печенья, но после этого на печенье может не остаться следа от укуса”.
Напомним еще раз, что Sora от OpenAI не первая в своем роде: Google, Meta и стартап Runway ML входят в число компаний, продемонстрировавших аналогичную технологию.
И все же, отраслевые аналитики подчеркивают очевидное качество и впечатляющую продолжительность видеороликов Sora, опубликованных на данный момент.
Фред Хавмейер, глава отдела исследований искусственного интеллекта и программного обеспечения в Macquarie в США, сказал, что запуск Sora знаменует собой большой шаг вперед для отрасли.
– Вы можете не только снимать более длинные видеоролики, я понимаю, до 60 секунд, но и создаваемые видеоролики выглядят более естественными и, кажется, на самом деле больше уважают физику и реальный мир, – отметил Хавмейер.
Несмотря на то, что за последний год в видео, созданном с помощью искусственного интеллекта, был достигнут “огромный прогресс”, включая внедрение Stable Video Diffusion в ноябре прошлого года, старший аналитик Forrester Роуэн Карран считает, что такие видео требуют большего “сшивания” для согласованности персонажей и сцен.
При этом, последовательность и продолжительность видеороликов Sora представляют “новые возможности для креативщиков включать элементы видео, созданного с помощью искусственного интеллекта, в более традиционный контент, а теперь даже создавать полноценные повествовательные видеоролики из одной или нескольких подсказок”.
Таков комментарий Каррана репортеру Associated Press, направленного им по электронной почте в минувшую пятницу.
Хотя способности Sora вызвали восторг зрителей во время демонстрации в минувший четверг, беспокойство по поводу этических и социальных последствий использования видео, сгенерированного искусственным интеллектом, также сохраняется.
Хавмейер указывает, например, на существенные риски в потенциально опасном избирательном цикле 2024 года.
Наличие “потенциально волшебного” способа создания видеороликов, которые могут выглядеть и звучать реалистично, создает ряд проблем в политике и за ее пределами, добавил он, указывая на проблемы мошенничества, пропаганды и дезинформации.
“Негативные внешние эффекты генеративного ИИ станут важнейшей темой для обсуждения в 2024 году”, – считает Хавмейер.
“Это существенная проблема, с которой каждому бизнесу и каждому человеку придется столкнуться в этом году”.
Технологические компании по-прежнему принимают решения, когда дело доходит до управления ИИ и связанных с ним рисков, поскольку правительства по всему миру работают над тем, чтобы наверстать упущенное.
В декабре Европейский союз достиг соглашения о первых в мире всеобъемлющих правилах в области ИИ, но закон вступит в силу только через два года после окончательного утверждения.
Руководство OpenAI неустанно подчеркивает, что ими предпринимаются важные меры безопасности, прежде чем сделать Sora массово доступной.
– Мы работаем с Red Teamers — экспертами в таких областях, как дезинформация, ненавистнический контент и предвзятость, — которые будут проводить состязательное тестирование модели. Мы также создаем инструменты, помогающие обнаруживать вводящий в заблуждение контент, такие как классификатор обнаружения, который может определить, когда видео было сгенерировано Sora, – уверяют в компании.
Вице-президент OpenAI по глобальным вопросам Анна Маканджу подтвердила неизменность позиции руководства, выступая в минувшую пятницу на Мюнхенской конференции по безопасности, где OpenAI и 19 других технологических компаний пообещали добровольно сотрудничать в борьбе с искусственными фальсификациями выборов.
Она отметила, что компания выпускала Sora “довольно осторожно”.
В то же время OpenAI раскрыл ограниченную информацию о том, как была создана Sora.
В техническом отчете OpenAI не сообщается, какие изображения и видеоисточники использовались для обучения Sora, и компания не сразу ответила на запрос о дальнейших комментариях в пятницу.
Релиз Sora также выходит на фоне судебных исков против OpenAI и ее делового партнера Microsoft со стороны некоторых авторов и New York Times за использование защищенных авторским правом произведений для обучения ChatGPT.
OpenAI платит нераскрытую плату информационному агентству AP за лицензию своего текстового новостного архива.