AI4BIZ logo

Sora — новая модель генерации видео при помощи искусственного интеллекта от OpenAI

Возможности Sora

Sora способна создавать детализированные сцены продолжительностью до минуты, включающие несколько персонажей, фон, а также разные типы движения. Модель не просто следует инструкциям в текстовом описании, но и понимает, как заданные объекты должны выглядеть и взаимодействовать в реальном физическом мире.

Sora демонстрирует глубокое понимание естественного языка, что позволяет ей точно интерпретировать запрос пользователя и генерировать убедительных персонажей с яркими эмоциями. Модель также может создавать несколько ракурсов в рамках одного видео, сохраняя персистентность объектов.

Ограничения Sora

У Sora есть и определенные недостатки. В частности, модель может испытывать сложности с точным моделированием физики в комплексных сценах. Например, персонаж может откусить от печенья, но на печенье не появится след от укуса.

Кроме того, Sora иногда путает пространственные детали сцены из запроса, например, левую и правую стороны. Также модель пока не способна точно отслеживать последовательность событий, происходящих в течение времени.

Обеспечение безопасности использования Sora

Перед выпуском модели в своих продуктах компания OpenAI планирует предпринять ряд мер для обеспечения безопасности. Будут проводиться тесты на предмет злоупотреблений, а также разрабатываться инструменты для обнаружения потенциально вредоносного контента.

OpenAI намерена взаимодействовать с экспертами в области политики, образования и искусства, чтобы понять их опасения и найти позитивные сценарии использования технологии Sora. Несмотря на тщательное тестирование, невозможно предсказать все способы применения модели, поэтому компания считает важным учиться на реальном опыте эксплуатации.

Значение Sora для развития ИИ

Sora рассматривается в OpenAI как база для моделей, которые смогут понимать и имитировать реальный мир. Это важный шаг на пути к созданию общего искусственного интеллекта.

О компании OpenAI

OpenAI — это исследовательская компания в области ИИ, основанная в 2015 году. Ее цель — создание безопасного и полезного для общества ИИ. Компания специализируется на обучении нейросетей с подкреплением и технологиях генерации контента. Наиболее известные разработки OpenAI: языковая модель GPT-3, лежащая в основе чат бота ChatGPT, генератор изображений DALL-E и победивший человека в сложной компьютерной игре агент Dota 2.

grok
Интеллектуальные чат-боты

Запуск чат-бота Grok от Илона Маска

Grok — это чат-бот с генеративным искусственным интеллектом, разработанный компанией xAI на основе большой языковой модели. Он был создан по инициативе Илона Маска в ответ на появление ChatGPT от OpenAI. Чат-бот Grok вдохновлен «Автостопом по галактике» и разработан для ответов на «острые» вопросы с использованием юмора и сарказма.

Читать полностью »

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *