Возможности Sora
Sora способна создавать детализированные сцены продолжительностью до минуты, включающие несколько персонажей, фон, а также разные типы движения. Модель не просто следует инструкциям в текстовом описании, но и понимает, как заданные объекты должны выглядеть и взаимодействовать в реальном физическом мире.
Sora демонстрирует глубокое понимание естественного языка, что позволяет ей точно интерпретировать запрос пользователя и генерировать убедительных персонажей с яркими эмоциями. Модель также может создавать несколько ракурсов в рамках одного видео, сохраняя персистентность объектов.
Ограничения Sora
У Sora есть и определенные недостатки. В частности, модель может испытывать сложности с точным моделированием физики в комплексных сценах. Например, персонаж может откусить от печенья, но на печенье не появится след от укуса.
Кроме того, Sora иногда путает пространственные детали сцены из запроса, например, левую и правую стороны. Также модель пока не способна точно отслеживать последовательность событий, происходящих в течение времени.
Обеспечение безопасности использования Sora
Перед выпуском модели в своих продуктах компания OpenAI планирует предпринять ряд мер для обеспечения безопасности. Будут проводиться тесты на предмет злоупотреблений, а также разрабатываться инструменты для обнаружения потенциально вредоносного контента.
OpenAI намерена взаимодействовать с экспертами в области политики, образования и искусства, чтобы понять их опасения и найти позитивные сценарии использования технологии Sora. Несмотря на тщательное тестирование, невозможно предсказать все способы применения модели, поэтому компания считает важным учиться на реальном опыте эксплуатации.
Значение Sora для развития ИИ
Sora рассматривается в OpenAI как база для моделей, которые смогут понимать и имитировать реальный мир. Это важный шаг на пути к созданию общего искусственного интеллекта.
О компании OpenAI
OpenAI — это исследовательская компания в области ИИ, основанная в 2015 году. Ее цель — создание безопасного и полезного для общества ИИ. Компания специализируется на обучении нейросетей с подкреплением и технологиях генерации контента. Наиболее известные разработки OpenAI: языковая модель GPT-3, лежащая в основе чат бота ChatGPT, генератор изображений DALL-E и победивший человека в сложной компьютерной игре агент Dota 2.