AI4BIZ logo

Sora — новая модель генерации видео при помощи искусственного интеллекта от OpenAI

Возможности Sora

Sora способна создавать детализированные сцены продолжительностью до минуты, включающие несколько персонажей, фон, а также разные типы движения. Модель не просто следует инструкциям в текстовом описании, но и понимает, как заданные объекты должны выглядеть и взаимодействовать в реальном физическом мире.

Sora демонстрирует глубокое понимание естественного языка, что позволяет ей точно интерпретировать запрос пользователя и генерировать убедительных персонажей с яркими эмоциями. Модель также может создавать несколько ракурсов в рамках одного видео, сохраняя персистентность объектов.

Ограничения Sora

У Sora есть и определенные недостатки. В частности, модель может испытывать сложности с точным моделированием физики в комплексных сценах. Например, персонаж может откусить от печенья, но на печенье не появится след от укуса.

Кроме того, Sora иногда путает пространственные детали сцены из запроса, например, левую и правую стороны. Также модель пока не способна точно отслеживать последовательность событий, происходящих в течение времени.

Обеспечение безопасности использования Sora

Перед выпуском модели в своих продуктах компания OpenAI планирует предпринять ряд мер для обеспечения безопасности. Будут проводиться тесты на предмет злоупотреблений, а также разрабатываться инструменты для обнаружения потенциально вредоносного контента.

OpenAI намерена взаимодействовать с экспертами в области политики, образования и искусства, чтобы понять их опасения и найти позитивные сценарии использования технологии Sora. Несмотря на тщательное тестирование, невозможно предсказать все способы применения модели, поэтому компания считает важным учиться на реальном опыте эксплуатации.

Значение Sora для развития ИИ

Sora рассматривается в OpenAI как база для моделей, которые смогут понимать и имитировать реальный мир. Это важный шаг на пути к созданию общего искусственного интеллекта.

О компании OpenAI

OpenAI — это исследовательская компания в области ИИ, основанная в 2015 году. Ее цель — создание безопасного и полезного для общества ИИ. Компания специализируется на обучении нейросетей с подкреплением и технологиях генерации контента. Наиболее известные разработки OpenAI: языковая модель GPT-3, лежащая в основе чат бота ChatGPT, генератор изображений DALL-E и победивший человека в сложной компьютерной игре агент Dota 2.

ии чат для онлайн магазина
Интеллектуальные чат-боты

Mastercard запускает ИИ-чатбота для помощи в онлайн-шопинге

Используя Shopping Muse пользователи могут в обычной разговорной форме высказывать запросы, а система ИИ подберет персонализированные рекомендации с помощью процесса, который называется алгоритмическим подбором контента. Рекомендации Shopping Muse соответствуют уникальному профилю потребителя, его намерениям и предпочтениям и с течением времени учитывают контекст диалога, чтобы гарантировать точное соответствие даже самому эксцентричному запросу.

Читать полностью »
LLMLingua
Генеративные модели

Уменьшение стоимости работы с GPT-4 моделями за счет компрессии запросов

Технология LLMLingua от Microsoft представляет новое решение для сжатия запросов путем удаления несущественных их частей. Данный метод способен сокращать запросы до 20 раз без потери качества реакции модели. Если использовать LLMLingua грамотно, это может уменьшить затраты на работу с передовыми LLM и сделать их доступными для более широкого круга пользователей и приложений.

Читать полностью »

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *