AI4BIZ logo

Крупное обновление чат-бота OpenAI: ChatGPT теперь может «видеть, слышать и говорить»

Чат-бот ChatGPT от OpenAI получает значительное обновление, которое позволит этому популярному интеллектуальному чат-боту вести голосовые диалоги с пользователями и взаимодействовать с использованием изображений.

Теперь вы можете использовать голос для ведения диалога со своим ChatGPT. Поговорите с ним на ходу, попросите сказку на ночь или уладьте спор за обеденным столом. Чтобы начать использовать голос, достаточно будет перейдите в Настройки → Новые функции в мобильном приложении чат-бота и включить голосовые диалоги. Затем нажать кнопку наушников, расположенную в правом верхнем углу домашнего экрана, и выбрать предпочтительный голос из пяти разных предложенных голосов.

Вот что говорит OpenAI о новых функциях:

Голос и изображения дают вам больше возможностей использовать ChatGPT в вашей жизни. Сфотографируйте достопримечательность во время путешествия и побеседуйте о том, что в ней интересного. Когда вы дома, сфотографируйте ваш холодильник и кладовую, чтобы понять, что приготовить на ужин (и задайте дополнительные вопросы, чтобы получить пошаговый рецепт). После ужина помогите вашему ребенку с задачей по математике — сфотографируйте ее, обведите задачу и попросите подсказки для вас обоих.

Теперь вы сможете показывать ChatGPT одно или несколько изображений. С поддержкой изображений пользователи могут фотографировать различные вещи вокруг них, задавать по поводу них вопросы и даже просить чат-бот давать советы о том, как «устранить неполадки» с тем или иным оборудованием оборудованием. Также можно будет изучить содержимое вашего холодильника, чтобы спланировать прием пищи, или проанализировать сложный график рабочих данных. Чтобы сфокусироваться на конкретной части изображения, можно будет использовать инструмент рисования в мобильном приложении чат-бота. Вы также сможете обсудить несколько изображений одновременно или использовать встроенный инструмент рисования, чтобы сфокусировать своего интеллектуального помощника на конкретные детали изображения.

Цель OpenAI — создать безопасный и полезный искусственный интеллект AGI. OpenAI считает, что их инструменты должны становиться доступными постепенно. Это позволяет им с течением времени вносить улучшения и совершенствовать необходимые средства защиты. Также это готовит всех к появлению более мощных систем искусственного интеллекта в будущем. Эта стратегия еще более важна при создании моделей с распознаванием речи и изображений.

Новые технологии синтеза речи открывают возможности для творчества и доступности. Но они также несут риски, например, возможность подделки голосов известных людей. Поэтому OpenAI использует эти технологии в данный момент исключительно для голосового чата с озвучкой профессиональными актерами.

Модели на основе изображений также создают новые проблемы. Перед широким внедрением OpenAI долго тестировали новую систему, чтобы постораться минимизировать любые риски. Это исследование позволило определить ключевые моменты для максимально ответственного использования новых функций.

OpenAI значительно ограничили возможности ChatGPT анализировать людей на изображениях, поскольку этот механизм еще не всегда точен. Такие системы, по мнению компании разработчика, должны уважать конфиденциальность. Реальное использование и отзывы конкретных пользователей помогут разработчикам улучшить защиту, сохраняя полезность инструмента.

С момента своего дебюта в прошлом году ChatGPT уже достаточно широко использовался в бизнесе для выполнения широкого круга задач — от реферирования документов до написания компьютерного кода, что запустило гонку разработок в сфере чат-ботов данного типа среди крупных технологических компаний, гонку по запуску собственных предложений на основе генеративного ИИ. Как сообщается, Google планирует в ближайшее время запустить свой новый ответ ChatGPT под названием Gemini, который уже тестируется небольшой группой компаний. Amazon, со своей стороны, в понедельник объявила, что инвестирует до 4 млрд долларов в стартап ИИ Anthropic для оказания поддержки и усиления разработок в области генеративного ИИ.

Новые функции ChatGPT будут выпущены для подписчиков его планов Plus и Enterprise в течение следующих двух недель.

google gemini
Генеративные модели

Google представляет убийцу GPT-4 — ИИ-модель Gemini

Компания Google запустила новейшую разработку в области искусственного интеллекта – модель ИИ Gemini, утверждая, что она превосходит по возможностям GPT-4 от OpenAI. По словам эксперта в области ИИ Роуэна Чжуна, Gemini Pro превзошла GPT-3.5 в шести из восьми бенчмарков, «делая её самым мощным бесплатным чат-ботом на сегодняшнем рынке».

Читать полностью »
ии чат для онлайн магазина
Интеллектуальные чат-боты

Mastercard запускает ИИ-чатбота для помощи в онлайн-шопинге

Используя Shopping Muse пользователи могут в обычной разговорной форме высказывать запросы, а система ИИ подберет персонализированные рекомендации с помощью процесса, который называется алгоритмическим подбором контента. Рекомендации Shopping Muse соответствуют уникальному профилю потребителя, его намерениям и предпочтениям и с течением времени учитывают контекст диалога, чтобы гарантировать точное соответствие даже самому эксцентричному запросу.

Читать полностью »

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *