YouTube Music представил две новые функции на базе искусственного интеллекта: поиск по звуку и «разговорное радио». Поиск по звуку позволяет пользователям идентифицировать песни, записав короткий аудиофрагмент, а «разговорное радио» создает персонализированные плейлисты на основе текстовых запросов. Эти инновации призваны улучшить пользовательский опыт, сделав взаимодействие с музыкой более интуитивным и персонализированным, что может значительно повлиять на способы потребления музыкального контента в будущем.
Google Vids, интегрированный с экосистемой Google Workspace, позволяет пользователям легко создавать профессиональные видеопрезентации, автоматически генерируя сценарии, вставляя стоковые материалы и даже создавая голосовое озвучивание. Google Vids имеет потенциал революционизировать процесс создания презентаций в бизнесе, образовании и других сферах, делая его более доступным и эффективным.
Лондонская компания Haiper представила новую модель искусственного интеллекта Haiper 1.5 для генерации видео на основе текстовых описаний. Модель способна создавать видеоклипы длительностью до 8 секунд в полном HD-разрешении, что вдвое превышает возможности предыдущей версии.
OpenAI представила GPT-4.0 Mini — уменьшенную и более доступную версию своей флагманской модели GPT-4. Новая модель предлагается по цене 15 центов за миллион входных токенов, что на 60% дешевле предыдущих версий, при этом сохраняя высокую производительность и скорость работы. Это событие может значительно расширить возможности применения ИИ в различных сферах, от разработки приложений до образования и малого бизнеса, открывая новую эру в доступности передовых ИИ-технологий.
Американская сеть ресторанов быстрого питания Taco Bell активно внедряет системы искусственного интеллекта для приема заказов в сотнях своих заведений. Технология голосового ИИ, разрабатывавшаяся более двух лет, уже успешно функционирует в более чем 100 ресторанах сети в США. Компания-владелец Yum! Brands планирует расширить использование этой инновации до нескольких сотен точек к концу 2024 года, ожидая улучшения точности заказов, сокращения времени ожидания и снижения нагрузки на персонал.
Недавнее исследование, проведенное Национальной медицинской библиотекой Национальных институтов здравоохранения США и Медицинским колледжем Вейля Корнелла в Нью-Йорке, проливает свет на текущее состояние ИИ в медицине и подчеркивает незаменимость человеческого опыта в здравоохранении.
ИИ-инструменты для создания контента предлагают значительные возможности для персонализации и масштабируемости, но не могут заменить уникальный стиль и аутентичность, которые придают человеческие авторы. Комбинированное использование ИИ и человека обеспечивает высокое качество и вовлечение контента.
Компания DeepMind, специализирующаяся на машинном обучении и являющаяся частью Google, объявила 25 июля о значительном прорыве в области искусственного интеллекта (ИИ) для решения математических задач. Их система ИИ успешно решила четыре из шести задач, предложенных школьникам на Международной математической олимпиаде (IMO) 2024 года в Бате, Великобритания.
Компания Google анонсировала выпуск нового поколения технологии искусственного интеллекта — модели Gemini 1.5, которая значительно превосходит предыдущие версии. Благодаря инновационной архитектуре, Gemini 1.5 может обрабатывать контекст до 1 млн токенов, что позволяет ей выполнять более сложные задачи, включая анализ больших объёмов данных. Первая модель нового поколения, Gemini 1.5 Pro, уже доступна разработчикам и корпоративным клиентам Google для тестирования.
Вот краткое описание статьи:
Компания OpenAI представила новую модель генерации видео Sora. Модель способна создавать реалистичные сцены по текстовому описанию, демонстрируя глубокое понимание естественного языка. В то же время у Sora есть недостатки в моделировании физики и пространственно-временных характеристик. Перед выпуском OpenAI планирует меры для обеспечения безопасности использования Sora. Модель рассматривается как важный шаг к созданию искусственного интеллекта, способного понимать и имитировать реальный мир.
За последний год произошел значительный прогресс в области мультимодальных больших языковых моделей (MM-LLM). Эти модели дополняют существующие языковые модели возможностью обрабатывать мультимодальные данные (изображения, видео, аудио) при помощи эффективных методов обучения.
Команда разработчиков предоставила сообществу возможность тестирования альфа-версии новой модели Midjourney v6. Новый возможности включают Гораздо более точное следование командам пользователя, поддержка более длинных промптов, улучшенная связность и знания модели, возможность рисования текста, улучшенные апскейлеры и многое другое.
Технология LLMLingua от Microsoft представляет новое решение для сжатия запросов путем удаления несущественных их частей. Данный метод способен сокращать запросы до 20 раз без потери качества реакции модели. Если использовать LLMLingua грамотно, это может уменьшить затраты на работу с передовыми LLM и сделать их доступными для более широкого круга пользователей и приложений.
Проект, первоначально призванный поднять производительность труда путем написания эссе и кода с помощью коротких текстовых команд, превратился в настоящего гиганта, который теперь используется более чем 92% компаний из списка Fortune 500 для решения самых разных задач.
Чат-боты стремительно набирают популярность в последние годы. По прогнозам аналитиков, к концу 2023 году они создадут экономию расходов для бизнеса на уровне 8 миллиардов долларов. Компании активно внедряют чат-ботов после пандемии COVID-19 в связи с возросшей потребностью в дистанционном обслуживании. Потребители также положительно воспринимают возможность общения с чат-ботами брендов. Можно утверждать, что чат-боты станут движущей силой для бизнеса в 2023 году.
Компания Google запустила новейшую разработку в области искусственного интеллекта – модель ИИ Gemini, утверждая, что она превосходит по возможностям GPT-4 от OpenAI. По словам эксперта в области ИИ Роуэна Чжуна, Gemini Pro превзошла GPT-3.5 в шести из восьми бенчмарков, «делая её самым мощным бесплатным чат-ботом на сегодняшнем рынке».
Используя Shopping Muse пользователи могут в обычной разговорной форме высказывать запросы, а система ИИ подберет персонализированные рекомендации с помощью процесса, который называется алгоритмическим подбором контента. Рекомендации Shopping Muse соответствуют уникальному профилю потребителя, его намерениям и предпочтениям и с течением времени учитывают контекст диалога, чтобы гарантировать точное соответствие даже самому эксцентричному запросу.
Важные новости, новые инструменты и рейсы по эффективному использованию технологий искусственного интеллекта для решения широкого спектра бизнес задач.
Проснувшись однажды утром после беспокойного сна, Грегор Замза обнаружил, что он у себя в постели превратился в страшное насекомое.