AI4BIZ logo

Искусственный интеллект для бизнеса

Исследования
Трансформеры и модели пространства состояний SSM

Трансформеры и модели пространства состояний (SSM) представляют собой две ведущие архитектуры в области обработки последовательностей для задач ИИ. Трансформеры отличаются масштабируемостью и эффективностью в задачах обработки естественного языка, в то время как SSM демонстрируют преимущества при работе с длинными последовательностями. Последние исследования фокусируются на гибридных подходах, сочетающих сильные стороны обеих архитектур, что открывает новые перспективы для развития более мощных и эффективных моделей ИИ.

Анонсы
Nvidia представляет Llama 3.1 Minitron-4B — новый этап в развитии компактных языковых моделей

Nvidia представила Llama 3.1 Minitron-4B — компактную языковую модель с 4 миллиардами параметров, которая демонстрирует производительность, сравнимую с более крупными моделями. Созданная с использованием техник обрезки, дистилляции и тонкой настройки, эта модель оптимизирована для работы на устройствах с ограниченными ресурсами. Выпуск Minitron-4B под открытой лицензией может стимулировать развитие более эффективных ИИ-решений и расширить возможности применения ИИ в различных областях.

Анонсы
AI21 Labs представляет новое семейство языковых моделей Jamba

AI21 Labs представила новое семейство языковых моделей Jamba, объединяющее архитектуры трансформеров и Mamba для достижения высокой производительности при обработке длинных последовательностей текста. Модели Jamba демонстрируют превосходные результаты по сравнению с аналогами и открывают новые возможности для применения ИИ в различных областях, от анализа научных текстов до создания продвинутых диалоговых систем.