Alibaba представила мультимодальную модель Qwen 2.5-Omni-7B для ИИ-агентов


GigaChat Max кратко объясняет суть статьи
Alibaba Cloud представила новую ИИ-модель Qwen2.5-Omni-7B, которая обрабатывает текст, изображения, аудио и видео, выдавая текстовые и голосовые ответы в реальном времени. Модель отличается высокой энергоэффективностью, что позволяет использовать её на мобильных устройствах. Она может стать основой для ИИ-агентов, таких как голосовые помощники, помогающие слабовидящим людям ориентироваться в пространстве. Alibaba планирует вложить $53 млрд в развитие ИИ-инфраструктуры за ближайшие три года, открыв код более 200 моделей. Недавно компания заключила соглашения с Apple и BMW.
Alibaba Cloud представила новую открытую ИИ-модель Qwen2.5-Omni-7B — компактную, мультимодальную и экономную в плане вычислительных ресурсов.
Разработанная для обработки текста, изображений, аудио и видео, модель умеет выдавать текстовые и голосовые ответы в реальном времени, а благодаря высокой энергоэффективности её можно запускать даже на мобильных устройствах.
Как отмечают в компании, это делает модель отличной базой для создания ИИ-агентов — особенно голосовых помощников, работающих в ограниченных условиях. Один из сценариев применения — помощь слабовидящим пользователям в навигации за счёт описания окружающей обстановки в реальном времени.
Alibaba активно инвестирует в развитие ИИ-направления: за три года в инфраструктуру и ИИ-ресурсы планируется вложить $53 млрд — больше, чем за предыдущие десять лет. Компания уже открыла код более 200 моделей, укрепляя позиции в быстрорастущем ИИ-сегменте. В феврале стало известно, что модели Alibaba станут основой для Apple Intelligence в Китае, а недавно компания объявила о сотрудничестве с BMW по разработке умных автомобилей нового поколения.
Читать первым в Telegram-канале «Код Дурова»