Alibaba представила мультимодальную модель Qwen 2.5-Omni-7B для ИИ-агентов
Alibaba Cloud представила новую открытую ИИ-модель Qwen2.5-Omni-7B — компактную, мультимодальную и экономную в плане вычислительных ресурсов.
Разработанная для обработки текста, изображений, аудио и видео, модель умеет выдавать текстовые и голосовые ответы в реальном времени, а благодаря высокой энергоэффективности её можно запускать даже на мобильных устройствах.
Как отмечают в компании, это делает модель отличной базой для создания ИИ-агентов — особенно голосовых помощников, работающих в ограниченных условиях. Один из сценариев применения — помощь слабовидящим пользователям в навигации за счёт описания окружающей обстановки в реальном времени.
Alibaba активно инвестирует в развитие ИИ-направления: за три года в инфраструктуру и ИИ-ресурсы планируется вложить $53 млрд — больше, чем за предыдущие десять лет. Компания уже открыла код более 200 моделей, укрепляя позиции в быстрорастущем ИИ-сегменте. В феврале стало известно, что модели Alibaba станут основой для Apple Intelligence в Китае, а недавно компания объявила о сотрудничестве с BMW по разработке умных автомобилей нового поколения.