Alibaba представила мультимодальную модель Qwen 2.5-Omni-7B для ИИ-агентов


GigaChat Max кратко объясняет суть статьи
Alibaba Cloud выпустила новую открытую ИИ-модель Qwen2.5-Omni-7B, способную обрабатывать текст, изображения, аудио и видео, эффективно использовать ресурсы и выдавать ответы в реальном времени. Модель подходит для создания голосовых помощников, в частности, для помощи слабовидящим людям. Alibaba планирует инвестировать $53 млрд в развитие ИИ-инфраструктуры за три года, ранее открыла доступ к коду более 200 моделей, сотрудничает с Apple и BMW.
Alibaba Cloud представила новую открытую ИИ-модель Qwen2.5-Omni-7B — компактную, мультимодальную и экономную в плане вычислительных ресурсов.
Разработанная для обработки текста, изображений, аудио и видео, модель умеет выдавать текстовые и голосовые ответы в реальном времени, а благодаря высокой энергоэффективности её можно запускать даже на мобильных устройствах.
Как отмечают в компании, это делает модель отличной базой для создания ИИ-агентов — особенно голосовых помощников, работающих в ограниченных условиях. Один из сценариев применения — помощь слабовидящим пользователям в навигации за счёт описания окружающей обстановки в реальном времени.
Alibaba активно инвестирует в развитие ИИ-направления: за три года в инфраструктуру и ИИ-ресурсы планируется вложить $53 млрд — больше, чем за предыдущие десять лет. Компания уже открыла код более 200 моделей, укрепляя позиции в быстрорастущем ИИ-сегменте. В феврале стало известно, что модели Alibaba станут основой для Apple Intelligence в Китае, а недавно компания объявила о сотрудничестве с BMW по разработке умных автомобилей нового поколения.
Читать первым в Telegram-канале «Код Дурова»