Кодик кратко объясняет суть статьи
Подразделение Alibaba Qwen выпустило семейство моделей Qwen2.5-VL, выполняющих функции виртуальных помощников по управлению устройствами, аналогичных Operator от OpenAI. Разработчики заявляют, что новая модель превосходит зарубежные аналоги (GPT-4o, Claude 3.5 Sonnet, Gemini 2.0 Flash) в ряде задач: анализе документов, математике, понимании видео и сложных вопросах, извлечении данных из графиков и изучении видеоматериалов. Модель доступна для тестирования через приложение Alibaba Qwen Chat и платформу Hugging Face, однако не затрагивает политические темы, касающиеся Китая.
Читайте в Telegram
|
Подразделение Alibaba Qwen представило семейство моделей Qwen2.5-VL, которые могут выполнять функции управления ПК и смартфоном, наподобие виртуального помощника OpenAI Operator.
На фоне успехов китайской лаборатории DeepSeek этот проект стал ещё одной значимой разработкой в сфере ИИ. Разработчики утверждают, что Qwen2.5-VL превосходит американские модели, включая GPT-4o от OpenAI, Anthropic Claude 3.5 Sonnet и Google Gemini 2.0 Flash, в задачах по анализу документов, решению математических задач, пониманию видео и ответах на сложные вопросы. Модель также способна извлекать данные из диаграмм и графиков, изучать многочасовые видео и распознавать фрагменты фильмов и сериалов.
Испытать Qwen2.5-VL можно через приложение Alibaba Qwen Chat или загрузить модель на платформе Hugging Face. Однако разработчики подчёркивают, что модель, как и многие другие китайские проекты, избегает комментариев по политическим вопросам, связанным с Пекином.








