Компания Alibaba Cloud представила обновлённую версию своей большой языковой модели под названием Qwen2.5, которая по некоторым параметрам превзошла известную модель GPT-4 от OpenAI.
Технический директор Alibaba Cloud Цзинжэнь Чжоу отметил, что Qwen2.5 показала улучшения в областях рассуждений, понимания кода и естественного языка по сравнению с предыдущей версией Qwen2.0.
Согласно анализу, проведённому платформой OpenCompass в марте, Qwen2.5 демонстрирует превосходство над GPT-4 в языковых и творческих возможностях. В то же время, модель Alibaba уступает GPT-4 в таких аспектах, как обширность знаний, логические рассуждения и математические способности.
Большие языковые модели, к которым относится Qwen, обучаются на огромных объёмах текстовых данных и используются для генерации ответов на естественном языке. С момента выхода ChatGPT в 2022 году, который вызвал мировой ажиотаж, Alibaba активно развивает свои технологии ИИ. В апреле 2023 года была представлена модель Tongyi Qianwen, а в октябре того же года выпущена обновлённая версия Qwen с расширенными функциональными возможностями.
Alibaba Cloud сообщает, что сервисы на базе Qwen, включая корпоративный мессенджер DingTalk, уже используют более 2,2 миллиона корпоративных клиентов. Кроме того, компания предложила сообществу разработчиков ряд открытых моделей Qwen и усовершенствовала свою платформу Model Studio, добавив новые инструменты для создания ИИ.
Читать первым в Telegram-канале «Код Дурова»