Читать первым в Telegram-канале «Код Дурова»
В мире искусственного интеллекта постоянно происходят изменения, и каждый шаг вперед открывает новые горизонты возможностей.
Одним из таких шагов является появление GigaChat MAX — новейшей нейресетевой модели от Сбера, которая, по заявлениям разработчиков, может стать настоящим прорывом в области обработки естественного языка и создания контента.
Чтобы немного погрузить в контекст тех, кто, вероятно, еще не в курсе, о чем идет речь, небольшая справка. Весной 2023 года Сбер разработал GigaChat как российский ответ ChatGPT и в сентябре того же года сделал ее общедоступной.
GigaChat — это ансамбль из нейросетей, созданных для генерации текста, изображений и других видов мультимедийного контента. Модели обучаются на огромных объемах данных и способны создавать высококачественный контент, который порой сложно отличить от созданного человеком.
За время своего существования GigaChat совершенствовался, получал все больше и больше возможностей, и на днях Сбер представил новую версию, получившей название GigaChat MAX. До этого, кстати, модель называлась PRO.
На презентации GigaChat MAX выступили несколько разработчиков Сбера, которые рассказали о возможностях модели, сценариях ее применения, использовании в бизнесе, а также продемонстрировали результаты всевозможных бенчмарков и заставили запереживать журналистов и блогеров.
Что ты такое?
Первым взял слово технический директор GigaChat Федор Минькин. По его словам, GigaChat MAX — это самая умная, самая «тяжелая» модель из когда-либо созданных Сбером, подходящая для решения очень сложных задач.
Она знает сложные факты о мире, понимает, что с чем взаимосвязано и почему так, умеет рассуждать, умеет решать математические задачи на уровне мировых нейросетей, работать с кодом и работать со сложными кейсами. Наша цель — сделать такую модель, которая будет умнее среднего человека во многом
Согласно презентации Минькина, эффективность новой модели увеличилась на 23% по различным мировым метрикам. Кроме того, GigaChat MAX превосходит или находится на одном уровне с лучшими зарубежными нейросетями в различных научных дисциплинах, включая математику, биологию и химию (пока на русском языке).
Наиболее эффективна модель в решении сложных математических задач, включая алгебру, геометрию, статистику и другие разделы математики, в создании и отладке кода, написании игр, создании приложений и других программных продуктов.
Также GigaChat MAX может дать ответы на вопросы, связанные с различными аспектами знаний о мире, таких как история, география, наука и культура, помочь в учебном процессе, подготовке к экзаменам и тестам, составлении справок и резюме по научным статьям.
Ну и конечно модель способна обрабатывать большие объемы текста, анализировать научную литературу, создавать краткие содержания статей и документов.
«Модель может решать огромное количество задач, но при этом надо научиться задавать ей вопросы, осознавать, на что этот инструмент действительно способен. Этому можно научиться на наших курсах по PROMPT-инжинирингу, но они уже более профессиональные».
Продолжая тему возможностей GigaChat MAX, старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев сообщил, что нейросеть недавно сдала экзамен MMLU (MassiveMultitask Language Understanding), который включал в себя вопросы из более чем 50 областей знаний. Модель набрала 80% точности.
«Бенчмарк специализирован по многим доменам и тематикам. И, в принципе, считается, что больше 80% набирают в этих тематиках люди, которые в конкретной теме профессионалы. Если взять специалиста в отдельной области, он может и все 100 набирать. Но чтобы во всех 50 — таких людей просто не существует».
По его словам, можно даже попросить новый GigaChat пересказать научную статью так, чтобы понял десятилетний ребенок или, что называется, на «пацанском» сленге:
Я вот развлекаюсь иногда и прошу его объяснить научные статьи в стиле каких-то поэтов или писателей. Еще можно попросить модель объяснить научную статью «по-пацански». Это весело
Кстати, согласно последним результатам бенчмарка MERA, GigaChat MAX занял первое место среди всех российских генеративных моделей и находится в числе лидеров среди зарубежных.
GigaChat MAX заменит журналистов и блогеров?
Продолжил рассказывать о новой модели руководитель продукта (CPO) GigaChat B2C Антон Горшков, который привел несколько различных сценариев применения нейросети.
«Наверное, каждый сталкивался с ситуацией, когда ты хочешь запостить какой-то контент в соцсети, но не знаешь, что написать в тексте поста. GigaChat тут может помочь сделать структуру поста, определить целевую аудиторию и дать готовый текст».
Не обошли стороной и журналистику с PR. Горшков привел пример пресс-релиза, написанного новой нейросетью. Спойлер: пока сильно переживать не нужно — все-таки за моделью нужен глаз да глаз, — но задуматься точно стоит, текст получился вполне читаемым. К слову, GigaChat может и вопросы к интервью составить, и контент-план расписать, и картинку по запросу нарисовать:
«Все знают, что нейронные сети научились рисовать картинки. В интернете много мемов, где показываются шестипалые люди и так далее. На самом деле, мы понимаем, что это может быть совершенно не так. То есть, если более подробно описать то, что необходимо нарисовать, то картины получаются действительно шедевральными.
Например, мы делаем какой-то пост, этот же пост загоняем в наш GigaChat и просим нарисовать к нему изображение или обложку. В таком случае получаются красивые, насыщенные картины. Очень важно правильно вести диалог. То есть, как обычному ребенку, как человеку, максимально подробно объяснить, что ты хочешь нарисовать. И тогда он выдает действительно красивые работы».
Помимо рабочих задач, новая модель может составить план питания, помочь отстоять свои интересы в ситуации, когда, например, никак не можешь дождаться карьерного повышения, а также посоветовать книги по саморазвитию.
Есть ли польза для бизнеса?
Об этом как раз рассказала исполнительный директор, лидер направления GigaChat B2B Ольга Колесникова. Помимо всего прочего, GigaChat — это еще и платформа для построения бизнес-решений, включающая линейку моделей для различных задач: Lite для простых задач, PRO для более сложных, и MAXx для самых продвинутых.
Каждая модель имеет свои характеристики, такие как размер контекста и доля правильных ответов. Платформа также предлагает SDK для ускорения разработки и модуль этической защиты.
На самом деле, у нас есть набор технологических компонентов, технологических сервисов, с помощью которых GigaChat, как большая языковая модель, может быть встроен куда угодно. И прежде всего, это, конечно же, наш GigaChat API — программный интерфейс для взаимодействия с нашими моделями. Кроме этого, у нас есть GigaChain — это наш SDK на Python, который упрощает и ускоряет разработку приложений
GigaChat может выполнять роль помощника для сотрудников — находить ответы на вопросы, искать нужные данные и готовить документы, заниматься поддержкой клиентов — анализировать запросы, выделять важные моменты из разговоров и помогать операторам составлять ответы, а также работать с текстом — проверять стиль и ошибки, переводить тексты, создавать контент по заданным темам и формировать ответы на основе предоставленной информации.
Отвечая на вопрос «Кода Дурова» о том, кто является основными клиентами-пользователями GigaChat, Колесникова отметила, что есть два основных b2b-направления.
«Кроме того, что мы предоставляем это как сервис на внешний рынок, мы внедряем GigaChat в наши внутренние продукты и сервисы нашей группы. Но помимо этого, действительно, отдельное направление — это работа именно с внешними клиентами.
И здесь можно сказать, что в первую очередь, это IT-направление, то есть, компании, которые занимаются разработкой софта, вендоры и так далее.
Очень важное направление — это финансовый сектор, банки. Также GigaChat внедряется везде, где есть контактные центры. В общем, очевидные направления, где генеративные модели могут быть востребованы и принести пользу».
Что дальше?
Всегда после заявлений о том, что презентуемый продукт является венцом творения инженеров, лучшей версией себя, «самым мощным», «самым умным» и так далее, хочется спросить, а есть куда расти? И, да, GigaChat MAX будет и дальше совершенствоваться. И если улучшение уже существующих параметров — это очевидный процесс, то появление новых возможностей — это уже серьезная заявка на мировое лидерство.
Вообще, надо сказать, что направление больших языковых моделей в России развивается какими-то невероятными темпами. И появление GigaChat MAX показывает, что Сбер очень серьезно занимается этим вопросом. Как мы увидели, новая версия модели отлично справляется с разными задачами, такими как обработка текстов, математика и многое другое.
Это уже делает её одной из лучших в мире, а планы по дальнейшему развитию платформы свидетельствуют о стремлении российских разработчиков создать универсальную систему, способную удовлетворить потребности широкого круга пользователей. Такой подход, безусловно, позволит интегрировать искусственный интеллект в повседневную жизнь миллионов людей, делая его доступным инструментом для решения повседневных задач.
Ну а мы пойдем попросим GigaChat написать этот текст «по-пацански».
Заглавное изображение: Сбер