23 ноября 2025

eur = 90.56 -2.04 (-2.21 %)

btc = 85 299.00$ 495.24 (0.58 %)

eth = 2 780.70$ 12.32 (0.45 %)

ton = 1.53$ 0.00 (0.04 %)

usd = 79.02 -1.71 (-2.12 %)

eur = 90.56 -2.04 (-2.21 %)

btc = 85 299.00$ 495.24 (0.58 %)

Представлен первый российский мультимодальный бенчмарк MERA Multi

1 минута на чтение
Представлен первый российский мультимодальный бенчмарк MERA Multi

ГигаЧат кратко объясняет суть статьи

На конференции AI Journey 2025 представили MERA Multi – новую русскоязычную систему тестирования мультимодальных способностей моделей. Бенчмарк включает 18 задач, оценивающих визуальное восприятие, аудиопонимание и анализ видео. Система учитывает четыре модальности: текст, изображение, аудио и видео, обеспечивая объективную оценку и ранжирование моделей. MERA Multi разработана с учетом российских особенностей и формирует единую таксономию навыков, способствующую стандартизации и улучшению качества отечественных решений в области искусственного интеллекта.

На AI Journey 2025 был официально представлен MERA Multi – новый бенчмарк для комплексной оценки мультимодальных способностей современных моделей на русском языке.

Бенчмарки экосистемы MERA – это независимая система тестов для проверки возможностей больших языковых моделей на русском языке. Ранние версии MERA включали текстовые тесты и специализированные разделы (например, MERA Code для задач программирования и MERA Industrial для отраслевых сценариев).

MERA Multi включает 18 новых задач, разработанных по методологии бенчмарка MERA Text. Эти задачи проверяют ключевые мультимодальные умения моделей:

  • Визуальное восприятие: способность анализировать изображения – распознавать объекты, интерпретировать сцены и соотносить их с текстовым описанием. Это важно для систем генерации и поиска по картинкам, а также для применения ИИ в системах безопасности.
  • Аудиопонимание: способность обрабатывать аудиоконтент на русском языке – распознавать речь, интонации и звуковые сигналы. Этот навык нужен для голосовых ассистентов и приложений, работающих в шумной среде.
  • Анализ видео: умение ИИ «понимать» динамику видеоконтента – отслеживать действия, события и причинно-следственные связи во временном контексте. Это основа для интеллектуальных ассистентов, агентов и мультимодального поиска.

Каждая задача оформлена в строгом инструктивном формате. MERA Multi охватывает четыре модальности – текст (как базовая), изображения, аудио и видео – и оснащен прозрачной системой подсчёта баллов и рейтингов. Для исследователей и индустрии это значит, что теперь можно количественно сравнивать насколько хорошо современные модели «видят», «слышат» и понимают контент на русском языке.

Проект MERA Multi также способствует стандартизации оценки ИИ в России. Разработчики создали единую «таксономию навыков» – системное описание компетенций, нужных для мультимодальных задач. В перспективе все бенчмарки MERA будут использовать одну систему навыков, что обеспечивает «согласованную и прозрачную оценку моделей во всех доменах». Такой единый подход упрощает сравнение моделей между собой и выявление направлений для улучшения.

Кроме того, MERA Multi разработан экспертами с учётом российской специфики – это делает результаты особенно релевантными для отечественных научных групп и индустриальных разработчиков.

По словам Валерии Воробьёвой стандартизация критически важна:

«Единый подход к оценке моделей позволяет формировать общую «шкалу» качества и координировать усилия внутри страны. MERA Multi создаёт такой стандарт – он даёт российским разработчикам и исследователям понятную методологию сравнения моделей и синхронизирует наши усилия. Это ключевой шаг для развития качественных отечественных ИИ-решений в будущем».
Теги:

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от ГигаЧат 
1-bg-изображение-0
img-content-1-изображение-0

ГигаЧат: коротко о главном

Как изменился Код Дурова вместе с ГигаЧат?

Узнай о всех возможностях в FAQ-статье 
Представлен первый российский мультимодальный бенчмарк MERA Multi

ГигаЧат: коротко о главном

Представлен первый российский мультимодальный бенчмарк MERA Multi

Полная версия 
Telegram запустил аукцион на подарки с папахой Хабиба НурмагомедоваTelegram запустил аукцион на подарки с папахой Хабиба НурмагомедоваTelegram запустил аукцион на подарки с папахой Хабиба Нурмагомедова

ГигаЧат: коротко о главном

Telegram запустил аукцион на подарки с папахой Хабиба Нурмагомедова

Полная версия 

Реализовано через ГигаЧат 

Сейчас читают
Цифра в деле
Цифра в деле
Смотреть
Реклама. ПАО Сбербанк. erid: 2Vtzqv3u7MN
Карьера
Блоги 453
OTP Bank
Газпромбанк
билайн
МТС
Т-Банк
X5 Tech
Сбер
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы