17 сентября 2025

eur = 97.45 -1.88 (-1.89 %)

btc = 116 876.00$ 1 626.64 (1.41 %)

eth = 4 523.94$ 11.06 (0.25 %)

ton = 3.17$ 0.02 (0.66 %)

usd = 83.07 -1.31 (-1.55 %)

eur = 97.45 -1.88 (-1.89 %)

btc = 116 876.00$ 1 626.64 (1.41 %)

Российские учёные создали первую открытую среду для быстрого контекстного обучения с подкреплением

2 минуты на чтение
Розовый куб с надписью «УЛ», подключённый синим проводом к источнику питания.Как видит новость Kandinsky

ГигаЧат кратко объясняет суть статьи

XLand-MiniGrid — виртуальная среда для обучения искусственного интеллекта принятию решений и выполнению новых задач, созданная учеными лабораторий T-Bank AI Research и AIRI совместно со студентами ведущих российских вузов. Среда написана на основе технологии JAX, обеспечивает высокую производительность (миллиарды операций/сек), содержит 100 млрд примеров действий ИИ в 30 тыс. задач и позволяет использовать готовые датасеты для быстрого дообучения моделей. В среде реализовано контекстное обучение с подкреплением, обеспечивающее быструю адаптацию моделей к новым задачам. XLand-MiniGrid опубликована в открытом доступе и используется исследователями из ведущих мировых университетов, описание проекта принято на конференцию NeurIPS 2024.

Виртуальная среда XLand-MiniGrid, в которой ИИ обучается принимать решения и выполнять новые действия, создана группой учёных из лаборатории научных исследований искусственного интеллекта T-Bank AI Research и Института AIRI при участии студентов из МФТИ, Сколтеха и Иннополиса.

Сообщается, что XLand-MiniGrid создана на базе JAX — технологии для разработки высокопроизводительных программ — и способна выполнять миллиарды операций в секунду.

В ней собрано 100 млрд примеров действий искусственного интеллекта в 30 тысячах задач, что позволяет использовать готовые датасеты для обучения, а не проводить его каждый раз с нуля.

«Мы пришли в область контекстного обучения с подкреплением, когда она еще зарождалась, и поэтому не нашли ни одного подходящего инструмента для оценки новых идей. Стало понятно, что это проблема для многих специалистов, а значит, она должна быть решена одной из первых. Поэтому появился XLand-MiniGrid», — отметил Вячеслав Синий, исследователь научной группы AI Alignment, лаборатория исследований искусственного интеллекта T-Bank AI Research.

Среда опубликована в открытом доступе —  в ней уже провели эксперименты исследователи из Google DeepMind, Калифорнийского университета в Беркли и Оксфордского университета. Кроме того, научная статья, описывающая создание среды, была принята на крупнейшую международную конференцию в области ИИ — NeurIPS 2024:

XLand-MiniGrid: Scalable Meta-Reinforcement Learning Environments in JAX
Inspired by the diversity and depth of XLand and the simplicity and minimalism of MiniGrid, we present XLand-MiniGrid, a suite of tools and grid-world environments for meta-reinforcement learning research. Written in JAX, XLand-MiniGrid is designed to be highly scalable and can potentially run on GP…

Благодаря контекстному обучению с подкреплением модели быстро адаптируются к новым задачам, используя подсказки и контекст. При этом они не требуют длительного обучения с нуля, что позволяет ИИ эффективно взаимодействовать с окружающей средой и дообучаться на лету.

Теги:
Материал обновлен|

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от ГигаЧат 
1-bg-изображение-0
img-content-1-изображение-0

ГигаЧат: коротко о главном

Как изменился Код Дурова вместе с ГигаЧат?

Узнай о всех возможностях в FAQ-статье 
Совместное исследование Yandex B2B Tech и Университета ИТМО: 75% разработчиков уже используют ИИ-ассистенты при работе с кодом

ГигаЧат: коротко о главном

Совместное исследование Yandex B2B Tech и Университета ИТМО: 75% разработчиков уже используют ИИ-ассистенты при работе с кодом

Полная версия 
Google выпустила поисковое приложение для WindowsGoogle выпустила поисковое приложение для WindowsGoogle выпустила поисковое приложение для Windows

ГигаЧат: коротко о главном

Google выпустила поисковое приложение для Windows

Полная версия 

Реализовано через ГигаЧат 

Сейчас читают
Редакция рекомендует
Карьера
Блоги 417
Газпромбанк
OTP Bank
Т-Банк
X5 Tech
билайн
МТС
Сбер
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы