9 декабря 2024

eur = 106.30 -3.48 (-3.17 %)

btc = 98 543.00$ -1 176.90 (-1.18 %)

eth = 3 889.42$ -90.42 (-2.27 %)

ton = 6.55$ -0.23 (-3.46 %)

usd = 99.42 -3.96 (-3.83 %)

eur = 106.30 -3.48 (-3.17 %)

btc = 98 543.00$ -1 176.90 (-1.18 %)

Форум

Российские учёные создали первую открытую среду для быстрого контекстного обучения с подкреплением

2 минуты на чтение
Российские учёные создали первую открытую среду для быстрого контекстного обучения с подкреплениемКак видит новость Kandinsky

Виртуальная среда XLand-MiniGrid, в которой ИИ обучается принимать решения и выполнять новые действия, создана группой учёных из лаборатории научных исследований искусственного интеллекта T-Bank AI Research и Института AIRI при участии студентов из МФТИ, Сколтеха и Иннополиса.

Сообщается, что XLand-MiniGrid создана на базе JAX — технологии для разработки высокопроизводительных программ — и способна выполнять миллиарды операций в секунду.

В ней собрано 100 млрд примеров действий искусственного интеллекта в 30 тысячах задач, что позволяет использовать готовые датасеты для обучения, а не проводить его каждый раз с нуля.

«Мы пришли в область контекстного обучения с подкреплением, когда она еще зарождалась, и поэтому не нашли ни одного подходящего инструмента для оценки новых идей. Стало понятно, что это проблема для многих специалистов, а значит, она должна быть решена одной из первых. Поэтому появился XLand-MiniGrid», — отметил Вячеслав Синий, исследователь научной группы AI Alignment, лаборатория исследований искусственного интеллекта T-Bank AI Research.

Среда опубликована в открытом доступе —  в ней уже провели эксперименты исследователи из Google DeepMind, Калифорнийского университета в Беркли и Оксфордского университета. Кроме того, научная статья, описывающая создание среды, была принята на крупнейшую международную конференцию в области ИИ — NeurIPS 2024:

XLand-MiniGrid: Scalable Meta-Reinforcement Learning Environments in JAX
Inspired by the diversity and depth of XLand and the simplicity and minimalism of MiniGrid, we present XLand-MiniGrid, a suite of tools and grid-world environments for meta-reinforcement learning research. Written in JAX, XLand-MiniGrid is designed to be highly scalable and can potentially run on GP…

Благодаря контекстному обучению с подкреплением модели быстро адаптируются к новым задачам, используя подсказки и контекст. При этом они не требуют длительного обучения с нуля, что позволяет ИИ эффективно взаимодействовать с окружающей средой и дообучаться на лету.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
9148e401-6688-4cf2-9548-8907f697ddf3-изображение-0

GigaChat Max: коротко о главном

Против Apple подали коллективный иск из-за хранения в iCloud материалов с насилием

Полная версия 
4fe47474-b451-416d-802a-3c3bba1576e5-изображение-0dcdbc098-916a-4734-b671-9685307281dc-изображение-1946bff33-3a49-4b67-9583-a0952b9f95d6-изображение-2

GigaChat Max: коротко о главном

Исследование T-Pay: в России Android популярнее iOS, а больше всего владельцев iPhone в Дагестане и Чечне

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 299
Газпромбанк
МТС
Т-Банк
X5 Tech
Сбер
билайн
Яндекс Практикум
Ozon Tech
Циан
Банк 131