14 декабря 2024

eur = 110.48 1.92 (1.77 %)

btc = 101 625.00$ 1 575.66 (1.57 %)

eth = 3 916.13$ 26.69 (0.69 %)

ton = 6.34$ -0.05 (-0.71 %)

usd = 103.95 0.68 (0.66 %)

eur = 110.48 1.92 (1.77 %)

btc = 101 625.00$ 1 575.66 (1.57 %)

Форум

Учёные из Tinkoff Research открыли алгоритм, ускоряющий обучение ИИ в 20 раз

1 минута на чтение
Учёные из Tinkoff Research открыли алгоритм, ускоряющий обучение ИИ в 20 раз

Новый метод SAC-RND, открытый учёными из лаборатории исследований ИИ Tinkoff Research, обучает роботов в 20 раз быстрее и на 10% качественнее всех существующих аналогов, сообщили «Коду Дурова» в пресс-службе Тинькофф. Такие результаты показало тестирование метода на робототехнических симуляторах.

В Тинькофф отметили, что оптимизация обучения ИИ позволит ускорить развитие всех областей, в которых используются ИИ-агенты, например робототехники.

Также SAC-RND может повысить безопасность беспилотных автомобилей, упростить логистические цепочки, ускорить доставку и работу складов, оптимизировать процессы горения на энергетических объектах и сократить выбросы вредных веществ в окружающую среду.

Более того, открытие приближает учёных к созданию универсального робота, способного в одиночку выполнять любые задачи, подчеркнули в компании.

Объясняя суть открытия, в Тинькофф рассказали, что ранее использование случайных нейросетей (алгоритмов для последовательного и автоматического принятия решений, RND) считалось неподходящим для офлайн-обучения роботов с подкреплением. Однако учёные из Tinkoff Research обнаружили недостатки в проведённых ранее экспериментах и полученных в ходе них выводах.

К примеру, они исправили глубины используемых нейросетей (случайной и основной), сделав их эквивалентными — именно использование неправильных размеров сетей привело научное сообщество к ошибочному выводу, что метод RND не умеет дискриминировать (классифицировать) данные.

Кроме того, в Tinkoff Research оптимизировали метод — роботы научились приходить к эффективным решениям благодаря использованию механизма слияния, основанного на модуляции сигналов и их линейном отображении. В предыдущих работах на тему RND сигналы не подвергались дополнительной обработке.

Выше — визуализация принятия решения роботами, обученными с помощью разных алгоритмов. Рисунки сверху — предыдущие методы, основанные на RND, рисунки снизу — метод SAC-RND. Стрелки на изображении должны вести робота в одну точку — они указывают направление к правильному действию.

Результаты исследования были представлены на одной из крупнейших мировых ИИ-конференций — ICML в Гонолулу (Гавайи).

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
973c20aa-79d4-4842-97cf-4fc2ae0ff6bb-изображение-0

GigaChat Max: коротко о главном

Бывший исследователь OpenAI, который обвинил компанию в нарушении авторских прав, был найден мёртвым в своей квартире

Полная версия 
89556eef-b112-4a98-94f3-c9da3f058331-изображение-0b1b505c4-a199-4c3a-a7e3-acf8a89a681c-изображение-1

GigaChat Max: коротко о главном

В соцсеть X добавили кнопку «Объясни этот пост» с функцией анализа от чат-бота Grok

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Новости
Карьера
Блоги 301
Газпромбанк
МТС
Т-Банк
X5 Tech
Сбер
билайн
Яндекс Практикум
Ozon Tech
Циан
Банк 131