16 марта 2025

eur = 93.61 -0.65 (-0.69 %)

btc = 84 243.00$ - 283.57 (-0.34 %)

eth = 1 932.34$ 13.23 (0.69 %)

ton = 3.55$ 0.62 (21.04 %)

usd = 85.57 -1.05 (-1.21 %)

eur = 93.61 -0.65 (-0.69 %)

btc = 84 243.00$ - 283.57 (-0.34 %)

ИИ впервые без участия человека научился собирать кубик Рубика

1 минута на чтение
ИИ впервые без участия человека научился собирать кубик Рубика

Специалисты Калифорнийского университета представили алгоритм DeepCube, который умеет определять оптимальный способ решения головоломки. Они разработали новый метод машинного обучения — метод автодидактических итераций (autodidactic iteration, ADI). В этом случае алгоритм сам выстраивает для себя систему вознаграждений.

2018-06-16

DeepCube собирает кубик Рубика в 100 % случаев из произвольной позиции примерно за 30 шагов. Примерно такой же уровень показывают модели, натренированные человеком.

Эрно Рубик изобрел эту головоломку в 1974 году и спустя несколько месяцев даже представил алгоритм для сборки кубика из любой конфигурации. Но попытки автоматизировать процесс всегда опирались на правила, созданные человеком. ИИ не мог самостоятельно найти способ решить задачу такого рода.

В случае с шахматами и Го система вначале обучалась правилам, а затем играла сама с собой, получая от человека вознаграждения за удачные ходы. С кубиком Рубика в этом отношении сложнее. Определить, удачен ход или нет, трудно, поскольку сам человек плохо понимает, насколько новая конфигурация кубика близка к решению.

С методом автодидактических итераций система сама оценивает ходы. Для этого она «раскручивает» собранный кубик назад, пытаясь добиться конфигурации, похожей на текущую, и таким образом понимает, какой ход лучше или хуже. Натренированная модель затем использует стандартное дерево поиска для вычисления шагов к каждой конфигурации.

Источник: tproger.ru

Подписывайтесь на «Код Дурова» в Telegram и во «ВКонтакте», чтобы всегда быть в курсе интересных новостей!

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
8c677995-decd-4be9-aa2c-610ecbdaeb07-изображение-0

GigaChat Max: коротко о главном

Утечка из Apple показала кризис в разработке новой Siri

Полная версия 
9ac3df55-9de4-4992-b7fd-a58237c56b12-изображение-0bdd0292e-81b5-4f4e-89ec-3b6bf024b456-изображение-1

GigaChat Max: коротко о главном

Telegram будет замораживать аккаунты пользователей за нарушение правил

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 322
билайн
Газпромбанк
МТС
X5 Tech
Т-Банк
Сбер
Яндекс Практикум
Ozon Tech
Циан
Банк 131