1 сентября 2025

eur = 94.05 0.56 (0.60 %)

btc = 108 999.00$ 209.61 (0.19 %)

eth = 4 366.12$ - 102.65 (-2.30 %)

ton = 3.11$ -0.05 (-1.61 %)

usd = 80.33 0.04 (0.05 %)

eur = 94.05 0.56 (0.60 %)

btc = 108 999.00$ 209.61 (0.19 %)

ИИ впервые без участия человека научился собирать кубик Рубика

1 минута на чтение
ИИ впервые без участия человека научился собирать кубик Рубика

Специалисты Калифорнийского университета представили алгоритм DeepCube, который умеет определять оптимальный способ решения головоломки. Они разработали новый метод машинного обучения — метод автодидактических итераций (autodidactic iteration, ADI). В этом случае алгоритм сам выстраивает для себя систему вознаграждений.

2018-06-16

DeepCube собирает кубик Рубика в 100 % случаев из произвольной позиции примерно за 30 шагов. Примерно такой же уровень показывают модели, натренированные человеком.

Эрно Рубик изобрел эту головоломку в 1974 году и спустя несколько месяцев даже представил алгоритм для сборки кубика из любой конфигурации. Но попытки автоматизировать процесс всегда опирались на правила, созданные человеком. ИИ не мог самостоятельно найти способ решить задачу такого рода.

В случае с шахматами и Го система вначале обучалась правилам, а затем играла сама с собой, получая от человека вознаграждения за удачные ходы. С кубиком Рубика в этом отношении сложнее. Определить, удачен ход или нет, трудно, поскольку сам человек плохо понимает, насколько новая конфигурация кубика близка к решению.

С методом автодидактических итераций система сама оценивает ходы. Для этого она «раскручивает» собранный кубик назад, пытаясь добиться конфигурации, похожей на текущую, и таким образом понимает, какой ход лучше или хуже. Натренированная модель затем использует стандартное дерево поиска для вычисления шагов к каждой конфигурации.

Источник: tproger.ru

Подписывайтесь на «Код Дурова» в Telegram и во «ВКонтакте», чтобы всегда быть в курсе интересных новостей!

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
Состояние богатейших россиян выросло более чем на $24 млрд

GigaChat Max: коротко о главном

Состояние богатейших россиян выросло более чем на $24 млрд

Полная версия 
В Москве пользователей каршеринга обязали проходить проверку личности

GigaChat Max: коротко о главном

В Москве пользователей каршеринга обязали проходить проверку личности

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Редакция рекомендует
Карьера
Блоги 408
Т-Банк
Газпромбанк
OTP Bank
X5 Tech
билайн
МТС
Сбер
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы