ИИ впервые без участия человека научился собирать кубик Рубика

Игорь Савкин

18 июня, 20181 минута на чтение

Читать первым в Telegram-канале

Специалисты Калифорнийского университета представили алгоритм DeepCube, который умеет определять оптимальный способ решения головоломки. Они разработали новый метод машинного обучения — метод автодидактических итераций (autodidactic iteration, ADI). В этом случае алгоритм сам выстраивает для себя систему вознаграждений.

2018-06-16

DeepCube собирает кубик Рубика в 100 % случаев из произвольной позиции примерно за 30 шагов. Примерно такой же уровень показывают модели, натренированные человеком.

Эрно Рубик изобрел эту головоломку в 1974 году и спустя несколько месяцев даже представил алгоритм для сборки кубика из любой конфигурации. Но попытки автоматизировать процесс всегда опирались на правила, созданные человеком. ИИ не мог самостоятельно найти способ решить задачу такого рода.

В случае с шахматами и Го система вначале обучалась правилам, а затем играла сама с собой, получая от человека вознаграждения за удачные ходы. С кубиком Рубика в этом отношении сложнее. Определить, удачен ход или нет, трудно, поскольку сам человек плохо понимает, насколько новая конфигурация кубика близка к решению.

С методом автодидактических итераций система сама оценивает ходы. Для этого она «раскручивает» собранный кубик назад, пытаясь добиться конфигурации, похожей на текущую, и таким образом понимает, какой ход лучше или хуже. Натренированная модель затем использует стандартное дерево поиска для вычисления шагов к каждой конфигурации.

Источник: tproger.ru

Подписывайтесь на «Код Дурова» в Telegram и во «ВКонтакте», чтобы всегда быть в курсе интересных новостей!

Подписывайтесь на Telegram-канал

@D_CODE

Реклама. ИП Даллакян Г.А. 2VtzqvPHPsd

[Приватность][реклама на kod.ru]

Подписывайтесь на Telegram-канал

@D_CODE

Реклама. ИП Даллакян Г.А. 2VtzqvPHPsd

[Приватность][реклама на kod.ru]

18 июня, 2018

ИИ впервые без участия человека научился собирать кубик Рубика

Картина дня

Обзор Lunnen Ground 15: недорогой ультрабук от Яндекса

Обзор Honor Magic 6 Pro: сила и мощь, но не всё так идеально

Обзор Lunnen Ground 15: недорогой ультрабук от Яндекса

Итоги конференции Data Fusion 2024: что делать с большими данными и ИИ?

«ИИ становится похож на Гомера Симпсона»: в чём его главная проблема? Репортаж с Data Fusion 2024

Обзор Honor Magic 6 Pro: сила и мощь, но не всё так идеально

Обзор Lunnen Ground 15: недорогой ультрабук от Яндекса

Обзор Lunnen Ground 15: недорогой ультрабук от Яндекса

Количество атак на мобильные устройства в РФ увеличилось в 5,2 раза

Внесена новая редакция законопроекта о трансграничных расчётах в криптовалютах

Роскомнадзор блокирует около 150 VPN

В России хотят маркировать товары параллельного импорта

Карьера

Пусть сессия боится нас: в билайне знают, как покорять зачеты

Реальные истории реальных людей: что объединяет сотрудников билайна

Пусть сессия боится нас: в билайне знают, как покорять зачеты

С нуля до Big Data: история дата-аналитика в билайне

Как эффективно прожить последние годы в универе: юные билайновцы рекомендуют

Реальные истории реальных людей: что объединяет сотрудников билайна

Пусть сессия боится нас: в билайне знают, как покорять зачеты

Пусть сессия боится нас: в билайне знают, как покорять зачеты

Яндекс Практикум ищет автора на курс «Архитектура ПО» (удалёнка, парт-тайм)

Яндекс Практикум ищет автора на курс «Системный администратор» (удалёнка, парт-тайм)

Яндекс Практикум ищет наставника на курс «DevOps» (удалёнка, парт-тайм)

Яндекс Практикум ищет наставника на курс «Системный администратор» (удалёнка, парт-тайм)

Газпромбанк запускает GPB.Level Up: Data Science

Блоги 208

ИИ впервые без участия человека научился собирать кубик Рубика

Картина дня

Свежие материалы

Обзор Lunnen Ground 15: недорогой ультрабук от Яндекса

Обзор Honor Magic 6 Pro: сила и мощь, но не всё так идеально

Обзор Lunnen Ground 15: недорогой ультрабук от Яндекса

Итоги конференции Data Fusion 2024: что делать с большими данными и ИИ?

«ИИ становится похож на Гомера Симпсона»: в чём его главная проблема? Репортаж с Data Fusion 2024

Обзор Honor Magic 6 Pro: сила и мощь, но не всё так идеально

Обзор Lunnen Ground 15: недорогой ультрабук от Яндекса

Обзор Lunnen Ground 15: недорогой ультрабук от Яндекса

Свежие новости

Количество атак на мобильные устройства в РФ увеличилось в 5,2 раза

Внесена новая редакция законопроекта о трансграничных расчётах в криптовалютах

Роскомнадзор блокирует около 150 VPN

В России хотят маркировать товары параллельного импорта

Карьера

Свежие материалы

Пусть сессия боится нас: в билайне знают, как покорять зачеты

Реальные истории реальных людей: что объединяет сотрудников билайна

Пусть сессия боится нас: в билайне знают, как покорять зачеты

С нуля до Big Data: история дата-аналитика в билайне

Как эффективно прожить последние годы в универе: юные билайновцы рекомендуют

Реальные истории реальных людей: что объединяет сотрудников билайна

Пусть сессия боится нас: в билайне знают, как покорять зачеты

Пусть сессия боится нас: в билайне знают, как покорять зачеты

Свежие вакансии

Яндекс Практикум ищет автора на курс «Архитектура ПО» (удалёнка, парт-тайм)

Яндекс Практикум ищет автора на курс «Системный администратор» (удалёнка, парт-тайм)

Яндекс Практикум ищет наставника на курс «DevOps» (удалёнка, парт-тайм)

Яндекс Практикум ищет наставника на курс «Системный администратор» (удалёнка, парт-тайм)

Газпромбанк запускает GPB.Level Up: Data Science

Блоги 208