В одном из помещений лаборатории OpenAI, на верхнем этаже трехэтажного здания в Сан-Франциско, в районе Мишн, возле окна установлена рука с протянутой ладонью. Она очень похожа на человеческую руку, но только сделана из металла и твердого пластика и подключена к электричеству. Стоящая рядом женщина берет кубик Рубика и вкладывает его в ладонь этой механической руки. Рука начинает двигаться, осторожно вращая грани кубика всеми пятью пальцами. При каждом движении кубик балансирует на кончиках пальцев, и, кажется, рука его вот-вот уронит. Но этого не происходит. По прошествии некоторого времени, цвета на кубике начинают упорядочиваться: красный рядом с красным, желтый рядом с желтым, синий рядом с синим. Примерно через четыре минуты рука поворачивает кубик в последний раз: готово! В небольшой группе исследователей, наблюдающих за процессом, раздаются восторженные восклицания.
Работавшие под руководством Войцеха Зарембы, польского исследователя, который сразу после основания OpenAI перешел туда из Facebook, инженеры и программисты потратили более двух лет на то, чтобы добиться этого впечатляющего результата. В прошлом уже многие создавали роботов, которые могли собрать кубик Рубика. Некоторым устройствам удавалось справиться с этой задачей менее чем за секунду. Но здесь была важная особенность. Это была механическая рука, которая двигалась как рука человека, а не специализированное оборудование, созданное исключительно для сборки кубика Рубика. Обычно инженеры программируют поведение роботов с кропотливой методичностью, тратя месяцы на определение сложных правил для каждого крошечного движения. Но потребуются десятилетия, может быть, даже столетия, чтобы инженеры могли по отдельности определить и запрограммировать каждое элементарное движение, которое потребуется пятипалой руке для сборки кубика Рубика. Заремба и его команда создали систему, которая могла освоить эти движения самостоятельно. Они принадлежат к новому сообществу ученых, которые верят в то, что роботы способны овладеть практически любыми навыками в виртуальной реальности, прежде чем применять их в реальном мире.
Чтобы добиться этого, они сначала создали виртуальную имитацию руки и куба. Внутри этой виртуальной реальности рука училась собирать кубик методом проб и ошибок. Она потратила десять тысяч лет (в эквиваленте), вращая грани туда-сюда и замечая, какие движения эффективны, а какие нет. Дополнительным усложняющим фактором было то, что на протяжении этих десяти тысяч виртуальных лет сам виртуальный мир постоянно менялся. Заремба и его команда неоднократно меняли размер пальцев и цвета куба, а также силу трения между гранями и даже цвета в пустом пространстве за кубом. Это призвано было гарантировать, что, когда они перенесут весь этот виртуальный опыт в реальный мир, реальная рука сможет совладать с любыми неожиданностями. Она сможет справиться с непредсказуемостью физического мира, с которой люди справляются легко, а машины зачастую не могут. К осени 2019 года роботизированная рука OpenAI могла собрать кубик Рубика и со связанными вместе двумя пальцами, и в резиновой перчатке, и когда кто-то мешал ей, подталкивая кубик мордой игрушечного жирафа.
С 2015 по 2017 год компания Amazon проводила ежегодный конкурс для специалистов по робототехнике. В последний год этого международного конкурса в нем участвовали семьдесят пять научных лабораторий, каждая из которых работала над созданием роботизированной системы, способной решить проблему, стоявшую перед глобальной складской сетью Amazon: проблему