Сначала был хаос. «Это был сплошной беспорядок, – говорит Левин, – ужасный беспорядок». По совету Крижевского, они держали роботов в рабочем состоянии круглосуточно и установили камеру, которая позволяла видеть, что происходит в комнате. За ночь и в выходные дни роботы устраивали в помещении настоящий кавардак. В понедельник утром ученые заходили в лабораторию и обнаруживали, что пол завален всякой всячиной, словно в детской комнате. Однажды утром они, войдя, обнаружили, что одна корзина была словно кровью забрызгана. Оказалось, с тюбика помады сорвался колпачок, и рука всю ночь пыталась этот тюбик поднять, но безуспешно. Но именно это и хотел видеть Левин. «Это замечательно, – говорит он. – Если комната выглядит так, словно ее разгромили безумцы, значит, мы на правильном пути». По прошествии нескольких недель эти руки – ставшие почти нежными – научились поднимать все, что находилось перед ними.
Это стало началом широкомасштабных усилий по применению технологии глубокого обучения в робототехнике, в которых участвовали лаборатории многих ведущих университетов, а также Google и OpenAI. В следующем году, используя тот же метод обучения с подкреплением, Левин и его команда обучили уже другие руки самостоятельно открывать двери (при условии, что дверные ручки можно было ухватить двумя пальцами). В начале 2019 года лаборатория представила роботизированную руку599, которая умела собирать случайные предметы, а затем аккуратно складывать их в небольшой контейнер, расположенный на небольшом расстоянии. Обучение длилось всего четырнадцать часов600, и руке удавалось опускать предметы в нужный контейнер примерно в 85 процентах случаев. Когда исследователи самолично попытались выполнить ту же задачу, их результат составил лишь 80 процентов. Но, добившись некоторого прогресса в этой работе, лаборатория OpenAI решила изменить курс. Войцех Заремба и его команда считали, что обучение системы в физическом мире обходится слишком дорого и требует слишком много времени, поскольку задачи становятся все более сложными. Поэтому они перенесли обучение в виртуальную реальность, построив систему, которая научилась собирать кубик Рубика методом проб и ошибок в виртуальном мире, потратив на это время, эквивалентное многим столетиям физического мира.
Илон Маск и другие основатели OpenAI видели в своей лаборатории ответ DeepMind. С самого начала их цель заключалась в том, чтобы достигать чрезвычайно высоких целей, которые могут легко измерены, легко поняты и которые гарантированно привлекут внимание, даже если они на самом деле не приносят никакой практической пользы. Лаборатория размещалась в Сан-Франциско, над маленькой шоколадной фабрикой в районе Мишн, и ее сотрудники, с Зарембой во главе, неделями гуляли по этому старому, но стремительно молодеющему латиноамериканскому району, обсуждая, какую же высокую цель им поставить перед собой. В конце концов они остановились на двух целях, решив создать систему, которая могла бы победить лучших игроков мира в трехмерной компьютерной игре под названием Dota, и пятипалую роботизированную руку, которая могла бы собрать кубик Рубика. Для того и другого требовался огромный технологический скачок. Оба эти достижения не остались бы без внимания, и для OpenAI это было еще способом продвинуть себя, поскольку для продолжения исследований им нужны были деньги и талантливые кадры. Технологии, разрабатываемые в таких лабораториях, как OpenAI, обходятся дорого – как с точки зрения оборудования, так и с точки зрения персонала, – а это значит, что без завораживающих внимание демонстраций им не обойтись.
Это вообще фирменный стиль Маска: привлекать внимание к себе и ко всему, что он делает. Какое-то время это относилось и к OpenAI – когда лаборатория наняла несколько самых громких имен в сфере разработок ИИ. Среди них был и бывший научный руководитель Сергея Левина в Калифорнийском университете в Беркли, гладко выбритый, рослый – под метр девяносто – бельгийский специалист по робототехнике Питер Аббил. Бонус Аббила за подписание контракта с OpenAI составил 100 000 долларов, а в качестве зарплаты за последние шесть месяцев 2016 года он получил 330 000 долларов601. Трое бывших учеников Аббила также присоединились к OpenAI, и это помогло лаборатории бросить вызов Google Brain, Facebook, а особенно DeepMind. Но в скором времени Маску и его новой лаборатории пришлось столкнуться с суровыми реалиями жизни.