Шрофф продемонстрировал на примере Musk примеры, в которых нейросетевой планировщик работает лучше, чем подход, основанный на правилах. В демонстрационном примере была показана дорога, захламленная мусорными баками, упавшими дорожными конусами и случайным мусором. Автомобиль, управляемый нейросетевым планировщиком, мог объезжать препятствия, пересекая полосы движения и нарушая при необходимости некоторые правила. "Вот что происходит, когда мы переходим от правил к сетевому планированию пути", - сказал ему Шрофф. "Машина никогда не столкнется с препятствиями, если вы включите эту штуку, даже в неструктурированной среде". Именно такой прыжок в будущее привел Маска в восторг. "Мы должны провести демонстрацию в стиле Джеймса Бонда, - сказал он, - когда со всех сторон взрываются бомбы и с неба падает НЛО, а автомобиль проносится мимо, ни во что не врезаясь".
Системам машинного обучения, как правило, требуется цель или метрика, которой они руководствуются в процессе самообучения. Маск, который любит управлять, определяя, какие показатели должны быть главными, дал им ориентир: количество километров, которые автомобили с системой полного самообучения Tesla смогли проехать без вмешательства человека. "Я хочу, чтобы последние данные по количеству миль на вмешательство были стартовым слайдом на каждом нашем совещании", - распорядился он. "Если мы обучаем ИИ, что мы оптимизируем? Ответ - увеличение пробега между вмешательствами". Он посоветовал им сделать это как видеоигру, где каждый день можно видеть свой результат. "Видеоигры без счета скучны, поэтому будет мотивирующим наблюдать каждый день за тем, как увеличивается количество миль за вмешательство".
Члены команды установили в своем рабочем пространстве массивные восьмидесятипятидюймовые телевизионные мониторы, на которых в режиме реального времени отображалось, сколько километров в среднем проезжают автомобили FSD без вмешательства. Если они видели, что тот или иной тип вмешательства повторяется - например, водитель хватается за руль во время смены полосы движения, слияния или поворота на сложном перекрестке, - они работали как с правилами, так и с нейросетевым планировщиком, чтобы исправить ситуацию. Рядом с их рабочими столами был установлен гонг, и каждый раз, когда они успешно решали проблему, вызвавшую вмешательство, они должны были бить в гонг.
Тест-драйв искусственного интеллекта
К середине апреля 2023 года Маску пришло время испытать новый нейросетевой планировщик. Он отправился на нем в поездку по Пало-Альто. Шрофф и команда Autopilot сконфигурировали автомобиль таким образом, чтобы он полагался на программное обеспечение, обученное нейронной сетью имитировать вождение человека. Программа содержала лишь минимум традиционного кода, основанного на правилах.
Маск сел в водительское кресло рядом с Ашоком Эллюсвами, директором Tesla по программному обеспечению Autopilot ( ). Шрофф сел сзади вместе с двумя другими членами своей команды, Мэттом Баучем и Крисом Пейном. Эта троица работала за соседними столами в Tesla в течение восьми лет, и все они жили в нескольких кварталах друг от друга в Сан-Франциско. На столах, где у большинства людей стоит семейная фотография, у каждого из них были идентичные снимки, на которых они втроем позировали на вечеринке в честь Хэллоуина. Джеймс Маск был четвертым членом их команды, пока его дядя не возглавил Twitter и не перевел его туда, чего Шроффу удалось избежать.
Приготовившись к выезду с парковки офисного комплекса Tesla в Пало-Альто, Маск выбрал на карте место, куда должен отправиться автомобиль, нажал на кнопку Full Self-Driving и убрал руки с руля. Когда автомобиль свернул на главную дорогу, возникла первая пугающая проблема: навстречу ехал велосипедист. "Мы все затаили дыхание, ведь велосипедисты могут быть непредсказуемы", - говорит Шрофф. Но Маск проявил беспечность и не попытался схватиться за руль. Машина сама уступила дорогу. "Это было похоже на то, как поступил бы водитель-человек", - говорит Шрофф.
Шрофф и его коллеги подробно рассказали о том, как используемое ими программное обеспечение FSD было обучено на миллионах видеоклипов, собранных с камер на автомобилях клиентов. В результате был создан гораздо более простой программный комплекс, чем традиционный, основанный на тысячах правил, сформулированных человеком. "Он работает в десять раз быстрее и в перспективе может позволить удалить 300 000 строк кода", - сказал Шрофф. Бауч сказал, что это похоже на то, как если бы ИИ-бот играл в очень скучную видеоигру". Маск издал смешок. Затем, когда автомобиль самостоятельно двинулся по дороге, он достал свой телефон и начал писать в Твиттере.