Когда поздно вечером Маск вернулся в Сан-Франциско, он наконец-то смог пообщаться со Шроффом, который рассказал о деталях проекта нейросетевого планировщика, над которым он работает. "Я думаю, что очень важно, чтобы я продолжал делать то, что я делаю", - сказал Шрофф. Выслушав его, Маск снова увлекся проектом и согласился. Он понял, что в будущем Tesla будет не только автомобильной компанией, но и компанией, занимающейся экологически чистой энергетикой. Благодаря системе полного самообучения, роботу Optimus и суперкомпьютеру машинного обучения Dojo она станет компанией с искусственным интеллектом, которая будет работать не только в виртуальном мире чат-ботов, но и в реальном мире заводов и дорог. Он уже думал о том, чтобы нанять группу специалистов по искусственному интеллекту для конкуренции с OpenAI, и команда нейросетевого планирования Tesla дополнит их работу.
В течение многих лет система автопилота Tesla основывалась на правилах. Она получала визуальные данные с камер автомобиля и определяла такие объекты, как разметка полосы движения, пешеходы, автомобили, сигналы светофора и все остальное в зоне видимости восьми камер. Затем программа применяла набор правил, таких как "Остановись, когда горит красный свет", "Проезжай, когда горит зеленый", "Держись середины полосы разметки", "Не пересекай двойные желтые линии на встречный транспорт", "Проезжай перекресток только тогда, когда на нем нет машин, которые могут тебя сбить" и т.д. Инженеры Tesla вручную написали и обновили сотни тысяч строк кода на языке C++, чтобы применить эти правила в сложных ситуациях.
Проект нейросетевого планировщика, над которым работал Шрофф, добавит новый слой. "Вместо того чтобы определять правильную траекторию движения автомобиля, основываясь только на правилах, - говорит Шрофф, - мы определяем правильную траекторию движения автомобиля, опираясь также на нейронную сеть, которая учится на миллионах примеров того, что делали люди". Другими словами, это подражание человеку. Нейронная сеть, столкнувшись с ситуацией, выбирает путь, основываясь на том, как поступали люди в тысячах аналогичных ситуаций. Это похоже на то, как человек учится говорить, водить машину, играть в шахматы, есть спагетти и делать почти все остальное: нам могут дать набор правил, которым мы должны следовать, но в основном мы приобретаем навыки, наблюдая за тем, как это делают другие люди. Именно такой подход к машинному обучению предполагал Алан Тьюринг в своей работе 1950 года "Вычислительные машины и интеллект".
Для обучения нейронных сетей компания Tesla располагала одним из крупнейших в мире суперкомпьютеров. Он работал на графических процессорах (GPU), производимых компанией Nvidia. Целью Маска на 2023 год был переход к использованию суперкомпьютера Dojo, который компания Tesla создавала с нуля, для использования видеоданных для обучения системы искусственного интеллекта. Благодаря чипам и инфраструктуре, разработанным специалистами Tesla, он обладает вычислительной мощностью почти в восемь экзафлопсов (1018 операций в секунду), что делает его самым мощным в мире компьютером для этих целей. Он будет использоваться как для программного обеспечения самодвижущихся автомобилей, так и для робота Optimus. "Интересно работать над ними вместе", - говорит Маск. "Они оба пытаются ориентироваться в мире".
К началу 2023 года проект нейросетевого планировщика проанализировал 10 млн. кадров видео, собранных из автомобилей клиентов Tesla. Означает ли это, что она будет просто не хуже, чем в среднем водители-люди? "Нет, потому что мы используем данные, полученные от людей, только в том случае, если они хорошо справились с ситуацией, - поясняет Шрофф. Люди, многие из которых находятся в Буффало (штат Нью-Йорк), оценивали видеозаписи и выставляли им оценки. Маск сказал им искать то, что "сделал бы пятизвездочный водитель Uber", и именно эти видеозаписи использовались для обучения компьютера.
Маск регулярно проходил по зданию Tesla в Пало-Альто, где инженеры, занимающиеся разработкой автопилота, сидели на открытом рабочем месте, и опускался рядом с ними на колени для импровизированных дискуссий. Однажды Шрофф продемонстрировал ему достигнутые успехи. Маск был впечатлен, но у него возник вопрос: Действительно ли необходим такой новый подход? Может быть, это излишество? Одна из его максим гласила: чтобы убить муху, не стоит использовать крылатую ракету, достаточно воспользоваться мухобойкой. Не является ли использование нейронной сети для планирования траекторий излишне сложным способом решения нескольких очень маловероятных проблем?