Одним воскресным днем в июне 2015 года Джеки Алсине сидел у себя в комнате, которую он делил со своим младшим братом, прокручивая длинный поток твитов, посвященных вручению премий от телеканала Black Entertainment Television. В их квартире в бруклинском микрорайоне Краун-Хайтс кабельного телевидения не было, и поэтому саму церемонию награждения он смотреть не мог, но, по крайней мере, мог читать текущие комментарии в Twitter на своем ноутбуке. В это время подруга прислала ему интернет-ссылку на несколько фотоснимков, которые она разместила в новой версии сервиса Google Photos. Сам Алсине, двадцатидвухлетний инженер-программист, уже пользовался этим сервисом в прошлом, но новую версию, вышедшую только несколькими днями ранее, еще не испытывал. Новая система Google Photos способна анализировать ваши снимки и автоматически сортировать их в виртуальные папки на основе того, что было изображено на каждом из них. Одна и та же фотография может попасть сразу в несколько папок, «собаки», «день рождения» и «отдых на пляже». Потом вам легко находить интересующие вас фотографии по тегам. Если вы наберете «надгробие», Google автоматически найдет все фотографии с надгробием. Когда Алсине прошел по ссылке и открыл сервис, он не мог не заметить, что его собственные фотографии уже были реорганизованы – и одна из папок называлась «гориллы». Ему показалось это странным, поэтому он открыл папку и обнаружил там более восьмидесяти фотографий своей подруги, которые он сделал почти год назад во время концерта в близлежащем Проспект-парке. Его подруга была афроамериканкой, и система Google назвала ее «гориллой».
Он мог бы закрыть на это глаза, если бы Google по ошибке пометила таким тегом только одну фотографию. Но речь шла о
Проблема заключалась в том, что специалисты Google обучили нейронную сеть распознавать горилл, показывая ей тысячи фотографий с гориллами и не думая о возможных побочных эффектах. Нейронные сети способны осваивать масштабные задачи, которые инженеры никогда не смогли бы запрограммировать своими силами, но при обучении этих систем бремя выбора правильных исходных данных ложится на инженеров. Более того, когда обучение закончено, даже если эти инженеры были при выборе данных предельно осторожны и внимательны, они не могут знать всего, чему научилась машина – просто в силу масштабности этого обучения, связанного с гигантским количеством входных данных и вычислений. Джеки Алсине сам работает инженером-программистом и проблему понимает. Он сравнивает это с приготовлением лазаньи. «Если ингредиенты никудышные, хорошую лазанью не сделаешь», – говорит он. – То же самое и с ИИ. Нужно быть очень внимательным в том, какие данные ты в него вводишь, потому что потом дать задний ход очень трудно».
На групповой фотографии членов команды Google Brain477, сделанной сразу после публикации «Статьи о кошках» летом 2012 года, когда Джефф Хинтон официально числился в лаборатории стажером (шестидесятичетырехлетним), они с Джеффом Дином держат гигантское цифровое изображение кошки, а вокруг них толпится примерно дюжина других исследователей. В их числе был и Мэтт Зилер, молодой человек в черной рубашке-поло с короткими рукавами и выцветших синих джинсах, широко улыбающийся, с лохматой шевелюрой и многодневной щетиной на подбородке. Зейлер был аспирантом в лаборатории глубокого обучения в Нью-Йоркском университете и тем же летом проходил стажировку в Google Brain. Год спустя он выиграл конкурс ImageNet, пойдя по стопам Хинтона, Крижевского и Суцкевера. В этом самом горячем цехе технологической индустрии многие чествовали его как рок-звезду. Алан Юстас предложил ему работу в Google и большие деньги, но Зилер отверг это предложение, чтобы открыть свою собственную компанию.