Мы проговорили каждый шаг, который выполняли наши маркировщики, чтобы определить, классифицировать и маркировать каждое изображение, упрощая его, где только можно, с помощью быстрых клавиш и специальных инструментов. Если процесс занимал три клика, Цзя находил способ сделать это за один. Меньше набора текста. Более короткие движения мышью. Все быстрее. Пока мы разговаривали, я поймал себя на том, что изучаю предметы на столе, молча размышляя, есть ли они среди наших двадцати двух тысяч категорий. Несомненно, там будет запись "салфетка", но различаем ли мы тканевые и бумажные салфетки? Что это был за нож? Сколько разновидностей может быть помимо, скажем, "ножа для стейка" и "ножа для масла"? "Мясницкие ножи", - предположил я. "Хлебные ножи"? Может быть. Их действительно было много, если подумать. А у нас они все есть? Я сделал мысленную заметку проверить, когда мы вернемся в лабораторию.
"Кстати, ты знаешь, что такое динамический IP, Фей-Фей?"
Еще один трюк в рукаве Цзя.
"Считайте, что это промежуточный шаг между нашими машинами и серверами Google. Наши лабораторные компьютеры остаются на месте, но динамический IP соединяет нас с посредниками, которые постоянно меняются, поэтому Google думает, что они поступают от разных пользователей".
"И это позволит нам не превысить лимит?"
"Далеко под ним".
Мы снова были в деле, по крайней мере в некоторой степени. Маркировка все еще оставалась проблемой, но мы с облегчением наблюдали за тем, как возобновляется поставка изображений кандидатов. Даже незначительные победы теперь стоило праздновать.
С течением месяцев ImageNet просочилась в мою душу, став линзой, через которую я видел почти все. Будь то работа в лаборатории или прогулка по площади, моя личная игра в визуальную идентификацию продолжалась. Если я видел, что кто-то выгуливает незнакомую мне породу собак, я задавался вопросом, не выделили ли мы для нее подкатегорию. Если бы я увидел студента, катающегося на одноколесном велосипеде, я бы задумался, есть ли вообще такая категория, не говоря уже о разных видах одноколесных велосипедов. Да и вообще, существуют ли разные виды одноколесных велосипедов? Гаражная распродажа, которую любил мой отец, стала моим миром. Все было раздуто до непостижимых масштабов, но дух был тот же - неутолимое любопытство, жажда новизны. Я задавался вопросом, есть ли в нашей семье такой ген.
Борьба продолжалась, каждый шаг делался в ответ на новую загадку. Когда мы обнаруживали, что изображения в той или иной категории слишком похожи друг на друга, тем самым уменьшая искомое разнообразие, мы использовали международные переводы WordNet, чтобы отправить запрос на разных языках в надежде, что изображения со всего мира будут более разнообразными. Когда мы не могли найти достаточно изображений, мы добавляли к поисковому запросу смежные термины, превращая "корги" в "щенок корги" или "собачий парк корги". А когда поисковые системы незаметно меняли макеты своих страниц результатов, тем самым изменяя расположение ссылок на каждое изображение и ломая одну из многочисленных программ автозагрузки Цзя, мы перепрограммировали их, чтобы они соответствовали, и стали регулярно проверять наличие таких изменений.
Для парня, который всего за год до этого занимался проектированием микропроцессорных архитектур, это были ужасно прозаические инженерные задачи. Тем не менее мы оба знали, что наши усилия служат чему-то стоящему. Пусть это были пластыри, упрощенные и зачастую грубые, но каждый из них приближал нас к видению целого мира, обнаженного для того, чтобы машины могли его увидеть, а вскоре, я надеялся, и понять.
"Пенне?" спросил я.
"Очень хорошо!" восхищенно ответил Сильвио, ставя передо мной еще дымящуюся миску с макаронами.
"Но подождите, а что у нас было на прошлой неделе? Он тоже был в форме трубки, но больше, и края не были обрезаны по диагонали".
"Это были ригатони".
"Точно! Да! "Ригатони". Мне тоже понравилось".
"Вы спрашиваете, потому что на самом деле интересуетесь кухней моей страны? Или потому, что вам интересно, достаточно ли в ImageNet видов макарон?"
Я откусила кусочек, чтобы отложить ответ на вопрос, пока он садился и скрещивал руки, явно гордясь своими детективными навыками.
"Это не может быть и то, и другое?" наконец ответила я.
Прошел год работы над ImageNet, и мне казалось, что мы достигли своего успеха. Благодаря работе нашей команды по маркировке и бесконечным усилиям Цзя по оптимизации процесса, я был уверен, что мы, по крайней мере, достигли цели. Мне было интересно, как у нас идут дела, и, как это часто бывает, Цзя понял, о чем я думаю.
"Интересно, сколько времени теперь потребуется для завершения работы над ImageNet? Я пересчитал нашу смету".
Я как раз собиралась спросить. Взволнованная, я поспешила к его столу.
"Итак, принимая во внимание все: все наши оптимизации, короткие пути, плюс изображения, которые мы уже пометили, нам удалось сократить это девятнадцатилетнее ETA до..."
У меня вдруг сдали нервы. Это будет плохо. Я чувствовал это.
"... около восемнадцати лет".