Читаем The Worlds I See полностью

Следующая презентация была посвящена более обширному, неординарному вопросу: что нас ждет, если мы двинемся в противоположном направлении и углубимся в ветви? Что сделают наши алгоритмы с более тонким и сложным миром, чем тот, для понимания которого они были созданы?

Джон встал рядом, чтобы ответить. Мягко воспитанный житель Огайо, который, казалось, чувствовал себя как дома в футболке и шортах-карго, он разделял спокойную манеру поведения Цзя, но выражал ее более причудливым образом; например, он быстро стал известен своим увлечением красными пандами и постоянно держал распечатку с изображением этого животного над монитором своего рабочего места. Но он не был назойливым и, как лучшие исследователи в моей лаборатории, твердо отстаивал свое мнение, когда чувствовал необходимость заявить о себе.

Щелчок - и на экране появилось разделенное изображение. На одной стороне была фотография автомобиля, а на другой - его эквивалент, созданный конструкторами с помощью компьютерного проектирования (CAD). Затем второе изображение накладывалось на первое, и цифровые красные линии обрисовывали контуры решетки радиатора, окон и кузовных панелей реального автомобиля, выделяя те особенности, которые классификатор должен был распознать, чтобы определить точную модель.

"Машины?" - спросил кто-то.

"О, просто подождите", - ответил Джон со знающей ухмылкой.

Он не шутил. Это был наш первый взгляд на тему, которая оказалась гораздо серьезнее, чем мы думали.

Я всегда считал, что истинный вклад ImageNet заключается в его двойственной природе. Его гигантский масштаб был мощным благодаря онтологической иерархии, которая его организовывала, а его онтология была мощной, потому что она была такой большой и всеобъемлющей, охватывая такой разнообразный спектр категорий. Ни одно из этих достоинств не было бы достаточным само по себе. Но, как и сам размер, такое понятие, как "категория", является относительным. Как показала техника хеджирования, обоснованные категориальные ответы могут быть найдены на разных уровнях глубины, в зависимости от задаваемого вопроса. Чем глубже уровень, тем ближе друг к другу сползают понятия, разделенные все меньшим количеством деталей. Вещь. Живая вещь. Растение. Дерево. Клен. Acer pseudoplatanus.

Однако ImageNet оказался не таким уж образцом обширности и детализации, каким казался. Хотя некоторые категории были исключительно тонкими - деревья особенно хороший пример, - другие оставались набором удобно различающихся идей, которые все еще были грубыми по своему охвату, отделенные друг от друга широкими пробелами концептуальной дифференциации. Они гарантируют, что во многих областях работа наших классификаторов никогда не будет слишком сложной.

Автомобили - один из многих примеров темы, которая практически стирает эти пробелы, и послеобеденный краш-курс, проведенный Джиа и Джоном, показал нам, насколько лабиринтной она может быть. Например, нам может показаться очевидным, что на фотографии изображена Toyota (хотя, конечно, большинство из нас были совершенно не готовы к разговору об автомобилях). То, что это Toyota Yaris, тоже можно было понять после небольшого изучения. Но была ли это Toyota Yaris 2008 года или Toyota Yaris 2009 года? Внезапно вопрос стал намного сложнее. Был ли это Toyota Yaris 2008 года в цвете "пылающий синий перламутр" или Toyota Yaris 2008 года в цвете "голубой перламутр"? В том году предлагались оба варианта, и оба были... синими. Это была базовая модель 2008 Toyota Yaris цвета "синий жемчуг" или спортивный лифтбек 2008 Toyota Yaris цвета "синий жемчуг"? Удивительно, но на этом вопросы не закончились. И все это для того, чтобы разобраться в одном варианте одной модели одного производителя. И это только автомобили.

Кто-то из аудитории обратил внимание на несколько недавних работ по компьютерному зрению, посвященных видам птиц, из которых ImageNet включает в себя, казалось бы, надежную коллекцию из пятидесяти девяти. Хотя проект Корнельского университета превзошел это число, представив набор фотографий, охватывающий сотни видов, по оценкам, в мире насчитывается более десяти тысяч видов, что оставляет даже самые современные достижения на порядки ниже реальности. Я усмехнулся, вспомнив, как задыхалась пресса о технологиях, когда статья за статьей возвещала о наступлении эры машинного обучения и объявляла классификацию изображений внезапно "решенной проблемой". Клены, журавли-кликуны и "Тойоты" мира говорят об обратном, подумал я.

Это были наши первые предметные уроки того, что стало известно как "мелкозернистая классификация" - исследовательская тема, изучающая все более узкие детали, необходимые для идентификации объектов все более схожих классов. Хотя это может показаться простым продолжением нашей предыдущей работы, от выделения очевидных различий до разбора менее очевидных, это наводило на мысль о чем-то более удивительном и поучительном: даже в самых грандиозных ситуациях мы все еще думали о малом.

Перейти на страницу:

Похожие книги

12 недель в году
12 недель в году

Многие из нас четко знают, чего хотят. Это отражается в наших планах – как личных, так и планах компаний. Проблема чаще всего заключается не в планировании, а в исполнении запланированного. Для уменьшения разрыва между тем, что мы хотели бы делать, и тем, что мы делаем, авторы предлагают свою концепцию «года, состоящего из 12 недель».Люди и компании мыслят в рамках календарного года. Новый год – важная психологическая отметка, от которой мы привыкли отталкиваться, ставя себе новые цели. Но 12 месяцев – не самый эффективный горизонт планирования: нам кажется, что впереди много времени, и в результате мы откладываем действия на потом. Сохранить мотивацию и действовать решительнее можно, мысля в рамках 12-недельного цикла планирования. Эта система проверена спортсменами мирового уровня и многими компаниями. Она поможет тем, кто хочет быть эффективным во всем, что делает.На русском языке публикуется впервые.

Брайан Моран , Майкл Леннингтон

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература
1991. Хроника войны в Персидском заливе
1991. Хроника войны в Персидском заливе

Книга американского военного историка Ричарда С. Лаури посвящена операции «Буря в пустыне», которую международная военная коалиция блестяще провела против войск Саддама Хусейна в январе – феврале 1991 г. Этот конфликт стал первой большой войной современности, а ее планирование и проведение по сей день является своего рода эталоном масштабных боевых действий эпохи профессиональных западных армий и новейших военных технологий. Опираясь на многочисленные источники, включая рассказы участников событий, автор подробно и вместе с тем живо описывает боевые действия сторон, причем особое внимание он уделяет наземной фазе войны – наступлению коалиционных войск, приведшему к изгнанию иракских оккупантов из Кувейта и поражению армии Саддама Хусейна.Работа Лаури будет интересна не только специалистам, профессионально изучающим историю «Первой войны в Заливе», но и всем любителям, интересующимся вооруженными конфликтами нашего времени.

Ричард С. Лаури

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / История / Прочая справочная литература / Военная документалистика / Прочая документальная литература
100 способов уложить ребенка спать
100 способов уложить ребенка спать

Благодаря этой книге французские мамы и папы блестяще справляются с проблемой, которая волнует родителей во всем мире, – как без труда уложить ребенка 0–4 лет спать. В книге содержатся 100 простых и действенных советов, как раз и навсегда забыть о вечерних капризах, нежелании засыпать, ночных побудках, неспокойном сне, детских кошмарах и многом другом. Всемирно известный психолог, одна из основоположников французской системы воспитания Анн Бакюс считает, что проблемы гораздо проще предотвратить, чем сражаться с ними потом. Достаточно лишь с младенчества прививать малышу нужные привычки и внимательно относиться к тому, как по мере роста меняется характер его сна.

Анн Бакюс

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература / Детская психология / Образование и наука