Я не знал, на что именно я рассчитывал в годы учебы в аспирантуре, кроме возможности погрузиться в область, которая украла мое сердце. Но я надеялся, что где-то на этом пути я найду занятие, которому смогу следовать с рвением моих образцов для подражания - духом, который побудил Эрика Висхауса превратить одержимость аномалиями плодовой мушки в Нобелевскую премию или Нила деГрасса Тайсона превратить космос в числовую поэзию. Мне нужна была своя собственная Полярная звезда. Но пока я ее не нашел, я довольствовался тем, что обдумывал вопрос о том, как на самом деле работает невыразимый опыт видения, - или, говоря нескладным языком подзаголовка моего учебника, как фотоны становятся феноменологией.
Первый шаг к этому пониманию был сделан на страницах моего учебника "Наука о зрении", в котором рассказывалось о психологе Анне Трейсман из Принстона . Вундеркинд эксперимента и гигант когнитивной науки двадцатого века, она сочетала очаровательно простые инструменты с сырой изобретательностью, чтобы исследовать человеческое восприятие, за десятилетия до появления цифровых технологий, которые значительно ускорили бы ее исследования.
Разработанная Трейсманом "теория интеграции признаков внимания" стала почти универсальной основой для понимания природы зрительного восприятия. Представляя испытуемым кратковременную вспышку абстрактной композиции - например, одиночный красный круг в мешанине зеленых и красных квадратов, - она смогла разделить время, необходимое им для восприятия изображения на разных уровнях глубины. Она обнаружила, что люди практически мгновенно определяют присутствие красного цвета - просто знают, что он содержится где-то внутри изображения, - но им требуется больше времени, чтобы найти именно красный круг, поскольку его идентичность представляет собой сочетание двух разных признаков: цвета и формы, совпадающих в одном и том же месте. Другими словами, способность интегрировать восприятие красного цвета и восприятие круга не только занимала больше времени, но и представляла собой совершенно отдельный, более интенсивный этап визуальной обработки.
Работа Трейсмана была грандиозной по своему размаху и плотной по своим объяснениям, но ее объединяла идея о том, что человеческое зрение начинается с определения мелких деталей, а затем устанавливает взаимосвязи между ними, пока они не откроют полную картину. Это был интуитивный тезис, и он предлагал метрику для понимания работы зрения: простые объекты, определяемые небольшим количеством признаков, можно распознать быстро - например, оранжевый мяч на сером асфальте, - в то время как более сложные сцены, такие как извилистая лесная тропа или детали лица друга, требуют больше времени.
Эта парадигма, как я видел, повторялась в изучении компьютерного зрения, когда исследователи писали и совершенствовали алгоритмы, способные определять фундаментальные детали на фотографиях и других изображениях - резкие края, изменения света и цвета, фрагменты текстуры или узоры - а затем создавали алгоритмы более высокого уровня, чтобы распознавать связи между ними и ассоциировать их с более значимыми вещами, такими как люди и объекты. То немногое, что я знал о зрении, имело смысл. Но вскоре картина должна была стать гораздо сложнее.
"У меня есть кое-что для твоего списка чтения, Фей-Фей, - сказал Пьетро, положив копию статьи на стол передо мной.
"Это?"
Я взял его в руки и пролистал, заметив, что он меньше четверти объема большинства опубликованных работ. Пьетро понимающе улыбнулся.
"Поверьте мне. Вам захочется это прочитать".
Он не шутил.
Статья, представленная нейробиологом Саймоном Торпом в раздел "Письма" журнала Nature за 1996 год, была короткой - всего три страницы, но громогласной в своих выводах. Даже ее несерьезное название - "Скорость обработки информации в зрительной системе человека" - преуменьшало то влияние, которое она могла оказать, поскольку ставила под сомнение общепринятую ортодоксальность целой области. Это был пример величайшей традиции во всей науке - разрушение устоявшихся представлений, интуитивно понятных и привычных, более сложной реальностью.
С помощью электроэнцефалограммы, или ЭЭГ, Торп измерял электрические сигналы на поверхности мозга испытуемых, пока они рассматривали изображения на мониторе компьютера. Когда фотография вспыхивала на экране всего на 27 миллисекунд - время, необходимое медоносной пчеле, чтобы несколько раз взмахнуть крыльями, - испытуемые с поразительной точностью определяли ее содержание. Но он копнул глубже и определил момент распознавания в их мозгу: всего через 150 миллисекунд после появления изображения, то есть примерно за то время, которое требуется, чтобы моргнуть. Это было самое точное исследование скорости обработки зрительной информации человеком, которое когда-либо проводилось, и цифры оказались значительно меньше, чем предсказывала теория Трейсмана.