Все машины оценки признаков имеют серьезные ограничения, поскольку, пускай способны оценивать наличие или отсутствие различных функций, они не могут учитывать в достаточной степени соотношения между этими особенностями. Например, в книге «Перцептроны» мы с Сеймуром Пейпертом математически доказали, что никакая машина оценки признаков не сумеет различить между собой рисунки, приводимые ниже, сколь тщательно мы не определяли бы «весомости».
Рис. 99
Оба рисунка слева изображают соединенные структуры, то есть те, которые возможно начертить одной линией. Рисунки справа, в отличие от левых, требуют двух отдельных линий. Вот способ доказать, что никакая машина оценки признаков не способна распознать такое различие. Допустим, мы разделили каждую картинку на множество крошечных фрагментов. Невозможно определить, какие фрагменты относятся к левым рисункам, а какие к правым – просто потому, что каждая группа фрагментов содержит идентичные отрезки изображений! В каждой будет по четыре фрагмента с поворотами под прямым углом и по два «знака переноса строки», а общая длина горизонтальных и вертикальных отрезков окажется одинаковой. Поэтому невозможно отличить одну группу от другой путем «взвешивания доказательств», ибо всякая информация о связях между фрагментами утрачена.
19.8. Обобщения
Мы всегда учимся на опыте, наблюдая некоторые примеры и затем применяя их к ситуациям, в которые никогда раньше не попадали. Одного пугающего рыка или лая достаточно, чтобы маленький ребенок начал бояться всех собак конкретного размера – или даже всех животных вообще. Как мы делаем обобщения на основе фрагментарных свидетельств? Однажды моя собака попала под машину и с тех пор больше никогда не выбегала на ту же улицу, хотя продолжала гоняться за автомобилями на других улицах.
Философы с давних пор пытались обобщить представления о том, как мы узнаем так много из опыта. Было выдвинуто множество теорий, пестревших терминами «абстракция», «индукция», «абдукция» и т. д. Но никто не нашел способа проводить правильные, непротиворечивые обобщения – по-видимому, вследствие того, что подобной надежной схемы попросту не существует, и все, чему мы «учимся», может оказаться неправильным. В любом случае мы, люди, учимся отнюдь не в соответствии с каким-то фиксированным и постоянным набором принципов, вместо этого мы накапливаем сообщества схем обучения, которые различаются как по качеству, так и по виду.
Мы уже познакомились с несколькими способами обобщения. Один заключается в создание унифреймов посредством формулирования описаний, отвергающих подробности, которые представляются нам незначительными. Схожую идею мы положили в основу нашей концепции «полос пропускания». Еще одна схема подразумевается в понятии полинемы, которая как бы угадывает суть объектов, комбинируя ожидания от сочетания ряда отдельных свойств. Так или иначе, существует глубинная связь между тем, как мы репрезентируем то, что уже знаем, и обобщениями, которые кажутся наиболее правдоподобными. Например, впервые предложив «узнаватель» для стула, мы составили его из полинем для нескольких знакомых идей, конкретно – для сиденья, ножек и спинки, и придали этим признакам определенные «весомости».
Если изменить значения этих «весомостей», мы тем самым породим новых «узнавателей». К примеру, при отрицательной «весомости» спинки новый агент стал бы отвергать стулья, зато опознавал бы скамейки, табуреты и столы. Если увеличить все «весомости» (при сохранении итоговой суммы значений параметров), новый агент стал бы опознавать более широкую категорию мебели – или мебель с большим количеством скрытых признаков, – а также другие предметы, к мебели не относящиеся.
Насколько велика вероятность того, что подобные вариации способны порождать толковых «узнавателей»? Полезный итог маловероятен, если мы будем собирать новых агентов, комбинируя старых, да еще выбранных наугад. Но шансы намного выше, если каждый новый «узнаватель» будет появляться через объединение сигналов от агентов, уже проявивших себя в похожих контекстах. Как объяснял Дуглас Хофштадтер:
19.9. Узнавание мыслей