В противовес методике И. П. Павлова Скиннер разработал методику свободного оперантного поведения, при которой животному позволяют совершать различные действия и нужные подкрепляют. Чаще всего для таких опытов выбирали крыс и голубей, хотя использовались и другие животные. Знаменитый «ящик Скиннера» с одной из сторон имеет педаль (рычаг), который соединен с кормушкой. Снаружи за стенкой расположен сложный механизм. После каждого нажатия на педаль в кормушку падает гранула корма. Как только крысу сажали в ящик, она начинала активно исследовать его – обнюхивать и карабкаться на стенки. При этом случайно нажимала на педаль, после чего в кормушку падал корм. Обычно животное этого не замечало, но, найдя пищу, съедало ее. Продолжая обследовать ящик, крыса вновь случайно нажимала на педаль… Постепенно она обнаруживает зависимость между этим действием и результатом. Как только временная связь стала для нее понятной, она начинала нажимать на педаль, когда хотела есть. Характерно, что вначале крыса нажимала на рычаг лишь изредка, но затем стала это делать все чаще и чаще. После примерно 140 мин опыта число нажатий вдруг значительно возросло.
Совсем не обязательно ждать от животного случайного нажатия на рычаг. Это действие можно спровоцировать (инициировать) различными способами. Например, при обучении голубя клевать к педали можно приклеить зернышко. Если говорить о наработке форм поведения связанных с пищевой потребностью, то рекомендуется понизить массу тела животного до 80% (!) от первоначальной, т. е. вызвать у животного сильную пищевую потребность (мотивацию).
Хотя открытие и изучение инструментальных условных рефлексов считается заслугой американской науки, они исследовались и в школе И. П. Павлова (например, А. Г. Ивановым-Смоленским, Г. Зеленым). Известный польский ученый Ю. М. Конорски, который был учеником Павлова, считается одним из создателей теории об инструментальных условных рефлексах, которые он называл условными рефлексами второго типа. Однако еще раньше описал эту форму научения талантливый цирковой дрессировщик В. Л. Дуров.
Обстоятельства и ситуации, в которые попадают животные, вынуждают их проявлять разные формы поведения, приспосабливаясь или активно сопротивляясь. Ученые назвали такое поведение оперантным (от лат. operatio – «действие»). Действия животных приводят к определенным последствиям или результатам, от которых зависит, будут ли они повторять эти действия или нет. Другими словами, инструментальные условные рефлексы строятся на основе активной целенаправленной деятельности животного. Последовательность событий и результат в данном случае зависят не только от внешней сигнализации, но и от поведения самого животного. Таким образом, первое отличие инструментального условного рефлекса от классического заключается в активной, целенаправленной деятельности обучающегося животного. Второе отличие в том, что инструментальный рефлекс не воспроизводит лежащую в его основе безусловную реакцию, в то время как классический частично или полностью воспроизводит ее.
При образовании инструментальных условных рефлексов основную роль играет внутрення активность животного – его потребность и мотивация. Иначе говоря, в основе поведения лежит не внешняя сигнализация, а внутренняя потребность животного. Считается, что выбор животным реакции определяется не вызывающим ее раздражителем, а установлением временной последовательности между реакцией, выполняемой в данной ситуации, и подкрепляющим раздражителем. При классических условных рефлексах связь устанавливается между стимулами и результатом, а при инструментальном научении она возникает между реакцией и результатом. Таким образом, действие животного приобретает сигнальную функцию по отношению к результату (подкреплению).
Эффективность научения с использованием инструментальных условных рефлексов заключается не только в том, что животное само стремится совершить какое-либо действие, но и в том, что подкрепление – это не просто событие, связанное временной последовательностью с каким-либо сигналом, а всегда удовлетворение доминирующей потребности. Поэтому оно и становится биологически важным, а действия, приводящие к нему, – биологически целесообразными.
Несмотря на кажущееся сходство инструментальных условных рефлексов и двигательных классических, специальными исследованиями было доказано существование различий между ними. В одном из них собака должна была до тех пор реагировать на первый раздражитель, пока ей не предъявляли второй, за которым следовало пищевое подкрепление. Оказалось, что первый раздражитель вызывал инструментальную реакцию, не сопровождающуюся выделением слюны, тогда как второй вызывал слюноотделение.
Следует отметить, однако, что хотя естественное поведение животных в основном инструментально, в формировании поведенческого акта трудно различить роль и участие того или иного вида условного рефлекса.
1. Создание состояния выраженной потребности у животного.