3.3.1. Последовательные переделки сигнального значения дифференцировочных стимуловПеределка сигнального значения условных раздражителей (ее часто называют переделкой дифференцировки) — это разновидность дифференцированного обучения.
После достижения определенного, выбранного экспериментатором критерия выработки различения (например, 80 % правильных решений) условия получения подкрепления меняются на противоположные: теперь реакция на стимул, ранее подкреплявшийся, перестает сопровождаться пищей, а реакцию на стимул, на который животное только что научилось не реагировать, начинают подкреплять.
Американский исследователь М. Биттерман (1973) предложил проводить такие переделки многократно. Эта процедура получила название метода последовательных (или обратимых) переделок (discriminationreversallearning). Автор исходил из того, что после многократных смен сигнального значения стимулов у животных может сформироваться единая стратегия (или правило), и они не будут каждый раз обучаться совершенно заново.
Опыты проводились на разных видах позвоночных. При каждой следующей переделке число ошибок снижалось, и в конце концов наступал момент, когда при очередной смене сигнального значения стимулов животное уже со второй пробы начинало выбирать «правильно» без дополнительного обучения. в Снижение числа проб, необходимого для очередной переделки реакции, происходит тем быстрее, чем выше уровень эволюционного развития данного животного.
3.3.2. формирование «установки на обучение»Метод формирования «установки на обучение» (objectlearning-setformation) разработал американский исследователь Г. Харлоу (Harlow, 1949; 1958). Согласно классическому варианту этой методики, животное (в опытах Харлоу макака-резуса) обучают простой дифференцировке — выбору одного из двух стимулов: игрушек или мелких предметов обихода. По достижении определенного критерия выработки дифференцировки начинают следующую серию: животному предлагают два новых стимула, ничем не похожих на первые. По завершении второй стадии обучения формируют третью дифференцировку и т. д. После выработки 100–150 таких реакций (их число зависит от уровня организации данного вида и может доходить до 1500 у крыс и голубей, занимая многие месяцы) животное уже при втором предъявлении новой пары стимулов действует не наугад, не методом проб и ошибок, а в соответствии с усвоенным им ранее правилом, которое принято называть установкой. Оно запоминает результат первой пробы и далее реагирует в соответствии с этой «установкой».
Правило состоит в том, чтобы «выбирать тот же предмет, что и в первой пробе, если его выбор сопровождался подкреплением, или другой, если подкрепление получено не было (в дальнейшем эта стратегия получила название "win-stay, Jose-shift"}-».
Принято считать, что при обучении с использованием метода последовательных переделок и при формировании установки происходят сходные процессы, так что первый можно считать частным случаем формирования установки.
Впоследствии было создано несколько модификаций исходной методики. Например, Д. Уоррен (Warren, 1977) в своих опытах не вырабатывал каждую дифференцировку до достижения критерия обученности, а предъявлял каждую пару определенное число раз и затем предлагал следующую. Именно этот вариант был использован рядом авторов для сравнения обучаемости разных видов приматов (Passingham, 1982; Rumbaugh et al., 1987, 2000).