Избыточность понятия «подкрепление реакции»

Мы уже затрагивали вопрос об избыточности постулата об определяющем привычку подкреплении. С тех пор как в конце 1920-х гг. против этого понятия выступил Толмен, а в связи с результатами экспериментов по латентному научению и изменению привлекательности теория оперантного научения Халла столкнулась с неразрешимыми проблемами, теоретические подходы, как мы видели, все больше и оольше сводились к объяснению инструментального целенаправленного поведения с помощью ситуационных побуждений, в особенности связанной с ожиданиями мотивации привлекательностью (см.: Bolles, Moot, 1972). Эти теории отличались от подходов Левина и Толмена только одним. Если Левин и Толмен считали,

что мотивирующие ожидания имеют лишь когнитивную репрезентацию, то такие теоретики, как Сьюард, Шеффилд, Маурер, а также Логан (Logan, 1960), описывали промежуточные переменные в терминах S—R (на что, несомненно, провоцировал детальный анализ экспериментальных данных). Классическое обусловливание в павловском смысле оказалось незаменимым при объяснении действий¹, связанных с ожиданием.

Инструментальное (оперантное) обусловливание, понимаемое Торнддйком и Хал-лом как образование с помощью подкрепления связи «раздражитель-реакция», подвергалось все большему сомнению. Закон эффекта из принципа научения превратился в принцип поведения. Теоретико-ассоциативный r_G — Sp-механизм превратился в теоретико-когнитивный эквивалент мотивирующей ожидание привлекательности.

Более значимым по сравнению с постулированием в теоретических системах «механических» (теоретико-ассоциативных) или «когнитивных» связей оказалось нечто другое, а именно перелом в понимании явлений мотивации. Он может быть описан следующим образом: от единичного толчка к непрерывному движению. Ученые отказались от представления о том, что целенаправленное поведение инициируется откуда-то извне общим по своей природе влечением, а само управление им полностью перепоручено фиксированным в результате редукции влечения связям S—R, которые в случае непригодности должны аннулироваться и постепенно вырабатываться вновь.

Теперь движущей силой целенаправленного поведения выступили ожидаемые целевые состояния, быстро и гибко запускающие инструментальные реакции, поскольку наступление определяется уже не сочетанием S—R, а ожидаемыми последствиями действия. Таким образом, ведущие исследователи научения и мотивации отказались от теории подкрепления инструментального поведения.