Генерализация и различение стимулов
Типы подкреплений
Одним из примечательных идей скинеровской теории обусловливания является понятие подкрепления.
Подкрепление (punishment) – это любое событие (стимул), которое следует за реакцией и увеличивает вероятность ее появления. Когда голубь, например, тычет клювом в диск, то это поведение является оперантным, и если оно сопровождается подкреплением, таким, как еда, то вероятность клевания диска возрастает. В соответствии с этим взглядом, подкреплениие усиливает то поведение, за которым следует, и нет необходимости прибегать к биологическим объяснениям, чтобы определить, почему так происходит. Очень важным является то, что стимулы, которые изначально не являются подкреплениями, могут превратиться в таковые благодаря ассоциированию с другими подкреплениями. Некоторые стимулы, такие, как деньги, становятсягенерализованным подкреплением, поскольку они обеспечивают доступ ко множеству других видов подкрепления.
Здесь важно понимать, что подкрепление определяется через его воздействие на поведение — а именно через рост вероятности поведенческой реакции. Часто трудно точно определить, что может послужить таким подкреплением, так как оно варьирует от индивида к индивиду, от организма к организму. Например, исследователь может искать подкрепление путем проб и ошибок. Он может продолжать испытывать разные стимулы, пока не найдется такой, который действительно надежно увеличивает вероятность появления данной реакции.
Теоретики, занимающиеся научением, признавали два типа подкрепления — первичное и вторичное. Первичное подкрепление — это любое событие или объект, сами по себе обладающие подкрепляющими свойствами. Таким образом, они не требуют предварительной ассоциации с другими подкреплениями, чтобы удовлетворить биологическую потребность. Первичные подкрепляющие стимулы для людей — это пища, вода, физический комфорт и секс. Их ценностное значение для организма не зависит от научения. Вторичное, или усвоеное подкрепление, с другой стороны, — это любое событие или объект, которые приобретают свойство осуществлять подкрепление посредством тесной ассоциации с первичным подкреплением, обусловленным прошлым опытом организма. Примерами общих вторичных подкрепляющих стимулов у людей являются деньги, внимание, привязанности и хорошие оценки.
Логическим расширением принципа подкрепления является то, что поведение, усиленное в одной ситуации, весьма вероятно повторится, когда организм столкнется с другими ситуациями, напоминающими ее. Если бы это было не так, то поведенческий репертуар человека был бы так сильно ограничен и хаотичен, что мы бы, возможно, проснувшись утром, долго размышляли над тем, как реагировать должным образом на каждую новую ситуацию. В теории Скиннера тенденция подкрепленного поведения распространяться на множество подобных положений называется генерализацией стимула. Этот феномен легко наблюдать в повседневной жизни. Например, ребенок, которого похвалили за утонченные хорошие манеры дома, будет обобщать это поведение в соответствующих ситуациях и вне дома, такого ребенка не нужно учить, как прилично вести себя в новой ситуации. Обобщение стимула также может быть результатом неприятного жизненного опыта. Молодая женщина, изнасилованная незнакомцем, может генерализировать свой стыд и враждебность по отношению ко всем лицам противоположного пола, так как они напоминают ей о физической и эмоциональной травме, нанесенной незнакомцем. Подобно этому, единственного случая испуга или аверсивного опыта, причиной которого явился человек, принадлежащий к определенной этнической группе (белый, черный, латиноамериканец, азиат), может быть достаточно для индивида, чтобы создать стереотип и таким образом избежать будущих социальных контактов со всеми представителями данной группы.
Характерным для условного подкрепления является то, что оно генерализуется, если объединяется с более чем одним первичным подкреплением. Деньги — особенно показательный пример. Очевидно, что деньги не могут удовлетворить какое-либо из наших первичных влечений. Все же благодаря системе культурного обмена деньги являются мощным и сильным фактором для получения множества удовольствий. Например, деньги позволяют нам иметь модную одежду, яркие машины, медицинскую помощь и образование. Иные виды генерализованных условных подкрепляющих стимулов — это лесть, похвала, привязанности и подчинение себе других. Эти так называемые социальные подкрепляющие стимулы (включающие в себя поведение других людей) часто действуют очень сложно и едва уловимо, но они существенны для нашего поведения в разнообразных ситуациях. Например, внимание. Все знают, что ребенок может получить внимание, когда притворяется больным или плохо себя ведет. Часто дети назойливы, задают нелепые вопросы, вмешиваются в разговор взрослых, рисуются, поддразнивают младших сестер или братьев и мочатся в постель — и все это для привлечения внимания. Внимание значимого другого — родителей, учителя, возлюбленного – особенно эффективный генерализованный условный стимул, который может содействовать ярко выраженному поведению привлечения внимания.
Социальное одобрение — это еще более сильный генерализованный условный стимул. Например, многие люди проводят массу времени, прихорашиваясь перед зеркалом, в надежде получить одобряющий взгляд супруга или любовника. И женская, и мужская мода — это предмет одобрения, и она существует до тех пор, пока есть социальное одобрение. Студенты высшей школы соревнуются за место в университетской легкоатлетической команде или участвуют в мероприятиях вне учебного плана (драма, диспут, школьный ежегодник) для того, чтобы получить одобрение родителей, сверстников и соседей. Хорошие отметки в колледже — тоже позитивный подкрепляющий стимул, потому что ранее за это получали похвалу и одобрение родителей. Будучи мощным условным подкрепляющим стимулом, удовлетворительные оценки также способствуют поощрению учения и достижению более высокой академической успеваемости.
Скиннер полагал, что условные подкрепляющие стимулы очень важны в контроле поведения человека. Он также отмечал, что каждый человек проходит уникальную науку научения, и вряд ли всеми людьми управляют одни и те же подкрепляющие стимулы. Например, для кого-то очень сильным подкрепляющим стимулом является успех в качестве менеджера или преподавателя; для других важно выражение нежности; а иные находят подкрепляющий стимул в спорте, академических или музыкальных занятиях. Возможные вариации в поведении, поддержанные условными подкрепляющими стимулами, бесконечны. Следовательно, понять условные подкрепляющие стимулы у человека намного сложнее, чем понять, почему крыса, лишенная пищи, нажимает рычаг, получая в качестве подкрепления только звуковой сигнал.
Хотя способность обобщать реакции — важный аспект многих наших повседневных социальных интеракций, все же очевидно, что при адаптивном поведении нужно обладать способностью делать различия в разных ситуациях.
Небольшое изменение в стандартной процедуре оперантного научения демонстрирует, как нейтральный стимул может приобрести подкрепляющую силу для поведения. Когда крыса научилась нажимать на рычаг в «ящике Скиннера», сразу же ввели звуковой сигнал (сразу после осуществления реакции), за которым следовал шарик еды. В этом случае звук действует как различительный стимул (то есть животное учится реагировать только при наличии звукового сигнала, так как он сообщает о пищевом вознаграждении). После того, как эта специфическая оперантная реакция устанавливается, начинается угасание: когда крыса нажимает на рычаг, не появляются ни пища, ни звуковой сигнал. Через какое-то время крыса перестает нажимать на рычаг. Затем звуковой сигнал повторяется каждый раз, когда животное нажимает на рычаг, но шарик пищи не появляется. Несмотря на отсутствие первоначального подкрепляющего стимула, животное понимает, что нажатие на рычаг вызывает звуковой сигнал, поэтому оно продолжает настойчиво реагировать, тем самым ослабляя угасание. Другими словами, установленная скорость нажатия на рычаг отражает тот факт, что звуковой сигнал теперь действует как условный подкрепляющий фактор. Точная скорость реагирования зависит от силы звукового сигнала как условного подкрепляющего стимула (то есть от числа случаев, когда звуковой сигнал ассоциировался с первичным подкрепляющим стимулом, пищей, в процессе научения). Скиннер доказывал, что фактически любой нейтральный стимул может стать подкрепляющим, если он ассоциируется с другими стимулами, ранее имевшими подкрепляющие свойства. Таким образом, феномен условного подкрепления в значительной степени увеличивает сферу возможного оперантного научения, особенно если это касается социального поведения человека. Иначе говоря, если бы все, чему мы научились, было пропорционально первичному подкреплению, то возможности для научения были бы очень ограничены, и деятельность человека не была бы столь разнообразна.
Различение стимула, составная часть обобщения, — это процесс научения реагировать адекватным образом в различных ситуациях окружения. Примеров множество. Автомобилист остается в живых в час пик благодаря тому, что различает красный и зеленый цвета светофора. Ребенок учится различать домашнюю собачку и злобного пса. Подросток учится различать поведение, находящее одобрение у сверстников, и поведение, раздражающее и отчуждающее других. Диабетик сразу обучается различать пищу, содержащую много и мало сахара. В самом деле, практически все разумное поведение человека зависит от способности делать различение.
Способность к различению приобретается через подкрепление реакций в присутствии одних стимулов и неподкрепление их в присутствии других стимулов. Различительные стимулы таким образом дают нам возможность предвидеть вероятные результаты, связанные с изъявлением особой оперантной реакции в различных социальных ситуациях. Соответственно, индивидуальные вариации различительной способности зависят от уникального прошлого опыта различных подкреплений. Скиннер предположил, что здоровое личностное развитие происходит в результате взаимодействия генерализирующей и различительной способностей, с помощью которых мы регулируем наше поведение так, чтобы максимизировать позитивное подкрепление и минимизировать наказание.