Контроль стимулов в обучении с помощью последствий
Оперантное обусловливание — это обучение, обусловленное последствиями. Чтобы понять эффекты такого рода процессов и то, как они влияют на нашу жизнь, мы не можем ограничиться рассмотрением последствий (С). В этом случае также играют роль контролирующие поведение предшествующие факторы (А).
Содержание
- Стимулы и оперантное обусловливание
- Клинически значимый контроль стимулов
- Генерализация
- Дискриминационное обучение
- Под контролем стимулов
- Дистанционный контроль: моделирование
Стимулы и оперантное обусловливание
Тот факт, что данное поведение было подкреплено у человека, не означает, что человек будет увеличивать его частоту случайным образом в любое время и в любом месте. Опыт успешного использования молотка и гвоздей, например, не подразумевает, что человек начнет забивать гвозди в любой ситуации. Однако вероятность повторения такого поведения возрастает в ситуациях, аналогичных тем, в которых был достигнут успех, например при выполнении столярных работ или развешивании картин на стенах.
Сам факт, что поведение подкрепляется, подразумевает, что оно находится под контролем определенных стимулов. Каждый раз, когда происходит поведенческое событие, оно происходит при определенных обстоятельствах. Человек приобретает опыт, в котором различные стимулы предшествовали поведению, которое было подкреплено. Поведение, которое было подкреплено при определенных обстоятельствах, с большей вероятностью проявится, когда эти или подобные обстоятельства возникнут снова.
Чтобы проиллюстрировать это, мы хотели бы рассказать историю сложной шутки, которая произошла в Бостоне, штат Массачусетс, и которая уже стала легендой. Бостон является домом двух особенно престижных высших учебных заведений: Гарвардского университета и Массачусетского технологического института (MIT). В этих школах существует давнее студенческое соперничество (как в спорте, так и за его пределами), и его часто можно наблюдать в виде сложных и тщательно продуманных шалостей.
История гласит, что одним летом группа студентов Массачусетского технологического института пробиралась на футбольный стадион Гарварда, чтобы покормить птиц. Свистя в свисток, они рассыпали птичий корм. Это повторялось каждый день: пробраться на арену, посвистеть и рассыпать корм.
Птицы слетались на корм, и их становилось все больше и больше. Затем начался футбольный сезон, и все было готово к первой игре. Зрители расселись, игроки вышли на поле, лайнсмены заняли свои места, и судья дал сигнал — правильно, с помощью свистка — о начале игры. Мы предполагаем, что вы уже догадались, что произошло дальше. Футбольное поле внезапно покрылось ковром из птиц, прилетевших полакомиться семенами, как они делали все лето. А как же игра? На поле было так много птиц, что игра не смогла начаться. Мы не уверены, что эта история произошла на самом деле, однако она представляет собой пример творческого применения теории обучения, который иллюстрирует контроль стимулов, то есть то, как предшествующие события влияют на вероятность определенного поведения.
Студентам Массачусетского технологического института удалось создать предшествующий фактор (звук свистка), который, когда присутствует, увеличивает вероятность того, что поведение, возникающее у птиц (садиться на землю и искать в траве семена), позволяет контактировать с подкреплением (пищей). Звук свистка стал тем, что в оперантной психологии называется различающим стимулом — стимулом, который, когда он появляется, указывает на то, что данное поведение, вероятно, будет сопровождаться подкреплением. Проще говоря, птицы совершают это поведение, чтобы получить пищу. Однако тогда мы упускаем из виду тот факт, что это выражение содержит проблемный способ рассуждения с научной точки зрения. Предполагаемая причина поведения (еда) временно появлялась после поведения, которое она должна объяснить. Птицы, как и люди, являются живыми существами, находящимися в настоящем моменте. Трудно утверждать, что существующее поведение находится под контролем будущих событий. Любой, кто смотрел фильм “Терминатор”, может представить, как трудно это сделать.
Различающий (дискриминативый) стимул обычно обозначается SD. Стимул, связанный с отсутствием подкрепления, записывается как SΔ (s-delta). Стимул, связанный с вероятностью поведения, за которым последует наказание, записывается как SD-. Все эти функции стимулов объединяются под названием “предшествующие факторы”.
Не факт, что птицы получат корм, который контролирует их поведение в данной ситуации. На самом деле они его точно не получают в день игры. Именно тот факт, что они получали корм в подобных ситуациях, контролирует их поведение. У них есть опыт подкрепления при наличии определенного стимула. Вы можете найти подобные примеры в собственном опыте. Мы бы предположили, что эти примеры не будут связаны со свистками, семенами и приземлением на футбольном поле. Но они, вероятно, о субъективном переживании контакта с будущими событиями. Этот опыт был выражен следующим поэтическим образом: “Прошлое, как будущее в настоящем” [Hayes, 1992].
Но разве птицы не верят, что получат пищу? Это их ожидание управляет их поведением или это их намерение? Способны ли птицы верить, ожидать или удерживать намерения? Мы вряд ли можем сделать такой вывод, поскольку птицы, вероятно, никогда не смогут рассказать нам о своих частных событиях таким образом, чтобы хотя бы отдаленно подтвердить эти процессы. Однако мы можем сказать, что их поведение преднамеренно. Но это только описание того факта, что поведение имеет определенное направление, а не утверждение, которое дает какое-либо объяснение этому. Описание поведения по отношению к контексту, в котором оно происходит, имеет то преимущество, что оно позволяет понять переменные, которые потенциально доступны для влияния на поведение.
Как предшествующие факторы, так и последствия являются переменными, которыми в принципе можно манипулировать. Цель функционального анализа состоит в том, чтобы дать нам лучшую позицию для влияния на поведение людей, которые обращаются за нашей профессиональной помощью, чтобы помочь им изменить свою жизнь.
Клинически значимый контроль стимулов
Анна знает, что нет смысла говорить Питеру, что она думает о его пьянстве, когда он уже выпил.
Можно было бы сформулировать то же предложение в АВС-последовательности: в присутствии А (Питер выпил алкоголь) В (высказывание своего мнения об этом) не приводит к С (Питер слушает ее). Опыт Анны говорит ей, что поведение, которое часто полезно (высказывание своего мнения) в этих обстоятельствах, вряд ли будет сопровождаться подкреплением.
Но контроль стимулов в этом случае не может быть выполнен Анной, знающей, что произойдет. Это означало бы, что она обладает сверхъестественными силами. Однако Анна знает, что происходило каждый раз, когда она делала это в прошлом. В этом случае контроль стимулов подразумевает меньшую вероятность того, что Анна будет совершать поведение в этой ситуации. Изложение ее мнения было погашено в присутствии упомянутого предшествующего фактора.
Контроль стимулов мог также указать на ситуацию, в которой определенное поведение ранее сопровождалось наказанием. Мы видим это в следующей ситуации.
В последнее время, когда Питер пытался обнять Анну, она несколько кисло говорила: “ Чего ты хочешь от меня, когда так делаешь?" Это так ранило Питера, что теперь он избегает физического контакта.
Мы можем выразить последовательность поведения Питера следующим образом: в присутствии А (Анна) В (попытка физически приблизиться к ней) приводит к С (кислые комментарии, которые переживаются как обидные). Вероятность того, что он это сделает, уменьшится, потому что в прошлом А ассоциировалась с наказанием после его приближения к ней.
Однако стимулы, которые оказывают влияние на предшествующие факторы А, не ограничиваются событиями, которые происходят исключительно вне индивида. Опыт Мари демонстрирует это.
Мари посещает ежемесячные собрания персонала своей компании. На этих совещаниях каждый должен информировать команду о ходе работ по своим проектам. Страх растет внутри нее, когда начинается встреча. Такие ситуации — худшее из того, что с ней случалось: нужно объявить о том, что вы сделали, перед группой и нести за это ответственность. Иногда это было абсолютным кошмаром для нее, хотя ее коллеги почти не комментируют ее работу.
Здесь важна не только сама внешняя ситуация. Это внешняя ситуация (собрание) плюс страх, который она вызывает.
Мы могли бы предположить, что этот страх — это реакция, связанная с такими ситуациями, как собрание, с помощью респондентного обусловливания. Этот ответ, можно сказать, был сформирован опытом, который Мари хорошо помнит: когда в средней школе, будучи парализованной страхом, стоя перед своими одноклассниками, она была не в состоянии произнести ни одного слова; над ней посмеялись однажды., когда, будучи подростком, она покраснела; и критика со стороны коллег на ее последней работе, когда она разрыдалась. Однако не только внешние обстоятельства вызывали отвращение во время этих встреч. Реальные неприятные переживания, такие как критика, на самом деле довольно редки в ее истории. Но нередки случаи, когда у нее был неприятный опыт посещения собрания с сильным чувством тревоги, и этот опыт функционирует как последствие посещения собраний.
Поскольку приближение В к такого рода ситуациям (Собрание = А) ранее было связано с неприятными последствиями во внешних, а также внутренних обстоятельствах С, вероятность поведения “участие в собрании” уменьшается. У Мари также был опыт, что избегание уменьшает количество контактов, которое она имеет с этими отталкивающими последствиями, что создает обусловливающее подкрепление. Можно также сказать, что предшествующие факторы “говорят” индивиду, какая историческая связь существует между поведением и его последствиями в определенных ситуациях. Именно таким образом предшествующие факторы влияют на поведение.
В сценарии, подобном описанному, не имеет особого смысла проводить четкое различие между тем, что происходит снаружи и внутри, когда мы пытаемся понять поведение субъекта. Обе области, по существу, составляют контекст, в котором люди действуют и реагируют. В случае Мари контекст — “страшное собрание” (или встреча, которую она испытала как страшную). Этот пример также иллюстрирует тот факт, что респондентное и оперантное обучения очень часто переплетаются.
Генерализация
Теория обучения подчеркивает решающую роль исторического опыта в обучении и формировании контроля стимулов. Однако это не означает, что человек должен будет испытать каждую уникальную ситуацию и последствия каждого поведения, чтобы развить адаптивный поведенческий репертуар. Если бы это было правдой, то обучение было бы безнадежно медленным процессом. Из главы о респондентном обусловливании читателю знаком процесс генерализации стимулов. Тот же принцип действует и в оперантном обусловливании. Вероятность проявления поведения, которое было подкреплено при данных обстоятельствах, возрастает также в ситуациях, аналогичных исходной (схема 6.1).
В присутствии А (плюс А, А и @) В приводит к С
Схема 6.1. Генерализация
Когда мы, дети, учимся взаимодействовать с родителями, усвоенный поведенческий репертуар имел бы ограниченную ценность, если бы не его способность генерализоваться в других межличностных отношениях. Умение обращаться за помощью, например, генерализуется с другими людьми, которые, так или иначе, достаточно похожи на родителя. Генерализация делает опыт более эффективным, но за это приходится платить.
Дискриминационное обучение
“Я не твоя мать!” Возможно, это один из самых распространенных комментариев в межличностных спорах. Эта дилемма является лишь примером издержек генерализации стимулов. Противоположность генерализации заключается в различающем обучении (схема 6.2).
В присутствии А (но не @, А или А), В приводит к С
Схема 6.2. Различающее обучение
Большинство моделей поведения подкрепляется только при определенных обстоятельствах. Критическая вещь для процесса обучения заключается в том, могу ли я различать или разделять эти обстоятельства. Если я не ощущаю разницы между различными предшествующими факторами, поведение вполне может произойти в присутствии всех их, даже тех, которые не подкреплены. Это, безусловно, имеет место в социальных ситуациях, когда наша способность к различающему обучению жизненно важна. Концепция тактичности, например, основывается на различающем обучении. Посещение похорон требует определенного сдержанного и достойного поведенческого репертуара, хотя люди, которые приходят на похороны, похоже, одеты для вечеринки. Если наше поведение находится под контролем слишком широкого класса стимулов, мы рискуем вести себя социально неприемлемым образом.
Концепция различающего обучения указывает на другой аспект, который вызывает у нас основной интерес. Мы не осознаем всех стимулов, которые влияют на наше поведение в часы бодрствования, и мы должны быть благодарны за это. Если бы адаптивное поведение требовало сознательного контроля, у нас было бы мало времени на обдумывание чего-либо еще. Это было бы, по существу, неадаптивным! Но это также означает, что я буду вести себя так, как мне может не нравиться, что может быть мне не выгодно или я не понимаю, когда я подчиняюсь внезапному приказу, хотя я не хочу и не обязан этого делать. Это делает проблему различения обусловливающих последствий, которые управляют моим поведением, по существу, вопросом самопознания.
Под контролем стимулов
Контроль — это слово, с которым нам, людям, приходится нелегко. Звучит не очень заманчиво — идентифицировать себя как “организмы под контролем стимулов”. Это выражение ассоциируется с безмозглыми автоматами, которые двигаются в окружающей среде, как прыгающие шары.
Мы склонны ассоциировать слово “контроль” с чем-то, что изначально нас ограничивает. Это одна из причин, по которым легче говорить о “влиянии” стимулов, чем о “контроле” над ними.
Позвольте объяснить. Допустим, вы идете и вам нужно перейти улицу. Когда вы стоите на красный свет на перекрестке, красный свет служит стимулом, который влияет на вероятность того, что вы поведете себя определенным образом. Он делает это, сигнализируя о движущихся транспортных средствах, которые потенциально могут ударить вас или переехать вас. Вы не вынуждены стоять и ждать каким-то абсолютным образом, но от этого зависит вероятность того, что вы сделаете. Теперь вы можете осмотреться, обнаружить, что нет никаких автомобилей в поле зрения, и перейти дорогу, несмотря на красный свет. Теперь на ваше поведение влияет другой стимул. То, что появляется в вашем поле зрения, является стимулом, и это не сигнализирует о том, что автомобили могут проехать мимо или переехать вас. Поэтому вы начинаете переходить улицу, и в этот момент слышите разговор женщины и ребенка. Ребенок говорит: “Теперь можно идти?” “Нет, — отвечает женщина, — ты должен подождать, пока он станет зеленым”. Вы останавливаетесь, потому что знаете, как важно вести себя образцово перед молодым поколением. По мере того как время проходит без зеленого света или проезжающих мимо автомобилей, все большее чувство беспокойства начинает расти внутри вас. Здесь мы можем определить еще один стимул, который влияет на вас и будет влиять на вероятность проявления поведения.
В такой простой ситуации список стимулов может быть длинным. Мы находимся под контролем множества стимулов, но ни один из них не заставляет нас вести себя определенным образом. Они влияют на нас. Мы можем переживать ожидание изменения света, когда нас заставляют стоять там или когда мы выбираем это. Но ни утверждение “Я должен стоять здесь”, ни утверждение “Я стою здесь по доброй воле” не являются адекватными объяснениями того, почему мы так себя ведем.
Этот пример показывает, как различные стимулы могут соперничать в своем потенциальном влиянии и как они могут быть смягчены, когда помещены относительно друг друга: красный свет по отношению к визуальному наблюдению за окружающей средой; по отношению к слуховым стимулам; по отношению к морали; по отношению к физическому опыту наших внутренних процессов в той самой ситуации. Точка конвергенции в этой сложной ситуации — это мы, и чем больше мы контактируем с этими влияющими стимулами, тем больше возможность вести себя таким образом, чтобы обеспечить длительный доступ к важнейшим ценностям, таким как хорошее здоровье или хорошие отношения с нашим социальным окружением, или, иначе говоря, сделать правильный выбор в жизни.
Дистанционный контроль: моделирование
Особым примером оперантного поведения, которое имеет огромное значение для процесса обучения в жизни, является то, что мы рано учимся копировать поведение других. Есть признаки того, что это поддерживается унаследованными программами поведения. Мы биологически готовы подражать нашим основным опекунам. Таким образом, “подражание” подкрепляется как основное поведение. Эта ранняя форма подражательного поведения будет развиваться в течение жизни в форме обучения, известного как моделирование [Bandura, 1977]. Как и в случае генерализации, для нас это способ избежать изначально медленного процесса изучения всего в каждом случае с помощью прямого собственного опыта.
Вместо этого мы учимся, наблюдая за человеком, который моделирует поведение. Этот процесс наблюдения за другими в широком диапазоне ситуаций избавляет нас от времени и усилий, необходимых для индивидуального исследования и экспериментов. Вместо этого мы просто наблюдаем, что делает модель, чтобы связать это с подкрепляющими обстоятельствами. С самого начала мы можем видеть детей, например, “делающих так же, как папа”. Этот способ обучения будет присутствовать на протяжении всей жизни. Большая часть нашего социального поведенческого репертуара изучается моделированием. Мы учимся быть социальными, наблюдая и взаимодействуя с другими. В процессе терапии мы находим соответствующий пример моделирования, в котором мы можем предположить, что один аспект процесса обучения заключается в подражании клиента терапевту в подходе к различным проблемам, которые представлены в терапии.
Моделируя, мы получаем доступ к ярлыку, который увеличивает вероятность выполнения определенных действий, и, в свою очередь, контактное подкрепление, которое следует за этими действиями. Но моделирование также устанавливает особый вид подкрепления: поведение в соответствии с социально значимой моделью может подкреплять само по себе. Например, как еще мы можем понять процесс обучения, стоящий за феноменом рок-звезд, которые учатся вести себя, как рок-звезды, задолго до того, как становятся рок-звездами?
При развитии самоповреждающего поведения, вероятно, моделирование оказывает глубокое влияние. Давайте посмотрим на это в ситуации Дженни.
Когда Дженни направили в отделение, у нее не было никаких известных случаев преднамеренного самоповреждения и, более конкретно, она никогда намеренно себя не резала. В это же время, однако, одна из более опытных “самоубийц” находилась в клинике в том же отделении, что и Дженни. Своими покрытыми шрамами предплечьями она производила особое впечатление на молодых пациенток.
В этой последовательности мы могли бы предположить наличие двух одновременных, но существенно различающихся обусловливающих подкреплений. С одной стороны, выполнение поведения, которое имеет сходство с социально значимыми моделями, подкрепляет само по себе. С другой стороны, выполняя эти действия, Дженни будет контактировать с подкреплениями, упомянутыми в предыдущей главе, такими как внимание других людей.
В процессе моделирования мы приобретаем большую автономию в окружающей среде, а также способность выполнять культурально передаваемые поведенческие практики. Нам больше не нужно устанавливать контроль стимулов над всем нашим поведенческим репертуаром в нашем собственном первичном опыте. Это можно сделать с помощью “пульта дистанционного управления”. Но, как всегда, когда речь идет о процессах обучения, это обоюдоострый меч, который также создает возможность установления поведения, которое менее благоприятно. Возможность автономии по отношению к окружающей среде делает огромный скачок вперед через вербальные способности человеческого субъекта. Мы рассмотрим это более подробно в следующей главе, но совпадение с моделированием, следует отметить, резко увеличивает способность организма действовать под влиянием факторов, отличных от тех, которые были в его непосредственном опыте.
Подписывайтесь, друзья, на наш телеграм-канал и группу ВК