Стимул реакция подкрепление: Психологический словарь: бихевиоризм

Техники влияния на поведение людей — Блог Викиум

Поведение – это то, что связывает человека с окружающим миром – людьми, предметами, событиями. Можно сказать, что от поведения зависит отношение окружающего мира к человеку. А с другой стороны проявления внешнего мира определяют то, как человек себя ведет. Можно ли повлиять на эту взаимосвязь? Можно ли путем коррекции поведения человека изменить отношение окружающего мира к нему? Попробуем разобраться с этими вопросами, а также узнаем, что такое прикладной анализ поведения.

Бихевиоризм — направление психологии, изучающее поведение личности

Поведением называют взаимодействие живого организма с объектами окружающей среды, измеряемое перемещением во времени или пространстве. Следствием данного взаимодействия является изменение окружающей среды.

Факторы, которые оказывают влияние на поведение человека, изучают давно. Есть даже специальное направление в психологии – бихевиоризм. Название произошло от английского слова behavior, что в переводе означает «поведение». Американский психолог Джон Уотсон основал это направление. Рассматривая возможность и необходимость изучать психологию личности с помощью точных и измеримых методов, Уотсон вывел простую формулу: стимул = реакция. Это означает, что под влиянием каких-либо стимулов у человека появляется реакция. Например, человек хочет есть, поэтому он идет в магазин за продуктами.

Бихевиоризмом занимался также И. П. Павлов, и он внес довольно большой вклад в это направление психологии. Его эксперименты на собаках показали возможность выработки безусловного и условного рефлекса в результате обучения.

Формулой стимул=реакция объясняется респондентное мотивирование. То есть, каждый мотив вызывает определенную поведенческую реакцию. Есть и понятие оперантное обусловливание поведения, которое определяется формулой: стимул+подкрепление=реакция. В этом случае реакция рождается не только от стимула, но и возможной реакции со стороны. Такой тип мотивирования подробно описывал Беррес Скиннер.

Сравнить указанные типы мотивирования довольно легко. К примеру, ребенок выходит на улицу, и задача мамы мотивировать его надеть шапку. По формуле Уотсона мы бы сказали: «Надень шапку, иначе заболеешь». Здесь стимул – нежелание заболеть – вызовет соответствующую реакцию. Однако он может быть недостаточно убедительным, ведь эти слова мамы ничем не подтверждены. Если бы однажды после этих слов ребенок вышел на улицу без шапки и сразу заболел, это стало бы твердым стимулом для него надеть шапку в следующий раз. Беррес Скиннер предложил бы сказать, например: «Надень шапку, а вечером мы пойдем с тобой гулять». То есть, стимул здесь подкреплен поощрением. И в данном случае вероятность того, что ребенок послушается, больше. Подкрепление может быть положительным и отрицательным. Однако поощрение действует лучше.

Таким образом, влиять на поведение можно. Изменяя условия окружающей среды, мы вводим личность в то или иное психологическое состояние, используя мотивационный механизм. Именно на этом основана разработанная в США методика прикладного анализа поведения. Она используется при терапии расстройств аутистического спектра. Дети с диагностированным аутизмом – это в первую очередь те, для кого подходит данный метод.

Суть, принципы и технологии прикладного анализа поведения

Этот метод иначе называется ПАП-терапия. Поведенческая терапия ориентирована на социализацию детей-аутистов. Ее проводит ментор (проводник), которым, как правило, выступает родитель. Цель ментора – создать благоприятные внешние условия, в которых ребенок сможет развиваться, социализироваться и принимать окружающую среду.

Дети с аутическими расстройствами страдают от дефицита социального взаимодействия и общения. У них небольшой круг интересов. Их особенность в том, что они выполняют повторяющиеся действия.  Прикладной анализ поведения направлен на расширение круга интересов, обучение аутистов общению с внешним миром и пониманию происходящих вокруг вещей.

В данной методике активно используются принципы бихевиоризма, такие как стимулирование и подкрепление. При этом последнее используется только в качестве поощрения. Согласно методу прикладного анализа поведения, раздражение, нетерпение и агрессия ментора исключены. Самое главное – научить ребенка воспринимать гордость и радость за успехи, терпение и упорство при неудачах.

У аутистов некоторые типы восприятия развиты лучше (слух, зрение, вкус или осязание). Поэтому при поиске подхода ментору необходимо понять, с помощью чего он сможет воздействовать на мозговую активность лучше. Для проводника методика ПАП должна стать образом жизни, только так можно добиться результатов. Его чуткость, внимательность, терпеливое отношение должны сочетаться с одновременным анализом поведения. Это требует больших усилий, но улучшение состояния ребенка станет большим вознаграждением.

Методика ПАП имеет четыре условных этапа

  1. Сигнал, ведущий к пониманию.

Работа начинается с простых шагов. К примеру, нужно добиться, чтобы ребенок сделал какое-то движение. Ментор дает сигнал, а ребенок понимает его и выдает соответствующую реакцию. Это может получиться не с первого раза, но нужно набраться терпения.

  1. Усложнение

Этот этап предполагает формирование связи простых шагов в более сложные комбинации, при котором задействуются разные отделы головного мозга. Например, если ребенок уже научился махать рукой при прощании, то теперь его нужно научить еще и говорить «пока».

  1. Генерализация навыков

Обычные сигналы преобразуются в конкретные запросы проводника. На этом этапе происходит усиленная подготовка к нахождению в обществе ребенок становится более подготовленным к жизни в обществе, может воспринимать комплексные сигналы и давать на них реакции.

  1. «Выход в свет»

Здесь предполагается непосредственно практика – ребенок, обученный ранее указанным навыкам, выходит в общество. Но при этом нужно сделать так, чтобы люди, с которыми он будет общаться, были положительно настроенными и доброжелательными.

Пройдя четыре этапа методики, ребенок сможет погрузиться в социальную среду.

Эффективность данного метода на сегодняшний день неоднократно доказана, хотя и часто подвергается критике. Метод можно применять и с обычными людьми, брать формулу Скиннера, менять свои привычки и влиять на поведение людей. А чтобы научиться понимать, почему люди ведут себя определенным образом, и предугадывать поведение окружающих, рекомендуем пройти курс «Менталист» от Викиум. Он ориентирован на развитие логического мышления. Как раз именно хорошо развитая логика нужна для правильного проведения анализа поведения.

Читайте нас в Telegram — wikium

Прикладной анализ поведения: от стимулов к реакциям

Вы когда-нибудь задумывались о том, что вся наша жизнь, в принципе, может быть охарактеризована одним единственным словом – «поведение». Все, что связывает нас с окружающими людьми, предметами, даже самим собой, – это те или иные проявления нашего поведения. А как много вы знаете об этом понятии? Когда оно зародилось? Какое место занимает в психологии? Можно ли воздействовать на свое поведение или на поведение окружающих людей и что такое прикладной анализ поведения? Давайте попытаемся постепенно ответить на все указанные вопросы.

Что такое «поведение»?

Определяя «поведение» отметим, что это взаимодействие живого организма с объектами окружающей среды, которое измеряется перемещением во времени или пространстве с одновременным изменением окружающей среды.

Наше поведение напрямую взаимосвязано с тем, что мы воспринимаем вокруг, поэтому изучение факторов, влияющих на поведение индивидуума, всегда привлекало большое количество ученых. В психологии развилось особенное направление – бихевиоризм (от англ. behavior – поведение), ставящее во главу угла изучение реакций на стимулы. Основателем бихевиоризма считается Джон Уотсон, американский психолог конца 19 – начала 20 века. Бихевиоризм отталкивался от возможности и необходимости познавать психологию личности при помощи точных и измеримых методов.

Дж. Уотсон вывел простую формулу, связанную с поведением:

Формула Джона Уотсона: Стимул = Реакция

Данная формула означает, что все поведение человека формируется в результате влияния стимулов. К примеру, мы ходим на работу, чтобы зарабатывать деньги, мы питаемся, чтобы получать энергию, мы идем в магазин за свитером, чтобы не замерзнуть зимой, мы читаем данную статью, чтобы стать более информированными и развитыми (или руководствуемся каким-либо другим мотивом, но главное, что он у нас есть). Непроизвольное моргание, дыхание и другие процессы в организме также основаны на физиологических причинах.

Позднее концепция бихевиоризма была содержательно дополнена нашим соотечественником Иваном Петровичем Павловым (1849-1936), который, проводя эксперименты на собаках, также доказал возможность выработки безусловного рефлекса (выработка слюны при виде пищи, а  точнее, при восприятии звонка) в результате научения или условного рефлекса (выдача пищи следовала после звонка).

Типы обусловливания поведения

В рамках изучения поведения стоит различать респондентное и оперантное обусловливание поведения. Два вышеуказанных ученых склонялись именно к изучению респондентного мотивирования, как раз-таки работающего по формуле «стимул-реакция», то есть за каждым мотивом следует определенный ответ в виде того или иного поведения.

Оперантное же обусловливание склоняется к формуле «стимул-подкрепление-реакция». То есть в данном случае мы руководствуемся не причиной нашего действия, а реакцией со стороны (поощрением или наказанием), и в зависимости от неё у нас складывается реакция.

Приведем пример. Ваш ребенок ходит зимой без шапки, вы за это переживаете, потому что он может заболеть. Джон Уотсон здесь предложил бы вам объяснить своему ребенку, что если он будет ходить с неприкрытой головой, он может заработать себе простуду. Либо в конце концов ваш ребенок заболеет, у него выработается реакция «хожу без шапки-болею», и он больше не будет выходить из дома в холод без головного убора.

Беррес Скиннер, как раз-таки разработавший идею оперантного обсуловливания, направил бы вас по другому пути и посоветовал бы ввести меру поощрения за то, что ребенок надевает шапку. Допустим, вы можете его похвалить, материально или идеально поощрить. Можно придумать что-то вроде этого: «Давай ты наденешь шапку, а я заберу тебя пораньше с занятий, и мы пойдем гулять». В такой ситуации ребенок наденет головной убор, потому что у него будет реакция на подкрепление – на то, что вы заберете его из школы пораньше.

При этом Скиннер указывал, что гораздо более твердо реакция закрепляется в случае поощрения, то есть позитивного подкрепления, а не наказания. Иными словами, если вы будете кричать, бить, оскорблять своих детей, вызывая страх и слезы, то реакция будет происходить, но при этом у личности будет развиваться низкая самооценка, излишнее переживание и тревога.

Обратите внимание, что таким образом мы можем влиять на поведение окружающих людей, то есть изменяя условия окружающей среды, мы вводим личность в то или иное психологическое состояния посредством мотивационного, стимулирующего механизма.

Именно на этом основывается разработанная в США методика Прикладного анализа поведения (ПАП, с английского ABA – Applied behavior analysis), направленная в большей степени на терапию с людьми, страдающими расстройствами аутистического спектра (попросту говоря, с аутистами). Давайте немного подробнее остановимся на данной методике.

Прикладной анализ поведения: сущность, этапы, критика

Прикладной анализ поведения (или ПАП-терапия/ABA-терапия) представляет собой поведенческую терапию, ориентированную на вовлечение детей-аутистов в окружающие социальные условия. При ПАП-терапии действия проводника (непосредственной личности, работающей с ребенком, как правило, кого-то из родителей) направлены главным образом на создание благоприятных внешних условий, в которых ребенок-аутист будет развиваться, социализироваться и принимать сложившуюся окружающую среду.

По сути, диагностированные аутистическим расстройством страдают от дефицита социального взаимодействия и общения, зачастую имеют неширокий круг интересов и могут выполнять повторяющиеся действия. Прикладной анализ поведения направлен как раз на нивелирование данной симптоматики, научение ребенка понимать мир, реагировать на него и успешно с ним контактировать.

Принципы бихевиоризма – стимулирование, поощрение – активно используются в данной методике. Однако важно помнить, что в данном случае от проводника должен исходить односторонний поток исключительно положительных эмоций. Вообще, данная методика, хоть и направлена на ребенка-аутиста, передается через проводника, фактически, он (она) становится главным фигурантом поведенческого анализа.

Ребенок, будучи подверженным прикладному анализу поведения, не должен видеть раздражения, нетерпения, уж тем более агрессии со стороны проводника. Первостепенной задачей является научение ребенка принимать свои эмоции:

Ментору важно сохранять спокойствие, не давать поводов для расстройства и закрытия, постоянно анализировать поведение ребенка. Некоторым аутистам присуща большая развитость слуха, другим – зрения, кто-то в большей степени познает действительность за счет вкуса, а кто-то – осязания. При поиске подхода к ребенку важно подобрать правильный канал, через который можно воздействовать на мозговую активность в большей степени.

Чтобы прикладной анализ поведения действительно работал, необходимо практиковать его ежедневно. Врачи называют цифру примерно 5-6 часов в день, однако методика ПАП должна стать образом жизни, особенно для проводника. Постоянное чуткое, внимательное, терпеливое отношение родителя (или другого проводника) при одновременном анализе поведения следует ввести в ежеминутную практику. Безусловно, это стоит больших усилий, но помните, что с улучшением состояния ребенка все будет возвращаться сторицей.

Условно выделяется четыре этапа при использовании методики ABA. Рассмотрим каждый из них.

Сигнал – понимание

На первом этапе ребенок пытается найти контакт с внешним миром, пытается понять, что от него требуют, затем оценивает это и выдает ответную реакцию на запрос из внешней среды. К примеру, проводник хочет, чтобы ребенок покачал головой. Это простой шаг на пути выстраивания более сложных комбинаций, однако он очень важен, так как на данном этапе ребенок учится воспринимать сигналы извне и реагировать на них. Очень важно также поощрение со стороны проводника, который видит успех у своего подопечного. Если же у больного не получается, наберитесь терпения – все обязательно продвинется.

Усложнение

Если на первом этапе мы учились просто распознавать сигналы и реагировать на них, то здесь мы связываем простые шаги и составляем более комплексные комбинации, задействуя разные участки мозга ребенка-аутиста. К примеру, если ранее вы учились махать рукой на прощание с кем-либо, то на втором этапе попробуйте добавить вербальный контакт –махать рукой и говорить «пока» одновременно. Задача проводника – разбудить мозг аутиста, заставить его работать. Помните, это самый малоизученный орган, подвергаемый изменениям в наиболее сложной степени. Наберитесь воли и терпения.

Генерализация навыков

Освоив два предыдущих этапа, обычные сигналы следует превратить в конкретные запросы от проводника. Степень выполнения этих запросов выражает обладание ребенком теми или иными навыками. Команды по типу «дай», «возьми», «принеси», «положи» являются кумулятивными и состоят из отдельных действий, простых шагов, которые, по идее, были изучены на первом и втором этапах. Поэтому здесь ребенок становится более подготовленным к жизни в обществе, может воспринимать комплексные сигналы и реагировать на них.

«Выход в свет»

Когда ребенок с аутистическим расстройством уже осваивает все вышеуказанные научения, он должен непосредственно выйти на практику и попробовать общаться с окружающими людьми. Не с мамой, папой, бабушкой, родственниками или психологом, а именно с чужими людьми. Тем не менее помните, что эти люди должны быть благожелательны и адекватны. Кстати, совершенно не рекомендуется вводить ребенка в среду с такими же особенными детьми, потому что их реакция может быть немного необычной, что может его смутить, расстроить.

Исходя из концепции ABA-терапии, пройдя четыре вышеописанных этапа, ребенок сможет социализироваться и погрузиться в среду других людей.

Однако многие психологи, эксперты подвергают методику ПАП критике, выражая мысль о том, что ребенок в данном случае подвергается некой дрессировке, проводник стимулирует, а ребенок исполняет команды только ради поощрения и получения похвалы. Фактически, метод ПАП основан именно на стимулах, поощрении и реакции. Однако подвергать сомнению его результативность сегодня не приходится.

Одним из менторов ABA-методики является Марина Азимова, магистр педагогических наук, доцент МГППУ, сертифицированный поведенческий аналитик, да и просто мать ребенка-аутиста. В этом видеоролике вы можете прослушать её лекцию, где она подробно делится опытом применения прикладного анализа поведения:

Методика ПАП применима не только в отношении больных аутизмом детей, но также и обычных здоровых людей самого разного возраста. Главное понимать сущность методики: берите в расчет формулу Б. Скиннера и меняйте свои привычки, а также влияйте на поведение других людей.

Кстати, отличным вариантом оказания влияния на свое поведение может служить наша онлайн-программа «Психическая саморегуляция», где за 6 недель вы научитесь бороться со стрессом и апатией, выстраивать хорошие отношения с друзьями и коллегами, а также победите прокрастинацию.

Завершая, хотелось бы напомнить, что если вам на долю выпало воспитание ребенка, страдающего аутизмом, помните, что вам это по силам и вы обязательно справитесь. Иначе, он бы не был вам послан. Главное при воспитании этого ребенка – не давать понять ему, что он сильно отличается от других. Создайте вокруг атмосферу совершенно обычного ребенка, и тогда он поверит и не будет чувствовать себя некомфортно в социальной среде.

Желаем вам удачи!

Рассмотрение бихевиоризма в качестве психологической науки о поведении

В 1913 году американский психолог Дж. Уотсон (1878-1958 гг.), который впоследствии стал теоретическим лидером бихевиоризма (от английского слова behavior, что означает «поведение»), заявил, что психология получит полное право называться наукой, только когда начнет использовать объективные экспериментальные методы изучения. Но с объективной точки зрения, возможно изучать исключительно поведение человека, проявляющееся в одной либо другой ситуации. Все, что невозможно объективно зарегистрировать, то есть человеческие мысли и сознание – все, что происходит непосредственно внутри человека, изучению уже не подлежит. Объективно изучать и регистрировать возможно исключительно реакции, внешние действия индивида, а также те стимулы и ситуации, которые к этим реакциям приводят. Согласно Дж. Уотсону, задача психологической науки состоит в том, чтобы непосредственно по реакции определять возможный стимул, а по этому стимулу предсказывать конкретную реакцию. Та либо другая поведенческая реакция проявляется на отдельный стимул, какую-либо ситуацию. Формула «стимул-реакция» (S-R) считалась ведущей в бихевиоризме.

Определение 1

С точки зрения последователей этого направления, личность человека – это некая совокупность поведенческих реакций, присущих конкретному индивиду. Новые формы поведения возникают в результате образования условных рефлексов (так называемое обусловливание).

Психологические закономерности управления поведением людей

Можно осуществлять управление поведением людей, применяя некоторые психологические закономерности.

Закон эффекта

Был определен одним из первооткрывателей бихевиористского направления Э. Торндайком (1874-1949 гг.), подчеркивает: связь между стимулом и реакцией увеличивается, когда присутствует подкрепление. Оно бывает положительного характера (некая похвала, получение ожидаемого результата, материальное вознаграждение и т.д.) либо отрицательного (наказание, болевые ощущения, критическое замечание, неудача и т.п.). Поведение индивида зачастую вытекает из ожидания какого-либо положительного подкрепления, но в редких случаях преобладает желание в первую очередь избежать отрицательного подкрепления.

Закон субъективной ценности подкрепления

Чтобы осуществлять управление поведением, важно учитывать, какое именно подкрепление, какая именно награда предпочтительна, ценна и наиболее значима для индивида на конкретный момент. В концепции бихевиоризма индивид понимается в первую очередь как действующее, реагирующее, способное к обучению существо, которое «запрограммировано» на одни либо другие реакции, действия, проявления поведения. Меняя подкрепления и стимулы, можно «программировать» индивида на предпочтительное поведение. Помимо этого, в недрах самого бихевиоризма психолог Э. Толмен (1886-1959 гг.) подверг явному сомнению схему «стимул-реакция» как чрезвычайно упрощенную и добавил к этим членам новую переменную, стоящую между ними – психические процессы конкретного индивида, напрямую зависящие от его наследственности, прошлого опыта и нынешнего физиологического состояния.

Американский психолог Б.Ф. Скиннер (1904-1990 гг.) сформулировал положение о трех типах поведения человека: безусловно рефлекторном, условно рефлекторном и оперантном. Безусловно рефлекторный и условно рефлекторный типы поведения вызываются некими стимулами и называются, в свою очередь, респондентным (или отвечающим) поведением. Они составляют некую часть репертуара поведения человека, но исключительно ими не обеспечивается полная адаптация человека к нынешней среде его обитания. Сам процесс приспособления выстраивается на основании активных проб – то есть воздействий человека на окружающий его мир.

Замечание 1

Некоторые такие пробы совершенно случайно способны привести к получению полезного результата, который из-за своей очевидной полезности закрепляется. Данные реакции не вызываются стимулом, а выделяются (можно сказать, испускаются) самим организмом. Одни из них оказываются действительно верными и поэтому подкрепляются.

Скиннер дал им название «оперантные» (реакции типа Я). По мнению Скиннера, конкретно данные реакции можно считать преобладающими в адаптивном поведении человека. Основным средством формирования нового социального поведения является подкрепление.

Информация, приобретенная при изучении животных, перенесена Скиннером на людское поведение, что привело к довольно биологизаторской трактовке человека. Для решения некоторых социальных проблем современного социума Скиннер выдвинул задачу формирования технологии поведения, призванную вести контроль одной части людей над другой частью. В роли средства управления людского поведения выступал контроль за режимом подкреплений, дающий возможность осуществлять определенное манипулирование. Получается, что Скиннер огласил еще две психологические закономерности, которые можно увидеть ниже.

Нужна помощь преподавателя?

Опиши задание — и наши эксперты тебе помогут!

Описать задание

Принцип оперантного обусловливания

Поведение живых существ в полной мере определяется последствиями, к которым оно может привести. В зависимости от того, будут ли эти последствия положительными, безразличными либо отрицательными, данный живой организм проявит определенную тенденцию повторять конкретный поведенческий акт, не придавать ему малейшего значения либо стараться полностью избегать тех действий и тех ситуаций, которые способны привести к отрицательным последствиям.

Закономерность субъективной вероятности последствий

Индивид субъективно проводит оценку доли вероятности наступления одних либо других последствий своих собственных реакций. Чем сильнее субъективная вероятность проявления отрицательных последствий, тем значительнее это влияет на поведение индивида, и тем в большей степени он склоняется к тому, чтобы отказаться от подобных инициативных действий.

Определение 1

Скиннер говорил, что личность – это определенная совокупность социальных реакций, определенных навыков, сформировавшихся в результате оперантного научения.

Под достаточным влиянием конкретной системы подкреплений и наказаний человек получает новые социальные навыки, а также другие свойства личности.

Представитель школы необихевиоризма Альберт Бандура (1925-1988 гг.) продемонстрировал, что новое поведение способно появляться не только в результате спонтанной инструментальной активности (как считал Скиннер), но и как подражание либо как результат словесного (вербального) инструктирования. Именно так были озвучены закономерности управления поведением людей, перечисленные далее.

Закономерность подражания

Индивид склонен копировать поведение других индивидов с расчетом на то, что результаты этого копирования окажутся положительными для него лично.

Закономерность научения через пример либо наблюдение

Индивиды способны учиться, просто наблюдая, читая либо слыша об определенном поведении других людей.

Закономерность самоподкрепления

Индивиды обладают способностью самостоятельно давать оценку собственному поведению и поощрять либо критиковать либо каким-то образом наказывать себя в том случае, если они нарушили общепринятые нормы, которые кажутся им правильными.

Теория Джулиана Роттера

В теории социального научения, разработанной Дж. Роттером (1916-1914 гг.), социальное поведение человека возможно обрисовать, используя нижеперечисленные понятия:

  • Поведенческий потенциал. Любой индивид обладает конкретным набором действий, поведенческих реакций, образовавшихся в течение его жизни.
  • Субъективная вероятность. С какой, как считает индивид, вероятностью, некое подкрепление будет после конкретного поведения в какой-либо ситуации (когда индивид думает, что есть высокая вероятность того либо другого вида подкрепления в этой ситуации, он быстрее усваивает нужное поведение, которое максимально соответствует и ситуации, и подкреплению).
  • Характер и ценность подкрепления. Различные индивиды ценят и выбирают различные подкрепления. Для кого-то намного более ценна устная похвала, необходимо уважение окружающих, для кого-то – материальные блага, кто-то сильнее чувствителен к наказанию и так далее.
  • Локус контроля. От латинского слова locus, что означает «место», «местоположение». Это понятие, которое ввел Роттер, разделяет индивидов по такому принципу: часть считает себя «пешкой», а часть – человеком, чьи усилия могут привести к достижению поставленной цели. Экстерналы снимают с себя ответственность за абсолютно все происходящее с ними, и перекладывают ее на окружающих и жизненные обстоятельства. Интерналы склонны считать ответственным за все положительные и отрицательные события в жизни исключительно себя самих. Проще поддаются внешнему влиянию и управлению именно экстерналы, их поведение гораздо легче программируется переменами внешних воздействий, определенных ситуаций, стимулов и подкреплений.

Сильные и слабые стороны бихевиоризма

Основными достижения бихевиоризма в качестве психологии как науки о поведении считаются внедрение объективных методов регистрации, а также анализа внешне наблюдаемых реакций, действий индивида, неких процессов и событий, а также открытие конкретных закономерностей научения, появления навыков, поведенческих реакций.

Замечание 2

Значительное влияние бихевиоризм оказал на развитие психотерапии, а также на методы программированного обучения.

Главный недостаток бихевиоризма состоит именно в недостаточном учете сложности психической человеческой деятельности, значительном сближении психики человека и животного, игнорировании процессов сознания, самоопределения индивида, творчества.

К проблеме логики развития европейской психотехники (на материале развития бихевиоризма) Текст научной статьи по специальности «Философия, этика, религиоведение»

ТЕОРИЯ И МЕТОДОЛОГИЯ

В.И. Олешкевич

К ПРОБЛЕМЕ ЛОГИКИ РАЗВИТИЯ ЕВРОПЕЙСКОЙ ПСИХОТЕХНИКИ (на материале развития бихевиоризма)

Всякое понятие, всякая идея определенным образом культурно обоснованы, являются функцией культуры и общества, где они появляются. Что можно сказать в этом отношении на счет подкрепления, каковы культурологические условия образования понятия подкрепления? Понятие подкрепления должно быть некоторым ответом культуры на изменившиеся условия ее функционирования. Как известно, понятие подкрепления появилось, складывалось и развивалось в процессе поступательного движения бихевиорального направления в психологии. Идея подкрепления, идущая от закона эффекта Э. Торндайка [5, 6, 7], постепенно операционализируется, и у Скиннера, который поставил это понятие в центр своей психологии, превращается в операционально-прагматическое понятие организации психотехнического действия по отношению к поведению людей. Таким образом, из понятия сугубо исследовательского понятие подкрепления превращается в специфически психотехническое. Такая опера-ционализация происходит на основе выделения психологической и психотехнической схемы анализа поведения, схемы «стимул — реакция». Благодаря принципу наблюдаемости, открытости этих детерминант поведения они постепенно дифференцируются, операционализируются.

Психотехническая схема «стимул — реакция» появляется в культуре, развивающейся внутри культурной оппозиции «субъект — объект», «Я — мир». Вследствие такого развития происходит объективация мира, мир превращается в объект исследования и овладения. Эта схема понимания переносится и на человека, который также становится объектом исследования. Традиция объективации человека началась с Р. Декарта, который рассматривал животных как автоматов, реагирующих на изменения среды. В американском позитивизме эта традиция продолжает свое развитие.

Но познание человека, схемы исследования психики отображают и психотехническую практику формирования психики. На самом деле человеческое сознание уже давно стало объектом манипулирования, уже давно стало глубоко рационализированным европейской культурой. Например, в психоанализе человек тоже осознается как существо глубоко объективированное, и это осознание происходит изнутри самого сознания, через практику самоосознания. Таким же образом в психоанализе достигается осознание реактивности человеческого сознания [3]. В бихевиоризме это осознание достигается другим путем, через специфическое наблюдение и исследование сознания извне, когда схема исследования формируется как проекция способа функционирования самого сознания исследователя. Состояние человека в культуре, состояние самой культуры и инициируют возникновение бихевиоризма как новой психологической парадигмы. Поэтому вопросы о том, почему появляется бихевиоризм, в чем его историческая сущность, можно трансформировать в вопрос о культурно-исторических условиях его возникновения.

Схемы исследования, которые предложил бихевиоризм, уже давно существовали в американской культуре и были важным организующим моментом ее функционирования. Задолго до исследований Торндайка, Скиннера и других психотехническая схема подкрепления уже существовала в культуре и была ее конституирующим моментом. Буржуазная культура предполагает анализ и измерение труда, свободную рабочую силу, а также систему вознаграждения труда как технику его стимуляции и управления его

эффективностью. Таким образом, подкрепление сначала существует как психотехника в новоевропейской буржуазной культуре, которая свое дальнейшее развитие находит в постиндустриальном обществе, потом становится психологией, психологической схемой исследования и, наконец, схемой управления формированием поведения или психотехникой, уже в рефлектированном виде. В этом смысле бихевиоральная психотехника уже давно существовала и работала в европейской культуре и только потом была специческим образом рефлектирована бихевиоральной психологией, а затем превратилась в реф-лектированную психотехнику.

Таким образом, феномен подкрепления является культурным явлением. Акт подкрепления осуществляется на основе идентификации с символами культуры, поэтому подкрепление в своей основе связано с образами культа и образами культуры. В этом смысле можно сказать, что подкрепляет и формирует способы подкрепления именно культура. В таком случае способ подкрепления непосредственно связан с сознанием, которое подкрепляется, и можно сказать, что способ подкрепления формирует сознание, но верно также и обратное, что существующее сознание через свои проекции внешних объектов тоже формирует способ и формы подкрепления в определенной культурной ситуации. И в этом смысле подкрепление как процесс и как функция существует не только вовне, но и внутри сознания изначально. В различных культурах можно обнаружить некоторые сквозные для них ценности подкрепления, ориентации на определенное подкрепление и подкрепители.

Развитие капитализма и наемного (свободного) труда создало необходимость объективного и всеобщего измерения труда. Развитие разделения труда приводит также и к более сложным системам его объективного определения и измерения. Все это ведет к новой организации труда и его стимулированию. Дальнейшее разделение труда, механизм рыночного регулирования производства и потребления, формирование механизма денег (этого всеобщего эталона и «всеобщего подкрепителя», по словам Скиннера) приводят к новому сознанию и новой системе подкрепления его функционирования и развития. Точное экономическое измерение работы, труда по внешне наблюдаемым продуктам на основе измерения количества и качества труда в денежном отношении позволяет организовать точное денежное вознаграждение за выполненный труд. Поэтому в буржуазной психотехнической культуре подкрепление труда и поведения вообще осуществляется довольно просто и постепенно механизируется и автоматизируется. Это становится возможным благодаря тому, что здесь все уже измерено, все соотношения реакций индивида и следующих за ними социальных стимулов вполне предсказуемы и заранее определены. В такой ситуации поведение человека действительно можно предвидеть. В этой, таким образом, рационально расчлененной системе социальной жизни возможно точное измерение подкрепления, соответствующее его дозирование в соответствии с выполненной полезной для экономической системы работой [10]. Именно в такой ситуации становится возможным определение подкрепления через его последствия. Это вполне естественно в такой культурной ситуации, в которой все стремится быть предсказуемым.

Соответствующим образом объективируются, рационализируются потребности людей и способы их удовлетворения, тоже благодаря экономическому измерению способов и средств их удовлетворения и выражению в денежной форме. Это, вероятно, одна из причин, почему в бихевиоризме отсутствует понятие потребности, к этому времени все потребности людей объективированы и измерены. Они могут быть представлены вполне в объектной форме, могут быть созданы извне, поэтому в такой ситуации понятие внешнего стимула вполне может заместить понятие потребности.

В буржуазном обществе идея подкрепления формируется сразу как идея стимулирования произвольного (заданного) поведения, а также как идея развития (стимулирования роста) выбранного поведения, система подкрепления строится так, чтобы у индивида появлялся интерес к интенсификации и расширению своей активности. То есть система подкрепления соответствует системе и идеям расширенного производства и его развития.

С другой стороны, как и экономическая культура ориентирована на накопление, так и ориентация индивида на подкрепление существует в форме влечения к накоплению подкреплений. Подкрепление строится так, что оно стимулирует желание еще большего подкрепления. Это оказывается возможным потому, что схема подкрепления является рационально прозрачной, обобщенной и предсказуемой, а также интроецируется внутрь сознания индивида.

В такой ситуации культуры и происходит формирование бихевиоризма, на основе специфического самоосознания индивида в этой культуре, на основе специфической экспликации такой ситуации, в которую человек уже изначально включен и как специфическое, хотя и неадекватное осознание этой ситуации и себя в ней. В классическом бихевиоризме данная ситуация функционирования и развития человека проецируется на животных, в экспериментах, в которых роль точно установленной и экспериментально создаваемой потребности, точно соответствующей внешнему стимулу, выполняет голод, роль подкрепления выполняет пища, а роль поведения — произвольно выбранные реакции и извне задаваемые требования к ним и к направлениям их роста. Но вначале бихевиористы как члены североамериканского общества эту схему испытали на себе, будучи включенными в социальную и культурную психотехнику жизни американского общества.

Протестантская психотехническая культура как преемник средневековой культуры была ориентирована в целом на отсроченное конечное подкрепление. Но в начале ХХ века в Европе и, прежде всего, в США начинается рост новых ценностей [8, 9]. Они ориентированы уже не на систематический труд и достижение социального и материального успеха в жизни, не на отсроченное подкрепление, но связаны с личным счастьем и удовлетворенностью жизнью в настоящий момент. В связи с этим возникает потребность получить подкрепление сразу, без всяких отсрочек.

В связи с такой переориентацией ценностей появляются и новые идеологии жизни, новые психотехники. Но вместе с этими психотехниками, вместе с психотехникой Скиннера в США происходит переход от протестантской к иной культуре, в том числе и психотехнической. В этой психотехнике во главу угла ставится, во-первых, положительное подкрепление и, во-вторых, подкрепление «мгновенное» (неотсроченное). Параллельно и навстречу этой психотехнике развиваются психотехники, ориентированные на «здесь и теперь» в «глубинной психологии» (в психоанализе, у К. Роджерса, Ф. Перлза и т. д.).

Бихевиоризм появляется, как известно, в рамках движения за объективность психологических методов и ратует за получение надежных и объективных данных о человеке, стремясь перевести психологию в разряд строгих и точных наук. Такое стремление к фундаментальному пониманию человека характерно не только для бихевиоризма. С аналогичной ситуацией мы встречаемся и в психоанализе, другом направлении новейшей психологии, казалось бы совершенно противоположном бихевиоризму. Там тоже существует принцип недоверия к сознанию, а доверия бессознательному как чему-то более объективному (или собственно объективному). В психоанализе тоже есть удобный «объективный» объект исследования. Это больные неврозами, в основном истерией, неврозом навязчивых состояний и некоторыми другими видами неврозов. У них работа бессознательного может наблюдаться в более чистом виде, чем у среднего человека. Именно в таких, «экспериментальных», психических состояниях распавшееся сознание (или бессознательное) обнаруживает свои элементы и свою структуру. И здесь также аналитик открывает сначала зверя в человеке, здесь также происходит продвижение к более непосредственному, бытийному сознанию, продвижение от неживого мышления к живому самосознанию [3].

Другими словами, и бихевиоризм, и психоанализ это движение, в сущности, в одном направлении, хотя и разными путями, это все же движение к одной цели. Психоанализ предполагает путь изнутри сознания человека, а бихевиоризм извне проявлений человеческого сознания. И это родство двух психотехник имеет общий корень ассоциативную психологию, опирающуюся на психотехнику организации ассоциативной связи, которая, с одной стороны, объективировалась вовне в психотехническую схему

«стимул — реакция», а с другой трансформировалась в технику осознания (посредством воспоминания) [4].

В бихевиоризме психотехнический схематизм ассоциативной связи проецируется вовне, интерпретируется в терминах объектных отношений и задает новую схему психотехнической деятельности, предмет психологического исследования и видения человека. Ведь что это значит, когда мы говорим, что вся совокупность человеческого поведения и его условий разбивается на два класса элементов: класс стимулов и класс реакций? Таким образом, предполагается, что поведение человека формируется извне, через воздействие на него определенного ряда стимулов. Такое утверждение, конечно, удерживает некоторое действительное положение человека в новоевропейской культуре и одновременно является психотехническим утверждением о том, что человека нужно изменять и указывает, как это нужно делать. В этом смысле такая схема является, прежде всего, психотехнической и превращение ее в схему исследования вторично. Но даже в исследовательских задачах четко просматривается психотехническая их функция, задача воздействия на человека и его изменение. Это по-прежнему все та же локковская идея человека как чистой доски, на которой общество пишет свои письмена. Задача соответственно состоит в том, чтобы изыскать, исследовать, сконструировать стимулы, которые способны изменять человека, который изначально как бы пустой, в частности в том смысле, что все люди имеют одинаковый набор врожденных реакций. Бихевио-ристы вслед за Локком утверждают, что именно внешняя среда формирует индивида. Следовательно, все проблемы сводятся к научению, поэтому бихевиоризм формируется как психология научения, можно сказать, как преимущественно педагогическая психология.

Но суть научения, согласно бихевиоральной схеме исследования, состоит в стимулировании, поскольку реакции зависят от стимулов. Стимул — это все внешнее организму, это в принципе всякое внешнее воздействие среды, которая воздействует на организм. С одной стороны, есть организм, индивид, а с другой — существует объективный мир, который на него воздействует. Индивид сам по себе пассивен, но на него воздействует объективная среда. За такой феноменологией восприятия мира стоит психология человека ХХ в., прежде всего американца. Теперь социальная и культурная среда так противопоставлена самому человеку, так организована и человек так зависим от нее, что он ощущает себя лишь в качестве воспринимающего ее воздействия. А становясь на позицию управления изолированными индивидами, психолог видит свою задачу в организации таких воздействий.

Таким образом, за понятием стимула скрывается некоторое объектное и объективированное действие и воздействие. Ведь мы же говорим: «какое действие оказал стимул», «действие стимула» и пр. Но здесь действует не субъект, а объект, субъект лишь воспринимает действия, реагирует. Что же это за объект? Общество, культура. И так обстояло дело достаточно давно, но в связи с рядом исторических условий в Америке это состояние сознания проявилось наиболее отчетливо.

Если мы прислушаемся к словам «стимул», «стимулирование», то мы услышим в них и еще один смысл. Стимулируют всегда что-то, стимул дается для чего-то, за использованием стимула стоит какое-то самосознающее существо. Мы стимулируем поведение, стимулируем труд и т. п. И именно благодаря развитию капитализма, рыночного производства, свободного (наемного) труда развивалась, разрабатывалась и рефлектировалась практика стимулирования труда. Для стимулирования труда крепостных крестьян не требовалось большой изощренности, но стимулирование труда наемных рабочих потребовало большей точности. Теперь развивается механизм денег (механизм стимулирования), труд измеряется и в соответствии со своей мерой подкрепляется. Благодаря технике измерения труда и существования всеобщего эквивалента общественных ценностей (денег, культуры денег) достигается максимально точное подкрепление труда, его физической, «наблюдаемой» части прежде всего. И это положение все более и более рефлектируется, объективируется и отчуждается от непосредственного сознания отдельного индивида,

вытесняется из его сознания. Не является ли схема исследования «стимул — реакция» проекцией именно такого объективированного состояния сознания? И эта проекция отображает действительное состояние человеческого сознания. Отдельный индивид действительно ощущает на себе воздействия некоторой безличной и объективированной среды, которая стимулирует его поведение. Классический бихевиоризм не случайно в этом смысле игнорирует понятия потребности, мотива, влечения, но ограничивается исследовательской схемой «стимул — реакция». Это тоже проекция культурного состояния человека и его сознания. Понятие мотива, в частности это, конечно, внутреннее понятие, понятие самосознания, поэтому предполагает активность индивида. Но эта активность мыслится как рефлектированная, понятие мотива имеет в себе значительную рефлексивную нагрузку и восходит, вероятно, к практике морального самоотчета и оправдания и к юридической практике объяснения и квалификации человеческих поступков. Здесь человек мыслится как самосознающее, рефлектирующее, отдающее себе отчет в своей деятельности и в этом смысле активное существо.

Создатели бихевиоризма встречаются уже с иной ситуацией или воспринимают поведение человека по-другому. И действительно, к этому времени человеческие мотивы были уже вполне объективированы, измерены и расчленены. Поэтому отпала необходимость обращаться к внутреннему, оно уже сплошь объективировано вовне. Поэтому бихевиоризм ориентирован на то, чтобы действовать извне, действовать через объективные стимулы и объективированные, «научные закономерности», ориентирован на то, что потребности людей уже давно сформированы, представляют некоторую общеизвестную константу (см., например, выделение потребностей в работах Г. Меррея и др.), и эти потребности рационально вполне прозрачны. Так и в действительности обстоит дело в рыночном обществе с его механизмом денежного регулирования отношений людей. Посредством механизма денег это все может быть измерено, а сами деньги стали всеобщим эквивалентом самого различного рода побуждений человека. Если за деньги можно приобрести все, достигнуть всего, то они становятся основным мотивом. Но эта переменная внешняя и «внешне наблюдаемая», она относится к классу стимулов.

Поэтому какой смысл изучать мотивацию, если она кажется очевидной, она давно объективирована в культуре и ее механизм давно стал механизмом управления людьми? Проблема мотивации замещается проблемой изучения стимулов. А поскольку человек рассматривается как существо принципиально реактивное, то изучение стимуляции и ее механизмов представляется вполне самодостаточным. А человек к этому времени действительно стал реактивен, а его поведение вполне предсказуемым.

Таким образом, за понятиями «стимул», «реакция» и прочими скрываются механизмы социального управления. Например, возьмем центральное для бихевиоризма понятие «поведение». Если мы вслушаемся в слово «по-ведение», то мы улавливаем признак самосознания в субъекте, которому мы этот предикат приписываем. Вести себя, по-вести себя соответствующим образом может только индивид, наделенный самосознанием и навыками самоконтроля, который может рефлексивно расслоиться, наблюдать за своим поведением и вести самого себя в определенном направлении, по-вести себя туда или в ином направлении, повести себя так или иначе, все это мы можем сказать о самосознающем, саморефлектирующем индивиде, который благодаря этому имеет выбор.

Так мы говорим ребенку, когда квалифицируем его активность: «так нужно вести себя, а так не следует», обращаясь тем самым к его самосознанию и стимулируя рефлексию поведения. Этой фразой мы говорим о том, что нужно «водить себя», как бы водить себя за руку или, как говорят немцы, уметь держать себя в руках (такова немецкая этимология термина «поведение»). Здесь слово «поведение» несет прежде всего социальный, культурный, моральный и педагогический смыслы.

Но вот бихевиористы употребляют термин «поведение» в совершенно противоположном смысле, они понимают под этим термином прежде всего нечто внешне наблюдаемое. Поведение — это то, что внешне наблюдаемо. За этим словоупотре-

блением тоже нетрудно увидеть проекцию сознания новоевропейского индивида и новоевропейской морали, в центре которой внешняя благопристойность, которая только оценивается социально и подкрепляется. Это и есть цель воспитания, это и есть социальное поведение. Поэтому и ставится задача формирования поведения, поскольку именно оно имеет социальное и социально-прагматическое значение. Это то, что наблюдаемо, что могут увидеть и оценить другие люди.

С другой стороны, поведение рассматривается как что-то не только внешне наблюдаемое, но и формируемое при помощи стимулов извне. То есть поведение — это не только внешне наблюдаемое, т. е. социальная маска человека, но и то, что сначала существует извне в виде социальных образцов, а только затем интроецируется в психическую организацию индивида. Этот процесс и описывается как процесс научения, результатом которого является навык.

Феноменология слова «навык» тоже интересна и тоже очень характерна для бихевиоризма. Это слово, также как и термин «поведение», происходит от общего корня «вести». Но когда говорят о навыке, то неявно предполагается некоторый процесс к нему приводящий — на-ведение. С этой точки зрения, чтобы образовался навык, необходимо на него навести. А наведение — это не процесс прямого воздействия, но способ некоторого опосредованного влияния.

Понятие навыка активно развивалось в процессе формирования капиталистического общества, оно уже рефлектированно существовало в раннем бихевиоризме. В ходе развития исследований в рамках бихевиоризма и таким образом саморефлексии этого направления исследований, прежде всего методической, формируется и собственно техника наведения (или подкрепления) Скиннера. Но эта идеология неявно существовала с самого начала развития бихевиоризма как некоторое его условие. Скиннер просто прямо, методически эту идеологию выразил.

В этом отношении крыса действительно «свободна», и свой метод Скиннер не случайно называл «свободным оперантным методом», а свой ящик («ящик Скиннера») — «свободной оперантной камерой». Модель эксперимента с крысами отображает образ жизни американского общества, объективированное сознание общественных атомов, внешне свободных, но внутренне сплошь определенных конструкцией общественной среды. Это развитое состояние сознания все той же протестантской культуры, с ее внешней свободой и внутренней необходимостью [4].

Исходя из всего вышесказанного, а также опираясь на другие наши работы [3, 4], мы можем сделать следующие выводы:

1. Во всякой культурной ситуации существует два рода психотехник: психотехники, инкорпорированные в культуру, и психотехники, психологически рефлектирован-ные.

2. Всякая новоевропейская психология — это проекция той психотехнической культуры, внутри которой находится исследователь.

3. Схемы психотехнической деятельности всегда существуют длительное время как инкорпорированные в культуру схемы жизнедеятельности индивида, и только на следующем этапе они превращаются в схемы исследования. И наконец, на третьем шаге развития эти схемы превращаются в рефлектированные психотехнические схемы.

Литература_

1. ВыготскийЛ.С. Проблемы развития психики// Собр. соч. Т. 3. М., 1983.

2. Гальперин П.Я. Формирование умственных действий // Хрестоматия по общей психологии: Психология мышления /Под ред. Ю.Б. Гиппенрейтер, В.В. Петухова. М., 1981. С. 78—86.

3. Олешкевич В.И. Рождение новой психотехнической культуры. М., 1997.

4. Олешкевич В.И. История психотехники. М., 2002.

5. Торндайк Э. и др. Психология обучения взрослых. М.; Л., 1931.

6. Торндайк Э. Принципы обучения, основанные на психологии. М., 1930.

7. Торндайк Э. Процесс учения у человека. М., 1935.

8. Тоффлер О. Раса, власть и культура // Новая технократическая волна на Западе. М., 1986.

С. 276-288.

9. Тоффлер О. Будущее труда // Там же. С. 250-275.

10. Шрейдер Ю.А. Социокультурные и технико-экономические аспекты развития информационной среды // Информатика и культура. М., 1990. С. 50-82.

11. Skinner B.F. Beyond freedom and dignity. New York: Knopf, 1971.

12. Skinner B.F. About behaviorism. New York: Knopf, 1974.

13. Skinner B.F. Why I am not a cognitive psychologist. Behaviorism, 5, 1— 10. 1977.

14. Skinner B.F. Reflections on behaviorism and society. Englewood Cliffs. NJ.: Prentice-Hall, 1978.

© Олешкевич В.И., 2004

Р.Г. Гаджиева

ПСИХОЛОГО-АКМЕОЛОГИЧЕСКИЙ ПОДХОД В ИЗУЧЕНИИ ВЛИЯНИЯ ГЕНДЕРНЫХ СТЕРЕОТИПОВ НА ПРОФЕССИОНАЛЬНУЮ САМОРЕАЛИЗАЦИЮ ЛИЧНОСТИ

ендерные стереотипы формируются в процессе половой социализации, которая, являясь частью общей социализации, рассматривается, с одной стороны, как процесс адаптации и интеграции человека в обществе, а с другой стороны, как процесс саморазвития и самореализации личности в социальной среде. То есть полоролевая социализация означает два взаимосвязанных процесса. Во-первых, это усвоение индивидом социального опыта, психосоциальных установок и ценностных ориентаций, определенных способов поведения и деятельности, присущих представителям того и другого пола. Во-вторых, это процесс формирования полового самосознания, которое включает в себя:

— познание своего сходства и различий с представителями своего пола и отличие от

представителей противоположного пола;

— эмоциональную оценку себя как представителя определенного пола;

— самоутверждение своего полового Я в общении и деятельности.

Активная личность, стремясь к свободе и независимости, расширяет свой личный опыт и обеспечивает реализацию своей индивидуальности. При этом индивид может в той или иной степени отходить от полового эталона, и следствием этого будет изменение не только самой личности, но и преобразования общества.

В данном контексте очевидным является необходимость рассмотрения гендерного аспекта в акмеологических исследованиях, что стало для нас возможным благодаря применению в нашем исследовании психолого-акмеологического подхода, разработанного отечественными учеными.

Акмеология, возникшая на стыке естественных, общественных и гуманитарных дисциплин, изучает феноменологию, закономерности и механизмы развития человека на ступени его зрелости. Понятие «зрелость личности» включает в себя множество характеристик, среди которых наиболее важное место занимает социализация личности.

Социализация — это аккумулирование индивидом на протяжении жизни социальных ролей, норм и ценностей того общества, к которому он принадлежит [1].

С помощью социализации общество воспроизводит социальную систему, сохраняет свои социальные структуры, формирует социальные эталоны, стереотипы и стандарты (групповые, классовые, этнические, профессиональные и др.), образцы ролевого поведения. Чтобы не быть в оппозиции по отношению к обществу, личность вынуждена усваивать социальный опыт путем вхождения в социальную среду, в систему существующих социальных связей.

В процессе социализации личность как бы «примеривает» на себя и выполняет различные роли, которые дают возможность ей проявить, раскрыть себя, то есть опреде-

возможно ли запрограммировать поведение человека? — Моноклер

Рубрики : Последние статьи, Психология

Become a Patron!

Есть ли у нас свобода воли? Возможно ли запрограммировать поведение человека до мельчайших нюансов и подавить в нём творческое мышление? И что произойдёт, если методы необихевиоризма возьмут на вооружение правительства тоталитарных государств? Знакомимся с трудами ведущего американского необихевиориста XX века Берреса Фредерика Скиннера и разбираемся в том, может ли оперантное научение быть гуманным.

Пожалуй, Фредерик Скиннер является одной из самых противоречивых фигур XX века. Одни воспринимают его как гения, разработавшего нюансы науки о поведении, другие — как символ фашизма и антигуманного отношения к личности.

В своих экспериментах Скиннер отошёл от традиционного бихевиоризма — направления в психологии, объектом изучения которого становилось поведение человека, а не его сознание. Бихевиористы считали, что любое живое существо так или иначе откликнется на какой-либо стимул, будь то физический удар или слово. При этом субъективные переживания не отменялись, но ставились в подчинённое положение.

Скиннер же стал основоположником необихевиоризма: развил ключевые идеи своих предшественников и доказал, что в общей цепочке «стимул — реакция» есть и промежуточные факторы, каждый из которых влияет на поведение живого существа.

В 1971 году «Time» назвал его одним из влиятельнейших психологов в мире. А в 1975 году он был самым известным учёным в США.

Несмотря на это, его биография до сих пор окутана мифами. Например, в сети можно найти информацию о том, что объектом исследований психолога стала его дочь, которую он поместил в специальный ящик и в течение двух лет вырабатывал в ней те или иные реакции на стимулы. Согласно этому мифу, после 30 лет Дебора Скиннер подала в суд на отца и, проиграв его, покончила с собой. На самом деле, дочь ученого оказалась не только жива, но и глубоко предана своему отцу. Об этом свидетельствует телефонный разговор между ней и журналистской Лорин Слейтер, опубликованный в книге «Открыть ящик Скиннера».

Вполне вероятно, что дурная слава ученого связана с тем, что в 1960 году в интервью, данном Ричарду Эвансу, он признался, что методы его работы можно сравнить с фашистскими. Кроме того, он сообщил, что эти методы могут быть использованы в тоталитарных режимах, так как они ставят под сомнение существование свободы воли.

В своей работе Скиннер исходил из идеи, что мышление «не играет существенной роли и даже не существует». Он считал, что психология должна сосредоточить свои силы на конкретных видах поведения, поддающихся изменению. Психолог приложил немало усилий, чтобы экспериментально доказать, что практически любые реакции и виды поведения могут быть вызваны регулярным или нерегулярным поощрением.

Свои опыты ученый проводил в знаменитых «ящиках Скиннера». Они представляли собой большие коробки, изолированные от звука и света, в которые помещали испытуемых животных. В ящике находился датчик, фиксирующий реакцию животного на стимулы. Чаще всего в распоряжении подопытных был только рычажок, нажатие на который давало надежду на пищу. Например, в рамках одного из экспериментов Скиннер помещал голодных голубей в пустые ящики. Через определенные промежутки времени птицам выдавалась еда. При этом появление корма не было связано с поведением голубей. Но птицы запоминали, что они делали перед тем, как получить корм. И очень скоро подопытные голуби крутили головами по или против часовой стрелки, тыкали клювом в определенной угол ящика и совершали иные, несвойственные им обычно действия, в надежде получить еду. Так Скиннер показал, что то, что раньше считалось независимым откликом, на самом деле может являться условным рефлексом. Позднее Скиннер назовет подобные способы программирования поведения теорией оперантного научения, а ученикам профессора удастся с помощью этого метода обучить кроликов складывать в копилку монеты, а свинью пользоваться пылесосом.

В 1948 году психолог издал утопический роман «Уолден два», в котором описал всемирную общину, управляемую психологами-бихевиористами. Этим и другими произведениями он пытался доказать миру возможность использования методов социальной инженерии. Скиннер утверждал, что если бы людьми управляли не политики, а доброжелательно настроенные психологи-бихевиористы, то мир мог бы стать счастливей.

Но мир не был готов принять теорию, отрицающую свободу воли. После публикации книги «За пределы свободы и достоинства» один из критиков заметил:

«В ней говорится о приручении человечества при помощи всеобщей школы собачьего послушания».

Несмотря на острую общественную реакцию, Скиннер продолжал изучать возможности контроля поведения. Работать с конкретным рефлексом ему казалось недостаточным. Он мечтал научиться программировать любое существо так, чтобы рефлексы превращались в более сложное, изначально свободное движение (например, исполнение танца).

Проводя опыты на крысах, он осознал, что животные начинают нажимать на рычаг, зная, что получат за это корм. Выработав рефлекс, он начал менять регулярность выдачи поощрения, что помогло ему открыть универсальные, до сих пор не опровергнутые законы поведения. После обучения той или иной реакции, крысы лишались регулярного поощрения. Корм появлялся лишь после трёх, десяти, двадцати нажатий на рычаг. При этом иногда подкрепление происходило через равные промежутки времени, а иногда и вовсе отсутствовало. Записывая временные показатели, Скиннер получил количественные данные, помогающие проанализировать процесс обучения и предсказать его исход.

Данный эксперимент показал, что лишенные надежды на корм крысы все равно продолжали жать на рычаг, ведь через какое-то время еда все-таки появлялась. Так Скиннер сделал удивительное открытие — редкое подкрепление вызывает не угасание, а активацию рефлекса. По мнению психологов, этим частично можно объяснить поведение людей в деструктивных союзах: многие из нас терпят унизительное к себе отношение, подкрепляясь нерегулярным позитивным поощрением, дающим надежду.

Казалось бы, подобный холодный расчёт лишает человечество прав на независимость. Но вопреки этому, выводы Скиннера изначально не несли в себе зла. Исследовательница его трудов, журналистка Лорин Слейтер замечает:

«Мир Скиннера обещал абсолютную свободу, полученную благодаря её противоположности: конформизму».

Однако, несмотря на успешные эксперименты Скиннера, его работа и сегодня имеет немало противников. Например, профессор Гарвардского университета Джером Каган, современник ученого, утверждает, что Скиннер всего лишь продолжил работу И. Павлова, и что его выводы никак не объясняют таких явлений, как возникновение метафор, оригинальных идей, креативного мышления, чувства вины и стыда. При этом психоанализ и другие школы частично эти явления объясняют.

Другие оппоненты замечают, что в человеческом мозге заключены две ответственные за обучение системы — базальные ганглии и фронтальная кора. Скиннер работал преимущественно с первым отделом. Между тем, именно фронтальная кора отвечает за творческое мышление и нестандартные идеи. Получается, что запрограммировать человека можно и нельзя одновременно. К счастью, некоторые процессы не поддаются оперантному научению, что развенчивает мифы о возможности использовать данный метод в тоталитарных государствах с целью всеобщего контроля.

И хотя создание всемирной управляемой общины остаётся утопией, методы Скиннера активно используются в психиатрии. В середине XX века их применяли для лечения острой шизофрении: больные начинали самостоятельно одеваться или принимать пищу, получая поощрение в виде сигарет. Позднее метод использовали для лечения фобий и панических расстройств.

Таким образом, «ящики Скиннера» смогли стать частью реальности. Сегодня психиатры могут предсказывать поведение больного и лечить аномалии с помощью положительного подкрепления. Таким же образом поведение людей можно менять в любой сфере — будь то регуляция правил дорожного движения или приучение ребенка ко сну в одиночестве. Однако сегодня методы ученого не позволяют программировать поведение от и до, и вопрос свободы воли остается открытым.


Подборка по теме
— Проблема сознания в психологии и философии: кто управляет нашими 
—  «Способность поступать иначе»: интервью с Дмитрием Волковым о проблеме свободы воли и экспериментах нейрофизиологов
— Интервью с Диком Сваабом: «Свободы действий и бездействий не существует»

 

Обложка: Б. Ф. Скиннер / © Ken Heyman-Woodfin

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Похожие статьи

Администрация МО «Бугровское сельское поселение»

26.10.2011 — 17:32

Теория оперантного научения Б. Ф. Скиннера. Подход к личности американского психолога-необихевиориста Б. Ф. Скиннера (1904–1990) касается открытых действий людей в соответствии с их жизненным опытом. Он утверждал, что поведение человека детерминировано и предсказуемо. Скиннер категорически отвергал идею о внутренних «автономных» факторах в качестве причины действий человека и пренебрегал физиолого-генетическим объяснением поведения.

Скиннер признавал два основных типа поведения: респондентное как ответ на знакомый стимул и оперантное, определяемое и контролируемое результатом, следующим за ним. При оперантном научении организм действует на окружение, производя результат, который влияет на вероятность того, что поведение повторится. Оперантная реакция, за которой следует позитивный результат, стремится повториться, в то время как оперантная реакция, за которой следует негативный результат, стремится не повторяться. По Скиннеру, поведение наилучшим образом можно объяснить в терминах реакций на окружение. Подкрепление – ключевая концепция системы Скиннера. Им описаны четыре различных режима подкрепления, которые имеют своим результатом различные формы реагирования: с постоянным соотношением; с постоянным интервалом, с вариативным соотношением и с вариативным интервалом. Было также проведено различие между первичными, или безусловными, и вторичными, или условными, подкрепляющими стимулами. Скиннер полагал, что вторичные подкрепляющие стимулы (деньги, внимание, одобрение) оказывают сильное влияние на поведение человека. Он также подчеркивал, что поведение контролируется аверсивными (неприятными) стимулами, такими как наказание и негативное подкрепление. Позитивное наказание имеет место, когда за реакцией следует неприятный стимул, а негативное наказание состоит в том, что за реакцией следует устранение приятного стимула. Напротив, негативное подкрепление происходит, когда организму удается ограничить или избежать предъявления аверсивного стимула. Скиннер боролся с использованием аверсивных методов (особенно наказания) в контроле поведения и придавал особое значение контролю посредством позитивного подкрепления.

Эволюция бихевиоризма — Txtb.ru

Перечень всех учебных материалов

Государство и право

Демография
История
Международные отношения
Педагогика
Политические науки
Психология
Религиоведение
Социология


Эволюция бихевиоризма

  Как явствует из самого названия данного направления (behavior — в переводе с английского означает “поведение”), основное внимание психологи-бихевиористы сосредоточили на изучении поведения. И поскольку они ставили перед собой задачу не только научиться понимать и предсказывать поведение, но и формировать, вырабатывать “правильное”, или “нужное”, поведение, а в конечном итоге управлять им, то главной теоретической проблемой бихевиоризма стало научение тому или иному поведению. Отсюда и название теорий, исследующих этот процесс, — теории научения. В них, прежде всего, анализируется связь между стимулом и реакцией. Стимул — это любое событие, внешнее или внутреннее, которое изменяет поведение человека или животного (организма). Реакция — это и есть изменение поведения, которое последовало в ответ на стимул. Подкрепление — еще одно ключевое понятие данных теорий. Его можно определить как любой исход, полученный в результате ответной реакции. Позитивное, или положительное, подкрепление увеличивает вероятность повторения реакции. Реакции, которые не получили положительного подкрепления в виде вознаграждения, не закрепляются. И, наконец, реакции, которые нанесли организму вред (негативное подкрепление), отвергаются. Организм стремится избегать повторения подобных действий. Таким образом, поведение в бихевиоризме определяется простой формулой:

П = С- Р,

  где П — поведение, С — стимул, Р — реакция.
  Подкрепление выступает основным фактором всякого научения. Ученых, стоящих на позициях необихевиоризма и конкретно теории научения (в западной литературе их часто называют СР-теоретиками — по аббревиатуре основных понятий стимул-реакция), мало занимает то, что происходит в промежутке между стимулом и реакцией, т. е. мыслительные и психические аспекты поведения. Их интересует лишь предшествующее событие (стимул) и последующее (реакция), другими словами, явно выраженные причина и следствие. Для СР-теоретиков не имеет практического значения, что человек думает и переживает, например, когда составляет планы на следующий день. Организм — своеобразный “черный ящик”, где можно фиксировать, лишь то, что есть на входе и что на выходе.
  Впервые ключевой принцип научения был установлен Э.Л. Торндайком и И. П. Павловым. Причем оба ученых пришли к его открытию независимо друг от друга. Торндайк назвал его “законом эффекта”, а И. Павлов — “подкреплением (Александер Ф., Селесник Ш., 1995).
  Согласно Э. Торндайку и И. Павлову, животные и люди учатся методом проб и ошибок. Когда найдена успешная, удовлетворяющая возникшую потребность модель поведения, она затем многократно повторяется и таким образом закрепляется.
  Поскольку был найден ключевой и, как тогда казалось, единственный фактор научения, то дальнейшие исследования бихевиористски ориентированных ученых направлялись преимущественно на изучение подкрепления. Режим подкрепления — отсроченное или немедленное, характер — частичное, прерывистое, постоянное, позитивное, негативное, сила, количество подкреплений — все это и стало в дальнейшем предметом самого пристального интереса ученых. Выявлялись принципы подкрепления, проводились многочисленные эксперименты, делались теоретические, математические расчеты, составлялись графики, определяющие связь поведения и подкрепления.


Теория стимула-реакции (мотивация) Скиннера — VillageProjectSNC2011

Стандарт 5: Учителя знают, как управлять классом. Учитель использует понимание индивидуальной и групповой мотивации и поведения для создания учебной среды, которая поощряет позитивное социальное взаимодействие, активное участие в обучении и самомотивацию.

Что случилось ??

Клуб мальчиков и девочек уделял большое внимание хорошему поведению. Несколько хорошо реализованных правил запрещали нецензурную лексику, неуважение к однокурсникам или другие формы ненадлежащего поведения.Учащиеся были вознаграждены и наказаны за поведение, которое они проявляли во время внеклассной программы. Студенты, пропагандирующие хорошее поведение, были положительно подкреплены «долларами», которые можно было использовать для покупки желаемых призов. Это называется экономикой токенов. С другой стороны, студенты, проявлявшие плохие привычки, наказывались забастовками. Количество ударов соответствовало строгости наказания. После нескольких ударов с родителем или опекуном ребенка свяжутся напрямую.Например, была ситуация, когда четверо детей сидели за обеденным столом до того, как пришло время обедать. Между тремя учениками разгорелся спор, и после предупреждений им были нанесены удары в надежде избавить внеклассную программу от такого рода нежелательного поведения. Между тем четвертый ребенок оставался спокойным и сидел лицом вперед, глядя на наставников. Такое поведение не осталось незамеченным, и она была вознаграждена долларом. Увидев исход обеих ситуаций, четвертый ученик, как и остальные трое, продемонстрировали «правильное» поведение.

Теория стимула-реакции Скиннера: Управление классом:

ТЕОРИЯ СТИМУЛА-РЕАКЦИЯ была разработана Б.Ф. Скиннером после экспериментов, в которых участвовали, как сделать позитивное поведение более частым и как вызвать нежелательное поведение EXTINCT . Превращение нежелательного поведения в EXTINCT означает, что поведение наказывается до тех пор, пока оно не исчезнет после стимула. В книге Скиннера S-R THEORY подкрепление используется для увеличения частоты поведения.В S-R ТЕОРИИ субъект подвергается воздействию СТИМУЛ и выполняет поведение ОТВЕТ на СТИМУЛ . Следующее поведение: REINFORCED или PUNISHED . Существует несколько различных графиков, в которых субъекту можно дать УСИЛЕНИЕ . Графики включают: ФИКСИРОВАННЫЙ ИНТЕРВАЛ , ФИКСИРОВАННЫЙ ОТНОШЕНИЕ , ПЕРЕМЕННОЕ ОТНОШЕНИЕ , ПЕРЕМЕННЫЙ ИНТЕРВАЛ . ФИКСИРОВАННЫЙ ИНТЕРВАЛ относится к тому, когда REINFORCEMENT предлагается первому правильному ответу по прошествии заданного времени.ФИКСИРОВАННОЕ СООТНОШЕНИЕ относится к случаю, когда УСИЛЕНИЕ дается после заданного количества правильных ответов. ПЕРЕМЕННОЕ ОТНОШЕНИЕ , это когда REINFORCEMENT дается после заданного количества правильных ответов, и это число изменяется после того, как поведение усиливается. Окончательное расписание — ПЕРЕМЕННЫЙ ИНТЕРВАЛ ; здесь первый правильный ответ награждается через установленное время, после подкрепления лимит времени изменяется. «Доллары» давались студентам как форма подкрепления и часто соответствовали ПЕРЕМЕННОМУ СООТНОШЕНИЮ ГРАФИК , в котором студентам давали доллары после того, как во время программы через определенное количество раз демонстрировалось положительное поведение.После того, как они получили свой доллар, установленное количество раз изменилось, чтобы ученики продолжили демонстрировать свое поведение. Часто СТИМУЛ был событием или серией событий, которые произошли с участием ребенка. Например, я был свидетелем того, как два ученика спокойно рисовали за столом, и у обоих были отдельные наборы маркеров рядом с ними. Первый ученик взял маркер, не спрашивая заранее, у другого ученика. Со стороны второго ученика это STIMULUS . Этот студент взял мой маркер, не спрашивая. Затем ученик ОТВЕТИЛ на ситуацию. Можно мне спину, когда ты закончишь? Этот ответ был правильным, и студент либо получил, либо приблизился к получению доллара за продвижение своего поведения. Во второй ситуации, свидетелем которой я стал, был ребенок, не выполняющий желаемого поведения. В этой ситуации двое студентов вместе читали книгу «Я ШПИОН». Первый ученик пододвинул книгу к себе, чтобы лучше разглядеть.Для второго ученика это был STIMULUS . Этот студент забрал у меня книгу. Тогда студент ОТВЕТИЛ : Это нечестно! Тогда они с силой потянули книгу назад. Этот ответ привлек внимание сотрудника, и студент получил удар против них как НАКАЗАНИЕ . НАКАЗАНИЕ было ответом на нежелательное поведение и использовалось, чтобы заставить его происходить реже.

Мотивация:

ЭКОНОМИКА ТОКЕНОВ , в этой ситуации используется как МОТИВАЦИЯ для учащихся внешкольной программы, чтобы продемонстрировать положительное поведение, продемонстрированное сотрудниками.ЭКОНОМИКА ТОКЕНОВ — это событие, при котором субъекты получают валюту, которую можно использовать для покупки желаемых объектов или возможностей. В этих ситуациях доллары обеспечивают учащемуся значительную МОТИВАЦИЮ для выполнения этих действий. По сути, желание приятного вознаграждения используется как МОТИВАЦИЯ для выполнения желаемого поведения. Во время внеклассной программы Клуба мальчиков и девочек дети получали доллары, когда они демонстрировали положительное поведение.Сюда входили забрать за собой после еды, разделить, помочь другим ученикам с домашними заданиями и т. Д. Затем ученик мог обменять свои доллары на маленькие игрушки, конфеты или особые привилегии. Желаемый объект варьировался от недорогого, например, прыгающего мяча за один доллар, или объект мог быть относительно дорогим, например, они могли купить дополнительные десять минут на компьютере во время домашнего задания. По сути, желание получить приятное вознаграждение МОТИВИЛО студентов к тому, чтобы они проявили положительное поведение, желаемое сотрудниками.Эта МОТИВАЦИЯ затем приводит к тому, что студенты учатся выполнять эти действия или регулярно, чтобы участвовать в TOKEN ECONOMY . Возможность получить доллар и позже купить желаемое вознаграждение представляет собой ВНЕШНЯЯ МОТИВАЦИЯ . Это означает, что источник MOTIVATION исходит из источника, который студент не контролирует напрямую, он находится вне его. ВНЕШНЯЯ МОТИВАЦИЯ — это тип мотивации, связанный с этим типом обучения, поскольку он включает обучение и мотивацию через наказание и вознаграждение.

Что такое усиление стимульного ответа? — Mvorganizing.org

Что такое усиление стимульного ответа?

Скиннер основан на идее, что обучение — это функция изменения открытого поведения. Изменения в поведении являются результатом реакции человека на события (стимулы), происходящие в окружающей среде. Когда конкретный паттерн «стимул-реакция» (S-R) усиливается (вознаграждается), индивид настраивается на ответ.

Какой пример различающего стимула?

Различительный стимул — это предшествующий стимул, который стимулирует контроль над поведением, потому что поведение надежно подкреплялось в присутствии этого стимула в прошлом.В приведенном выше примере бабушка является отличительным стимулом для поведения, когда просят конфеты.

Что такое стимул в поведении?

В психологии стимул — это любой объект или событие, которое вызывает сенсорную или поведенческую реакцию в организме. В поведенческой психологии (т. Е. Классической и оперантной обусловленности) стимул составляет основу поведения.

Какой тип стимула после поведения дает вознаграждение за это поведение?

При оперантном обусловливании положительное подкрепление включает добавление подкрепляющего стимула после поведения, которое повышает вероятность того, что такое поведение повторится снова в будущем.Когда после действия наступает благоприятный исход, событие или награда, эта конкретная реакция или поведение усиливаются.

Какие примеры положительного наказания?

Ниже приведены некоторые примеры положительного наказания:

  • Ребенок ковыряется в носу во время урока (поведение), и учитель делает ему выговор (отталкивающий стимул) перед одноклассниками.
  • Ребенок прикасается к горячей плите (поведение) и чувствует боль (отталкивающий раздражитель).

Какие бывают 5 видов арматуры?

Усилители можно классифицировать по их атрибутам:

  • Съедобное подкрепление — продукты, пользующиеся наибольшим спросом.
  • Sensory Reinforcer — Все, что доставляет удовольствие чувствам человека.
  • Материальное подкрепление — Любой материальный предмет, который ценится человеком.
  • Activity Reinforcer — Возможность повеселиться.

Какие бывают примеры усилителей?

Лучшие подкрепления — это наименее искусственные действия или предметы, которые все равно будут работать для улучшения поведения. Например, если прыжки на батуте и рисование картинок укрепляют ребенка, рисование картинок может быть более подходящим подкреплением для выполнения домашнего задания по письму от руки.

Какие подкрепления хорошие?

Особые события, еда, занятия и материальные предметы часто используются в качестве положительных подкреплений, чтобы увеличить частоту желаемого поведения. Таким образом, эффективные подкрепления могут побудить учащихся к успешному поведению в классе. Однако, чтобы быть эффективными, вознаграждения должны быть подкрепляющими.

Что такое положительное наказание в оперантном обусловливании?

Позитивное наказание — это концепция, используемая в теории оперантного обусловливания Б.Ф. Скиннера.В случае положительного наказания оно включает в себя представление неблагоприятного исхода или события после нежелательного поведения. Когда субъект совершает нежелательное действие, целенаправленно применяется какой-то негативный результат.

Какие примеры положительного поведения?

Позитивное поведение, ориентированное на отношения, можно описать как:

  • Альтруист: проявляет бескорыстную заботу о других.
  • Забота: желание помочь людям.
  • Сострадательный: испытывает или проявляет сочувствие или заботу о других.
  • Внимательно: думает о других.
  • Верный: быть верным.
  • Беспристрастный: относится ко всем одинаково; честно и справедливо.

Что такое отрицательное наказание в оперантной обусловленности?

Негативное наказание — важное понятие в теории оперантного обусловливания Б. Ф. Скиннера. В случае отрицательного наказания это означает отнятие чего-то хорошего или желаемого, чтобы уменьшить вероятность определенного поведения.

Штраф — положительное или отрицательное наказание?

Этот штраф применяется с очевидным намерением снизить скорость движения.Отрицательное наказание также называется ценой ответа. Таким образом, штраф со штрафом может быть примером негативного наказания для некоторых людей, но не это заставило меня снизить скорость.

Что считается положительным наказанием?

Положительное наказание — это форма изменения поведения. Положительное наказание — это добавление чего-то к этому, что приведет к неприятным последствиям. Цель состоит в том, чтобы снизить вероятность повторения нежелательного поведения в будущем.

Билет — положительное наказание?

Положительное наказание: вы едете быстро, получаете штраф за превышение скорости, вы больше не едете быстро. Что-то было добавлено (штраф за превышение скорости), чтобы уменьшить ваше поведение при быстром вождении. Вот пример отрицательного наказания: дети дерутся из-за игрушки. Мама уносит игрушку.

Тайм-аут — положительное наказание?

В многословии прикладного анализа поведения (ABA) тайм-аут считается процедурой отрицательного наказания. «Негатив» означает, что что-то удаляется, а «наказание» относится к снижению поведения.«Позитивный» означает, что что-то добавлено, а «подкрепление» относится к возрастающему поведению.

Что такое положительный тайм-аут?

По ее словам, детям младше 3 лет не следует помещать в какие-либо тайм-ауты, но у детей старшего возраста может быть то, что она называет «положительными тайм-аутами». Это означает, что ребенок, часто в сопровождении своих родителей, отправляется в «хорошее» место, чтобы успокоиться, прежде чем пытаться извлечь уроки из конфликта.

Что можно сделать вместо тайм-аута?

Вот лишь 12 из множества способов управлять дисциплиной без наказания.

  • Устанавливайте границы в разумных пределах.
  • Профилактика, профилактика, профилактика.
  • Знайте, что подходит для развития.
  • Пусть плачут.
  • Назовите эту эмоцию — и посочувствуйте.
  • Оставайся с ними.
  • Будь джедаем.
  • Узнайте, что происходит на самом деле.

Как тайм-аут влияет на ребенка?

Эмоциональная боль так же реальна для мозга, как и физическая. Кроме того, тайм-аут: заставляет нашего ребенка злиться.Снижает способность нашего ребенка развивать эффективные навыки совладания с собой.

Что такое техника игнорирования?

Думайте об игнорировании как о противоположности обращению внимания. Когда вы игнорируете своего ребенка, вы не пренебрегаете им и не ждете, пока он плохо себя ведет. Вместо этого вы отвлекаете все свое внимание от ребенка и его поведения.

Что вы делаете, когда у вашего ребенка нет тайм-аута?

Что делать, если мой ребенок отказывается идти в тайм-аут?

  1. Подарите выбор.Он может сотрудничать или потерять привилегию, например, экранное время.
  2. Предложите перерыв за хорошее поведение. Вы можете сказать: «Тайм-аут обычно составляет три минуты, но если вы пойдете сейчас и посидите спокойно, то будет две».
  3. Возьми сам.

Как наказать ребенка, которому все равно?

Четко выражайте ожидания: дайте детям шанс добиться успеха, напомнив им, чего от них ждут. Примите естественные последствия: когда наказание связано с правонарушением и логично, у детей больше шансов изменить свое поведение.Хвалите правильные действия: не наказывайте только за неправильное поведение.

В каком возрасте отцу следует перестать мыться с дочерью?

«Общее практическое правило заключается в том, что к тому времени, когда дети достигнут школьного возраста, примерно к пяти годам, они не должны принимать душ вместе с вами», — говорит доктор Ричард Бейер, лицензированный психолог из Аркадии, Калифорния. «Это общепринятая точка зрения, общая линия отсечения».

Это нормально, когда отец принимает душ вместе с сыном?

Но это не невозможно.Родители часто расходятся во мнениях по поводу наготы и совместного принятия душа. Нет ничего вредного в том, что папа и сын принимают душ вместе, если им обоим это кажется легким и естественным. Это может быть просто частью их распорядка дня, как если бы два человека стояли рядом и чистили зубы.

Странно купаться с ребенком?

Во многих семьях совершенно нормально и здорово купаться или находиться голышом вместе с маленьким ребенком. Поможет, если он объяснит, что вы сами не купаетесь с ребенком; дело не в том, что вы думаете, что в ней есть что-то ненадежное или неправильное как человек или лицо, ухаживающее за ним.

Странно купаться с младенцем?

Настоящая красота купания с младенцем в том, что этим опытом можно поделиться на долгие месяцы. Конечно, к тому времени принятие ванны с малышом будет больше похоже на игру в воде, чем на прижимание к груди, но это нормально.

Как часто следует купать младенцев?

AAP рекомендует купать ребенка не чаще трех дней в неделю. 2 Конечно, даже это не жесткое правило. Если вы хотите чаще купать ребенка, это нормально, и если вы купаете ребенка только один или два дня в неделю (но вычищайте любые другие загрязнения и следите за тем, чтобы область их подгузников была чистой), это тоже хорошо!

Это плохо — позволять ребенку спать с вами?

Доктор.Басора-Ровира напоминает родителям, что младше 12 месяцев нельзя спать вместе. В 2016 году AAP обновила свои рекомендации по синдрому внезапной детской смерти (СВДС), чтобы рекомендовать совместное проживание в комнате в течение первого года жизни ребенка, но избегать совместного использования постели из-за риска случайного удушья.

Когда лучше перестать спать?

Когда прекращать совместный сон AAP рекомендует не спать вместе в любое время, особенно когда ребенку меньше четырех месяцев. Организация также рекомендует, чтобы младенцы спали в той же комнате, что и их родители, в кроватке или люльке, по крайней мере, шесть месяцев, но предпочтительно год.

Reinforcement — Scholarpedia

Действия после публикации

Куратор: Рой Уайз

Подкрепление — термин, используемый теоретиками обучения для описания основного процесса ассоциативного обучения.

История

Термин подкрепление был введен Павловым в 1903 году для описания усиления связи между безусловным и условным стимулом, возникающего при их совместном представлении.Если ассоциация периодически не «подкрепляется» таким спариванием, эффективность условного раздражителя падает: условный ответ угасает . Для Павлова любой безусловный раздражитель, такой как еда или дуновение воздуха в глаза, был потенциальным подкреплением; соединение такого стимула с нейтральным стимулом составляло подкрепление. Этот термин для Павлова обозначал усиление (и установление) связи между условным раздражителем и его безусловным родительским раздражителем (Павлов, 1928).

Термин «подкрепление» в настоящее время используется больше по отношению к обучению реагированию, чем к обучению по стимулам. Торндайк первым ввел концепцию подкрепления реакции, предположив, что ответы, за которыми «внимательно следит удовлетворение», будут «более прочно связаны с ситуацией, так что, когда она повторится, они с большей вероятностью будут повторяться». В этом заключается суть Закона Торндайка (Thorndike, 1911) , закона эффекта , более формальной формулировки «вдавливания» связей между стимулами и ответами, которые он ввел десятью годами ранее (Thorndike, 1898).Хотя Торндайк обсуждал сущностное понятие подкрепления, только в 1933 году Торндайк (Thorndike, 1933) и Скиннер (Skinner, 1933) приняли термин Павлова «подкрепление» для обозначения усиления ассоциаций «стимул-реакция».

В то время как Скиннер первоначально думал об инструментальном поведении и использовал термин «подкрепление» в рамках павловской обусловленности, он вскоре (Скиннер, 1937) пришел к выводу, что стимульное (павловское) и ответное («оперантное» или «инструментальное») обучение включают в себя различные принципы и требуя различных рамок.Он пришел к отрицанию того, что то, что мы считаем «целенаправленным» поведением, изначально вызывается внешним стимулом, и вместо этого утверждал, что первоначальные действия, которые впоследствии формируются в инструментальное поведение, испускаются организмом случайным образом, подобно тому, как частицы испускаются случайным образом. радиоактивной молекулой. Он переименовал то, что раньше называлось «ответ», назвав его «оперантом», но теперь этот термин включал управляющий стимул в так называемую трехчленную непредвиденную ситуацию : подкрепление усиливает реакцию в присутствии контролирующей или «различительный» стимул.Его новая формулировка была: «Если за появлением операнта следует предъявление подкрепляющего стимула, сила увеличивается» (Скиннер, 1938), стр. 21. Одна проблема с формулировкой Скиннера заключается в том, что он не уточняет в своем формальном утверждении. , что именно усилено. В другом месте он указывает, что «оперант» усиливается. Под этим он подразумевает, что частота его увеличилась.

  • Для Павлова была усилена ассоциация между двумя стимулами (S-S-обучение).
  • Для Торндайка была усилена ассоциация между стимулом и реакцией (обучение S-R).
  • Для Скиннера нет отношений, которые нужно укреплять; нет стимула к участию в ассоциации. Есть только оперант, связанный только вероятностно, а не причинно, с любым предшествующим событием, с которым он мог бы быть связан.

Однако через несколько страниц определения интересующего поведения как «операнта» Скиннер возвращается к общепринятому термину «ответ»:

«В первой главе указывалось, что существует два типа условных рефлексов, определяемых в зависимости от того, коррелирует ли подкрепляющий раздражитель с реакцией» (Скиннер, 1938), стр. 62.

На протяжении его третьей и последующих глав на ординатах его графиков появляются «ответы» или «ответы в час». Просто прямо заявив, что оперант является поведенческой эмиссией, а не реакцией на вызывающий стимул, Скиннер продолжает предположить, что животное узнает взаимосвязь между его поведением и его последствиями, форма обучения, обозначенная как «реакция-результат» ( RO) обучение более молодыми работниками. Таким образом, в рамках теории Скиннера именно связь между ответом и его результатом усваивается и «подкрепляется».”

Механизмы

Первая великая теория подкрепления заключалась в том, что оно запечатлевается в памяти, уменьшая физиологические потребности или дисбаланс (Hull, 1943). Идея была привлекательной, потому что говорила об очевидном факте, что обучение было механизмом, с помощью которого высшие животные могли удовлетворять свои потребности, несмотря на изменения окружающей среды, которые бросали вызов механизму инстинктов. Однако он был близоруким, поскольку имел дело только с обучением по реакции, а не со стимулированным обучением, для которого этот термин был впервые применен.Даже в случае обучения реагированию вскоре стало ясно, что уменьшение потребности не является необходимым условием подкрепления. Наиболее показательной была демонстрация того, что крысы научатся работать с подсластителями, не имеющими пищевой ценности (Sheffield and Roby, 1950), или с прямой электрической стимуляцией определенных мозговых путей (Olds and Milner, 1954). Жаждущие крысы навязчиво слизывают воздушный поток, который испаряет слюну и еще больше обезвоживает животное (Freed and Mendelson, 1974). Действительно, поведение животных изобилует примерами подкрепления, которое не снижает очевидной физиологической потребности (Harlow, 1953).

Теории подкрепления, которые постулируют физиологические механизмы, делятся на две категории: одна, которая пытается охарактеризовать анатомический субстрат (Glickman and Schiff, 1967; Gallistel et al., 1981; Wise, 2002: см. Раздел «Дифференциация от вознаграждения» ниже), и вторая, которая пытается охарактеризовать анатомический субстрат. для характеристики критических нейрофизиологических или нейрохимических событий. Внимание к критическим событиям сосредоточено вокруг понятия консолидации памяти; штампование или усиление памяти и консолидация памяти концептуально неразличимы (Landauer, 1969).

Доказательства того, что подкрепления улучшают консолидацию памяти, получены в исследованиях, в которых подкрепление вводится после несвязанного тренировочного эпизода. Прототипная демонстрация включала в себя задачу избегания понижения; животные, которым был предоставлен доступ к пище после тренировочных испытаний, показали более сильное сохранение тренировки избегания, чем животные, которым не давали немедленную пищу (Huston et al., 1974). Сходным образом,

  • удар ногой после испытания может усилить консолидацию памяти (White and Legree, 1984).
  • Пост-испытательный прием сахарозы также очень эффективен;
  • сахарин после испытаний меньше, несмотря на сравнение изогедонических концентраций (Messier and White, 1984).

Клеточная основа консолидации памяти — область активных исследований и гипотез. Ряд доказательств подтверждает, что дофамин важен для инструментального обучения с едой, стимуляции мозга и подкрепления лекарствами (Wise, 2004). Более того, высвобождение дофамина после испытаний может улучшить консолидацию памяти (White, 1996).Наконец, дофамин, по-видимому, играет важную роль в долгосрочной потенциации и долгосрочной депрессии у млекопитающих, моделях обучения и памяти на клеточном уровне (Wise, 2004), точно так же, как серотонин играет такую ​​роль в аплизии (Kandel, 2001). . Однако дофамин не играет абсолютно важной роли. В то время как крысы, получавшие антагонисты дофамина, ведут себя так, как будто еда, стимуляция мозга и вызывающие привыкание психомоторные стимуляторы больше не усиливают, нокаутированные мыши, которым не хватает дофамина с рождения, могут научиться вкусовым предпочтениям (Cannon and Palmiter, 2003), и, если им дают кофеин, пища вознаграждается. Привычки реагирования на Т-образный лабиринт (Robinson et al., 2005). Таким образом, другие системы способны брать на себя эти функции у мышей, рожденных с дефицитом дофамина.

Отличие от «награды»

Различить понятия подкрепления и награды сложно из-за допущений здравого смысла, часто связанных с последним. Многие ученые используют термин «подкрепление» и избегают термина «вознаграждение» на основании точности и объективности, в то время как другие ученые, также во имя точности, предпочитают термин «вознаграждение» (Wise, 1989).

Наиболее широко распространенное различие состоит в том, что награды — это положительных подкреплений , объектов или событий, к которым приближаются, но не отменяются, в то время как подкрепление не обязательно. Связанный с этим подтекст состоит в том, что вознаграждения часто воспринимаются как психологически гедонистические, в то время как подкрепления не обязательно. Термин «вознаграждение» с этой точки зрения является синонимом фразы «положительное подкрепление» (White, 1989). Класс подкреплений включает отрицательных подкреплений , словосочетание со своими собственными определениями.Отрицательное подкрепление — это подкрепление, которое возникает в результате прекращения продолжающегося, обычно отталкивающего, состояния. В таком случае, называем ли мы отвращение отрицательным подкреплением или наказанием? В популярном употреблении нет единого мнения по этому вопросу, но в специальной литературе предъявление болезненного стимула обозначается как наказание, а не отрицательное подкрепление.

Одна группа специалистов, которая часто использует термин «вознаграждение», а не термин «подкрепление», включает в себя тех, кто изучает животных, обученных нажимать на рычаг для прямой электрической стимуляции мозга.В этом случае стимуляция имеет зависящий от памяти усиливающий эффект, но также не зависящий от памяти мгновенный «затравочный» эффект. Эффект прайминга заряжает животное энергией и ненадолго увеличивает вероятность того, что вызванный им ответ будет повторяться. Этот эффект не сохраняется в памяти. Эффективность прайминга снижается в течение десятков секунд, тогда как усиливающие (после испытания) эффекты стимуляции запоминаются на несколько дней (Gallistel et al., 1974). Усиливающий эффект пост-пробного подкрепления находит свое отражение в долговременной памяти, тогда как прайминговый эффект досудебного предъявления той же стимуляции — нет.Поскольку животное обычно отвечает на стимуляцию 50-100 раз в минуту, в этих исследованиях стимулирующий эффект каждой стимуляции весьма значителен. По этой причине стимуляцию часто называют «вознаграждением за стимуляцию мозга» — фразой, которая не различает стимулирующие и подкрепляющие действия, которые вместе определяют скорость реакции животного (Wise, 1989). Тот факт, что физиологические психологи предпочитают термин вознаграждение, в то время как поведенческие фармакологи предпочитают термин подкрепление (несмотря на тот факт, что препараты, принимаемые самостоятельно, например, стимуляция мозга самостоятельно, обладают как прижигающим, так и подкрепляющим действием: Пикенс и Харрис, 1968). добавляет к неуверенности неспециалистов в том, какой термин следует предпочесть.

Субъективные корреляты

В то время как положительные подкрепления часто ассоциируются с сознательным удовольствием, неясно, действительно ли они таковы. Также неясно, должны ли отрицательные подкрепления ассоциироваться с сознательной болью или дистрессом. Неясно, есть ли у подкрепления необходимые субъективные корреляты. В самом деле, субъективные оценки двух наборов подкрепляющих стимулов не обязательно предсказывают, какой набор субъект будет нажимать на рычаг для просмотра (Aharon et al., 2001).Люди сообщают, что субъективное удовольствие от инъекций героина или кокаина резко уменьшается при повторном употреблении наркотиков, но инъекции по-прежнему оказывают сильное влияние на их поведение, связанное с поиском наркотиков. Возможно, что не существует сознательной корреляции фундаментального процесса подкрепления, и что удовольствие (или боль) сообщается просто как наилучшее предположение субъекта о том, что повлияло на его поведение. Например, исследования на людях субъективных коррелятов мотивации и подкрепления и попытки смоделировать субъективные состояния у животных привели к выводу, что желание стимула и симпатия к стимулу не обязательно являются сознательными переживаниями (Berridge and Winkielman, 2003).

Список литературы

Aharon I, Etcoff N, Ariely D, Chabris CF, O’Connor E, Breiter HC (2001) Красивые лица имеют переменную ценность вознаграждения: фМРТ и поведенческие доказательства. Нейрон 32: 537-551.

Берридж К.С., Винкельман П. (2003) Что такое бессознательная эмоция? (Случай неосознанной «симпатии»). Познание и эмоции 17: 181-211.

Берридж К.С., Робинсон Т.Э. (2003) Награда за парсинг. Trends Neurosci. 26 (9): 507-13. Рассмотрение. Ошибка в: Trends Neurosci. 26 (11): 581.

Cannon CM, Palmiter RD (2003) Награда без дофамина.Журнал неврологии 23: 10827-10831.

Freed WJ, Mendelson J (1974) Воздушный поток: жаждущие крысы предпочитают теплый сухой воздушный поток теплому влажному воздушному потоку. Физиология и поведение 12: 557-561.

Gallistel CR, Stellar JR, Bubis E (1974) Параметрический анализ вознаграждения за стимуляцию мозга у крысы: I. Переходный процесс и процесс, содержащий память. Журнал сравнительной и физиологической психологии 87: 848-859.

Gallistel CR, Shizgal P, Yeomans J (1981) Портрет субстрата для самостимуляции.Психологический обзор 88: 228-273.

Glickman SE, Schiff BB (1967) Биологическая теория подкрепления. Психологический обзор 74: 81-109.

Harlow HF (1953) Мыши, обезьяны, люди и мотивы. Психологический обзор 60: 23-32.

Hull CL (1943) Принципы поведения. Нью-Йорк: Appleton-Century-Crofts.

Huston JP, Mondadori C, Waser PG (1974) Содействие обучению вознаграждением за процессы памяти после испытаний. Experietia 30: 1038-1040.

Kandel ER (2001) Молекулярная биология хранения в памяти: диалог между генами и синапсами.Наука 294: 1030-1038.

Ландауэр Т.К. (1969) Армирование как уплотнение. Психологический обзор 76: 82-96.

Мессье C, Уайт Н.М. (1984) Случайные и непредвиденные действия сахарозы и усилителей сахарина: влияние на вкусовые предпочтения и память. Физиология и поведение 32: 195-203.

Olds J, Milner PM (1954) Положительное подкрепление, производимое электрической стимуляцией области перегородки и других областей мозга крысы. Журнал сравнительной и физиологической психологии 47: 419-427.

Павлов И.П. (1928) Лекции по условным рефлексам. Нью-Йорк: Международные издательства.

Пикенс Р., Харрис В.К. (1968) Самостоятельное введение d-амфетамина крысами. Психофармакология 12: 158-163.

Робинсон С., Сандстром С.М., Дененберг В.Х., Палмитер Р.Д. (2005) Определение того, регулирует ли дофамин пристрастие, желание и / или узнавание о наградах. Поведенческая неврология 119: 5-15.

Sheffield FD, Roby TB (1950) Наградная ценность непитательного сладкого вкуса.Журнал сравнительной и физиологической психологии 43: 471-481.

Скиннер Б.Ф. (1933) Скорость установления дискриминации. Журнал общей психологии 9: 302-350.

Скиннер Б.Ф. (1937) Два типа условных рефлексов: ответ Конорскому и Миллеру. Журнал общей психологии 16: 272-279.

Скиннер Б.Ф. (1938) Поведение организмов. Нью-Йорк: Appleton-Century-Crofts.

Торндайк Е.Л. (1898) Животный интеллект: экспериментальное исследование ассоциативных процессов у животных.Психологические монографии 8: 1-109.

Торндайк Е.Л. (1911) Животный интеллект. Нью-Йорк: Макмиллан.

Торндайк Э.Л. (1933) Теория воздействия на него последствий связи. Психологический обзор 40: 434-439.

White NM (1989) Награда или поощрение: в чем разница? Neurosci Biobehav Rev 13: 181-186.

Уайт Н.М. (1996) Наркотики, вызывающие привыкание, как подкрепление: множественные частичные действия на системы памяти. Наркомания 91: 921-949.

White NM, Legree P (1984) Влияние посттренировочного воздействия отталкивающего стимула на удержание.Физиологическая психология 12: 233-236.

Мудрый Р.А. (1989) Мозг и награда. В: Нейрофармакологическая основа вознаграждения (Либман Дж. М., Купер С. Дж., Ред.), Стр. 377-424. Оксфорд: Издательство Оксфордского университета.

Мудрый Р.А. (2002) Схема вознаграждения за мозг: понимание бессмысленных стимулов. Нейрон 36: 229-240.

Мудрый Р.А. (2004) Дофамин, обучение и мотивация. Nature Reviews Neuroscience 5: 483-494.

Внутренние ссылки

  • Ховард Эйхенбаум (2008) Память.Scholarpedia, 3 (3): 1747.
  • Вольфрам Шульц (2007) Награда. Scholarpedia, 2 (3): 1652.

Внешние ссылки

См. Также

Классическое обусловливание, оперантное обусловливание, обучение с подкреплением, вознаграждение, сигналы вознаграждения

оперантное кондиционирование | Безграничная психология

Основные принципы оперантного обусловливания: закон действия Торндайка

Закон

Торндайка гласит, что поведение изменяется в зависимости от его положительных или отрицательных последствий.

Цели обучения

Свяжите закон действия Торндайка с принципами оперантного кондиционирования

Ключевые выводы

Ключевые моменты
  • Закон эффекта гласит, что ответы, которые производят удовлетворительный эффект в конкретной ситуации, с большей вероятностью будут повторяться снова, в то время как ответы, вызывающие дискомфортный эффект, с меньшей вероятностью будут повторяться.
  • Эдвард Л. Торндайк первым изучил закон эффекта, помещая голодных кошек в коробки с головоломками и наблюдая за их действиями.Он быстро понял, что кошки могут научиться эффективности определенного поведения и будут повторять то поведение, которое позволяло им убегать быстрее.
  • Закон эффекта действует и в любом человеческом поведении. С юных лет мы узнаем, какие действия полезны, а какие вредны, с помощью аналогичного процесса проб и ошибок.
  • Хотя закон эффекта объясняет поведение с внешней, наблюдаемой точки зрения, он не учитывает внутренние, ненаблюдаемые процессы, которые также влияют на модели поведения людей.
Ключевые термины
  • Закон эффекта : Закон, разработанный Эдвардом Л. Торндайком, который гласит, что «реакции, которые производят удовлетворительный эффект в конкретной ситуации, с большей вероятностью будут повторяться в этой ситуации, а реакции, вызывающие дискомфортный эффект, становятся менее вероятными. повториться в этой ситуации ».
  • модификация поведения : Акт изменения действий и реакций на стимулы посредством положительного и отрицательного подкрепления или наказания.
  • методом проб и ошибок : процесс поиска решения проблемы путем опробования множества возможных решений и обучения на ошибках до тех пор, пока не будет найден способ решения проблемы.

Оперантное обусловливание — это теория обучения, которая фокусируется на изменениях наблюдаемого поведения человека. При оперантном обусловливании на новое или продолжающееся поведение влияют новые или продолжающиеся последствия. Исследования, касающиеся этого принципа обучения, впервые начались в конце 19 века Эдвардом Л.Торндайк, установивший закон действия .

Эксперименты Торндайка

Самая известная работа Торндайка связана с тем, что кошки пытаются перемещаться по различным коробкам-головоломкам. В этом эксперименте он поместил голодных кошек в самодельные ящики и записал время, необходимое им для выполнения необходимых действий, чтобы сбежать и получить свою пищу. Торндайк обнаружил, что при последовательных испытаниях кошки будут учиться на предыдущем поведении, ограничивать неэффективные действия и быстрее выходить из ящика.Он заметил, что кошки, похоже, научились путем сложного процесса проб и ошибок, какие действия следует продолжать, а от каких отказаться; Хорошо натренированная кошка могла быстро запомнить и повторно использовать действия, которые позволили ускользнуть от кормовой награды.

Коробка-головоломка Торндайка : На этом изображении показан пример коробки-головоломки Торндайка рядом с графиком, демонстрирующим обучение кошки в коробке. По мере того, как количество испытаний увеличивалось, кошки могли быстрее убегать, обучаясь.

Закон действия

Торндайк понял, что не только стимулы и реакции связаны, но и что поведение может быть изменено последствиями. Он использовал эти результаты, чтобы опубликовать свою знаменитую теорию «закона эффекта». Согласно закону эффекта, поведение, за которым следуют удовлетворяющие организм последствия, с большей вероятностью будет повторяться, а поведение, которое сопровождается неприятными последствиями, с меньшей вероятностью будет повторяться. По сути, если организм делает что-то, что приводит к желаемому результату, у него больше шансов сделать это снова.Если организм делает что-то, что не приводит к желаемому результату, у него меньше шансов сделать это снова.

Закон эффекта : Изначально кошки демонстрировали различное поведение внутри коробки. В ходе последовательных испытаний действия, которые помогли сбежать из коробки и получить награду за еду, повторялись и повторялись с большей частотой.

Закон эффекта Торндайка теперь информирует многое из того, что мы знаем об оперантной обусловленности и бихевиоризме. Согласно этому закону, поведение изменяется в зависимости от его последствий, и эту базовую взаимосвязь «стимул-реакция» может усвоить оперантный человек или животное.Как только связь между поведением и последствиями установлена, реакция усиливается, и ассоциация несет исключительную ответственность за возникновение такого поведения. Торндайк утверждал, что обучение — это просто изменение поведения в результате последствий, и что если действие приносит вознаграждение, оно запечатлевается в сознании и доступно для последующего воспроизведения.

С юных лет мы узнаем, какие действия полезны, а какие вредны, методом проб и ошибок.Например, маленький ребенок играет со своим другом на детской площадке и игриво отталкивает подругу от качелей. Ее подруга падает на землю и начинает плакать, а затем отказывается играть с ней до конца дня. Действия ребенка (подталкивание друга) зависят от их последствий (подруга отказывается играть с ней), и она учится не повторять это действие, если хочет продолжить игру со своим другом.

Закон эффекта был расширен на различные формы модификации поведения.Поскольку закон эффекта является ключевым компонентом бихевиоризма, он не включает никаких ссылок на ненаблюдаемые или внутренние состояния; вместо этого он полагается исключительно на то, что можно наблюдать в поведении человека. Хотя эта теория не учитывает человеческое поведение в целом, она применялась почти ко всем сферам человеческой жизни, но особенно к образованию и психологии.

Основные принципы оперантного кондиционирования: Скиннер

Б. Ф. Скиннер был поведенческим психологом, который расширил область знаний, определив и детально проработав оперантную обусловленность.

Цели обучения

Обобщите исследование Скиннера по оперантному обусловливанию

Ключевые выводы

Ключевые моменты
  • Б. Ф. Скиннер, поведенческий психолог и ученик Э. Л. Торндайка, внес свой вклад в наш взгляд на обучение, расширив наше понимание обусловливания, включив в него оперантное обусловливание.
  • Скиннер предположил, что если за поведением следует подкрепление, то это поведение с большей вероятностью будет повторяться, но если за ним последует наказание, вероятность его повторения меньше.
  • Скиннер провел свое исследование на крысах и голубях, представив им положительное подкрепление, отрицательное подкрепление или наказание в различных графиках, которые были разработаны для создания или подавления определенного целевого поведения.
  • Скиннер не включил в свои исследования возможности для таких идей, как свобода воли или индивидуальный выбор; вместо этого он утверждал, что любое поведение можно объяснить с помощью изученных физических аспектов мира, включая историю жизни и эволюцию.
Ключевые термины
  • наказание : Акт или процесс наложения и / или применения санкции за нежелательное поведение при формировании условий для желаемого поведения.
  • отвращение : склонность к отталкиванию, вызывающая уклонение (ситуации, поведения, предмета и т. Д.).
  • суеверие : Вера, не основанная на разуме или научных знаниях, что на будущие события может влиять чье-то поведение каким-либо магическим или мистическим образом.

Оперантное обусловливание — это теория бихевиоризма, которая фокусируется на изменениях наблюдаемого поведения человека. При оперантном обусловливании на новое или продолжающееся поведение влияют новые или продолжающиеся последствия.Исследования, касающиеся этого принципа обучения, были впервые проведены Эдвардом Л. Торндайком в конце 1800-х годов, а затем стали популярными благодаря Б. Ф. Скиннеру в середине 1900-х годов. Большая часть этого исследования дает информацию о текущих практиках человеческого поведения и взаимодействия.

Теории оперантного кондиционирования Скиннера

Спустя почти полвека после первой публикации Торндайком принципов оперантного обусловливания и закона эффекта Скиннер попытался доказать расширение этой теории — что все поведения в некотором роде являются результатом оперантного обусловливания.Скиннер предположил, что если за поведением следует подкрепление, то это поведение с большей вероятностью будет повторяться, но если за ним последуют какие-то отвращающие стимулы или наказания, вероятность его повторения снизится. Он также считал, что эта научная ассоциация может прекратиться или исчезнуть, если будет удалено подкрепление или наказание.

Б. Ф. Скиннер : Скиннер отвечал за определение сегмента бихевиоризма, известного как оперантное обусловливание — процесса, посредством которого организм учится на основе своего физического окружения.

Эксперименты Скиннера

Самыми известными исследованиями Скиннера были простые эксперименты с подкреплением, проведенные на лабораторных крысах и домашних голубях, которые продемонстрировали самые основные принципы оперантной обусловленности. Он проводил большую часть своих исследований в специальном накопительном регистраторе, который теперь называется «ящик Скиннера», который использовался для анализа поведенческих реакций его испытуемых. В этих коробках он предлагал своим испытуемым положительное подкрепление, отрицательное подкрепление или отвращение в различных временных интервалах (или «расписаниях»), которые были разработаны для создания или подавления определенного целевого поведения.

В своей первой работе с крысами Скиннер помещал крыс в ящик Скиннера с рычагом, прикрепленным к трубке для кормления. Всякий раз, когда крыса нажимала на рычаг, пища высвобождалась. После опыта нескольких испытаний крысы узнали о связи между рычагом и едой и начали проводить больше времени в коробке, добывая еду, чем выполняя какие-либо другие действия. Именно благодаря этой ранней работе Скиннер начал понимать влияние непредвиденных обстоятельств поведения на действия.Он обнаружил, что скорость реакции, а также изменения в характеристиках реакции зависят от того, что произошло после того, как поведение было выполнено, а не раньше. Скиннер назвал эти действия оперантным поведением , потому что они воздействовали на среду и производили результат. Процесс, с помощью которого можно было упорядочить непредвиденные обстоятельства подкрепления, ответственные за создание определенного поведения, впоследствии стал называться оперантным условием .

Чтобы доказать свою идею о том, что бихевиоризм ответственен за все действия, он позже создал «суеверного голубя».«Он кормил голубя через непрерывные промежутки времени (каждые 15 секунд) и наблюдал за поведением голубя. Он обнаружил, что действия голубя будут меняться в зависимости от того, что он делал в моменты перед раздачей еды, независимо от того, что эти действия не имели ничего общего с раздачей еды. Таким образом, он понял, что голубь сфабриковал причинную связь между своими действиями и вручением награды. Именно это развитие «суеверий» привело Скиннера к мысли, что любое поведение можно объяснить как усвоенную реакцию на определенные последствия.

В своих экспериментах с оперантным обусловливанием Скиннер часто использовал подход под названием формирование . Вместо того, чтобы вознаграждать только целевое или желаемое поведение, процесс формирования включает подкрепление последовательных приближений к целевому поведению. Поведенческое приближение — это поведение, которое со временем становится все ближе к действительному желаемому ответу.

Скиннер считал, что любое поведение предопределено прошлыми и настоящими событиями в объективном мире.Он не включил в свои исследования возможности для таких идей, как свобода воли или индивидуальный выбор; вместо этого он утверждал, что любое поведение можно объяснить с помощью изученных физических аспектов мира, включая историю жизни и эволюцию. Его работа остается чрезвычайно влиятельной в области психологии, бихевиоризма и образования.

Формовка

Формирование — это метод оперантного обусловливания, с помощью которого подкрепляются последовательные приближения целевого поведения.

Цели обучения

Опишите, как формирование используется для изменения поведения

Ключевые выводы

Ключевые моменты
  • Б.Ф. Скиннер использовал формирование — метод обучения, с помощью которого подкрепляются последовательные приближения к целевому поведению — для проверки своих теорий поведенческой психологии.
  • Формирование включает в себя рассчитанное усиление «целевого поведения»: оно использует оперантные принципы кондиционирования для обучения субъекта, поощряя правильное поведение и препятствуя неправильному поведению.
  • Метод требует, чтобы субъект выполнял поведение, которое сначала просто напоминало поведение цели; посредством подкрепления это поведение постепенно изменяется или «формируется» для поощрения самого целевого поведения.
  • Ранние эксперименты Скиннера по оперантному кондиционированию включали формирование поведения крыс, поэтому они научились нажимать на рычаг и получать пищевое вознаграждение.
  • Формирование обычно используется для обучения животных, например собак, выполнению сложных задач; это также полезный обучающий инструмент для изменения человеческого поведения.
Ключевые термины
  • последовательное приближение : все более точная оценка реакции, требуемой тренером.
  • парадигма : пример, служащий моделью или шаблоном; шаблон, как для эксперимента.
  • формирование : Метод положительного подкрепления поведенческих паттернов при оперантном обусловливании.

В своих экспериментах по оперантному обуславливанию Скиннер часто использовал подход, называемый формированием. Вместо того, чтобы вознаграждать только целевое или желаемое поведение, процесс формирования включает подкрепление последовательных приближений к целевому поведению. Метод требует, чтобы субъект выполнял поведение, которое сначала просто напоминало поведение цели; посредством подкрепления это поведение постепенно изменяется, или формирует , чтобы стимулировать выполнение самого целевого поведения.Формирование полезно, потому что часто маловероятно, что организм спонтанно проявит что-либо, кроме простейшего поведения. Это очень полезный инструмент для обучения животных, например собак, выполнению сложных задач.

Выставка собак : В дрессировке собак часто используется метод оперантного кондиционирования.

Как работает шейпинг

При формировании поведение разбивается на множество небольших достижимых шагов. Чтобы проверить этот метод, Б. Ф. Скиннер провел эксперименты по формированию на крысах, которые он поместил в прибор (известный как ящик Скиннера), который отслеживал их поведение.Целевым поведением крысы было нажатие на рычаг, высвобождающий пищу. Первоначально вознаграждение дается даже за грубое приближение к целевому поведению — другими словами, даже за шаг в правильном направлении. Затем тренер награждает поведение, которое на один шаг ближе или на одно последовательное приближение ближе к целевому поведению. Например, Скиннер наградил крысу за шаг к рычагу, за то, что она стояла на задних лапах и за прикосновение к рычагу — все это было последовательным приближением к целевому поведению нажатия рычага.

По мере того, как субъект проходит через каждое испытание поведения, поощрения за старое, менее приблизительное поведение прекращаются, чтобы способствовать прогрессу в достижении желаемого поведения. Например, как только крыса коснулась рычага, Скиннер мог перестать вознаграждать ее за простой шаг к рычагу. В эксперименте Скиннера каждая награда приближала крысу к целевому поведению, что в конечном итоге приводило к тому, что крыса нажимала на рычаг и получала пищу. Таким образом, формирование использует принципы оперантного обуславливания для обучения субъекта, поощряя правильное поведение и препятствуя неправильному поведению.

Таким образом, процесс формирования состоит из следующих этапов:

  • Подкрепите любой ответ, похожий на целевое поведение.
  • Затем подкрепите ответ, который более похож на целевое поведение. Вы больше не будете усиливать ранее усиленный ответ.
  • Затем начните усиливать реакцию, которая еще больше напоминает целевое поведение. Продолжайте усиливать все более близкие приближения к целевому поведению.
  • Наконец, только усиливайте целевое поведение.

Приложения формовки

Этот процесс был воспроизведен с другими животными, включая человека, и теперь является обычной практикой во многих методах дрессировки и обучения. Его обычно используют для обучения собак тому, чтобы они следовали словесным командам или чтобы они не выходили из дома: в то время как щенки редко могут выполнять целевое поведение автоматически, их можно сформировать в соответствии с этим поведением, последовательно поощряя поведение, которое приближается.

Формирование также является полезным методом в обучении человека.Например, если отец хочет, чтобы его дочь научилась убирать в своей комнате, он может использовать формование, чтобы помочь своему хозяину продвинуться к цели. Сначала она убирает одну игрушку и получает вознаграждение. Во-вторых, она убирает пять игрушек; затем решает, взять ли десять игрушек или убрать книги и одежду; затем убирает все, кроме двух игрушек. Благодаря серии наград она, наконец, учится убирать всю свою комнату.

Поправка и наказание

Подкрепление и наказание — это принципы оперантного обусловливания, которые увеличивают или уменьшают вероятность поведения.

Цели обучения

Различать первичные, вторичные, условные и безусловные подкрепления

Ключевые выводы

Ключевые моменты
  • «Подкрепление» относится к любым последствиям, которые увеличивают вероятность определенной поведенческой реакции; «Наказание» относится к последствиям, которые уменьшают вероятность такой реакции.
  • И подкрепление, и наказание могут быть положительными или отрицательными. В оперантной обусловленности позитивное означает, что вы что-то добавляете, а негативное означает, что вы что-то убираете.
  • Подкрепления могут быть первичными (безоговорочно связанными с поведением) или вторичными (требующими преднамеренной или условной привязки к определенному поведению).
  • Первичные — или безусловные — подкрепления, такие как вода, еда, сон, кров, секс, прикосновения и удовольствие, обладают врожденными подкрепляющими качествами.
  • Вторичные — или обусловленные — подкрепления (например, деньги) не имеют внутренней ценности, пока они не связаны или не соединены с основным подкреплением.
Ключевые термины
  • латентность : задержка между стимулом и ответом, который он запускает в организме.

Подкрепление и наказание — это принципы, которые используются в оперантном обусловливании. Подкрепление означает, что вы усиливаете поведение: это любое последствие или результат, который увеличивает вероятность определенной поведенческой реакции (и, следовательно, усиливает поведение). Эффект усиления на поведение может проявляться по-разному, включая более высокую частоту, большую продолжительность, большую величину и короткую задержку ответа. Наказание означает, что вы уменьшаете поведение: это любое последствие или результат, которые уменьшают вероятность поведенческой реакции.

Угасание , в оперантном обусловливании означает, что усиленное поведение полностью подавляется. Это происходит в какой-то момент после прекращения армирования; скорость, с которой это происходит, зависит от графика подкрепления, который более подробно обсуждается в другом разделе.

Положительное и отрицательное подкрепление и наказание

И подкрепление, и наказание могут быть положительными или отрицательными. В оперантной обусловленности положительное и отрицательное не означают хорошее и плохое.Вместо этого положительное значение означает, что вы что-то добавляете, а отрицательное значение означает, что вы что-то убираете. Все эти методы могут управлять поведением объекта, но каждый работает по-своему.

Оперантное обусловливание : В контексте оперантного обусловливания, усиливаете ли вы или наказываете поведение, «положительный» всегда означает, что вы добавляете стимул (не обязательно хороший), а «отрицательный» всегда означает, что вы удаляет стимул (не обязательно плохой.См. Синий и желтый текст выше, которые обозначают положительное и отрицательное соответственно. Точно так же подкрепление всегда означает, что вы на увеличиваете (или поддерживаете) уровень поведения, а наказание всегда означает, что вы понижаете уровень поведения на . Посмотрите на зеленый и красный фон выше, которые представляют собой поощрение и наказание соответственно.

  • Положительные подкрепления добавляют желаемый или приятный стимул для увеличения или поддержания частоты поведения.Например, ребенок убирает свою комнату и получает в награду печенье.
  • Негативные подкрепления удаляют отталкивающий или неприятный стимул, чтобы увеличить или сохранить частоту поведения. Например, ребенок убирает свою комнату и получает вознаграждение за то, что ему не нужно мыть посуду в эту ночь.
  • Положительные наказания добавляют отвращающий стимул к снижению поведения или реакции. Например, ребенок отказывается убирать в своей комнате, и поэтому родители заставляют ее мыть посуду в течение недели.
  • Отрицательные наказания удаляют приятный стимул, снижающий поведение или реакцию.Например, ребенок отказывается убирать в своей комнате, и поэтому родители не разрешают ей играть с подругой в тот день.

Первичные и вторичные арматуры

Стимул, используемый для усиления определенного поведения, может быть первичным или вторичным. Первичное подкрепление, также называемое безусловным подкреплением , — это стимул, обладающий врожденными подкрепляющими качествами. Такого рода подкрепления не усвоены. Вода, еда, сон, кров, секс, прикосновения и удовольствие — все это примеры основных подкреплений: организмы не теряют влечения к этим вещам.Некоторые первичные подкрепления, такие как наркотики и алкоголь, просто имитируют действие других подкреплений. Для большинства людей прыжок в прохладное озеро в очень жаркий день будет подкреплением, а прохладное озеро будет подкреплять от природы — вода охладит человека (физическая потребность), а также доставит удовольствие.

Вторичное подкрепление, также называемое условным подкреплением , не имеет внутренней ценности и имеет подкрепляющие качества только тогда, когда оно связано или соединено с основным подкреплением.Перед объединением вторичное подкрепление не оказывает значимого воздействия на испытуемого. Деньги — один из лучших примеров вторичного подкрепления: они чего-то стоят только потому, что вы можете использовать их для покупки других вещей — либо вещей, которые удовлетворяют основные потребности (еда, вода, жилье — все основные подкрепления), либо других второстепенных подкреплений.

График армирования

Расписания подкрепления определяют, как и когда за поведением будет следовать подкрепление.

Цели обучения

Сравните и сопоставьте различные типы схем армирования

Ключевые выводы

Ключевые моменты
  • График подкрепления — это инструмент оперантного кондиционирования, который позволяет тренеру контролировать время и частоту подкрепления, чтобы вызвать целевое поведение.
  • Непрерывные расписания награждают поведение после каждого выполнения желаемого поведения; прерывистые (или частичные) графики вознаграждают поведение только после определенных соотношений или интервалов ответов.
  • Прерывистые расписания могут быть фиксированными (когда подкрепление происходит после определенного количества времени или ответов) или переменным (где подкрепление происходит после изменчивого и непредсказуемого количества времени или ответов).
  • Прерывистые расписания также описываются как интервалы (основанные на времени между подкреплениями) или соотношения (основанные на количестве ответов).
  • Различные графики (фиксированный интервал, переменный интервал, фиксированное соотношение и переменное соотношение) имеют разные преимущества и по-разному реагируют на вымирание.
  • Составные расписания подкрепления объединяют два или более простых расписания, использующих одно и то же подкрепление и фокусирующихся на одном и том же целевом поведении.
Ключевые термины
  • исчезновение : Когда поведение прекращается, потому что оно больше не подкрепляется.
  • интервал : период времени.
  • отношение : Число, представляющее сравнение двух вещей.

График подкрепления — это тактика, используемая в оперантном обусловливании, которая влияет на то, как оперантный ответ изучается и поддерживается. Каждый тип расписания налагает правило или программу, которая пытается определить, как и когда возникает желаемое поведение. Поведение поощряется с помощью подкреплений, подавляется с помощью наказаний и исчезает с помощью полного удаления стимула.Расписания варьируются от простых графиков на основе соотношений и интервалов до более сложных составных графиков, которые объединяют одну или несколько простых стратегий для управления поведением.

Непрерывные и прерывистые графики

Непрерывный расписаний награждает поведение после каждого выполнения желаемого поведения. Этот график подкрепления — самый быстрый способ научить кого-то поведению, и он особенно эффективен при обучении новому поведению. С другой стороны, простые периодические (иногда называемые частичными) расписания вознаграждают поведение только после определенных соотношений или интервалов ответов.

Типы периодических графиков

Существует несколько различных типов расписаний периодического армирования. Эти графики описываются как фиксированные или переменные, а также как интервальные или пропорциональные.

Фиксированная и переменная, соотношение и интервал

Фиксированное значение относится к случаю, когда количество ответов между подкреплениями или время между подкреплениями установлено и не изменяется. Переменная указывает на то, что количество ответов или время между подкреплениями меняется или меняется. Интервал означает, что расписание основано на времени между подкреплениями, а соотношение означает, что расписание основано на количестве ответов между подкреплениями. Простые периодические расписания представляют собой комбинацию этих терминов, в результате чего образуются следующие четыре типа расписаний:

  • График с фиксированным интервалом — это когда поведение вознаграждается по прошествии установленного времени. Этот тип графика существует в платежных системах, когда кто-то получает почасовую оплату: независимо от того, сколько работы этот человек выполняет за один час (поведение), ему будут платить одинаковую сумму (поощрение).
  • При расписании с переменным интервалом , субъект получает подкрепление, основанное на переменном и непредсказуемом количестве времени. Люди, которые любят ловить рыбу, сталкиваются с таким графиком подкрепления: в среднем в одном и том же месте вы, вероятно, поймаете примерно одинаковое количество рыбы за определенный период времени. Однако вы не знаете точно, когда произойдет такой улов (подкрепление) в течение периода времени, затраченного на рыбалку (поведение).
  • При расписании с фиксированным соотношением , есть заданное количество ответов, которые должны произойти, прежде чем поведение будет вознаграждено.Это можно увидеть в оплате за такую ​​работу, как сбор фруктов: сборщикам выплачивается определенная сумма (поощрение) в зависимости от суммы, которую они собирают (поведение), что побуждает их собирать быстрее, чтобы заработать больше денег. В другом примере Карла получает комиссию за каждую пару очков, которые она продает в магазине очков. Качество того, что продает Карла, не имеет значения, потому что ее комиссия не зависит от качества; он основан только на количестве проданных пар. Это различие в качестве производительности может помочь определить, какой метод подкрепления наиболее подходит для конкретной ситуации: фиксированные коэффициенты лучше подходят для оптимизации количества выпуска , тогда как фиксированный интервал может привести к более высокому качеству выпуска.
  • В расписании с переменным соотношением , количество ответов, необходимых для получения вознаграждения, варьируется. Это наиболее эффективный тип расписания периодического подкрепления. У людей этот тип расписания используется казино для привлечения игроков: игровой автомат выплачивает средний коэффициент выигрыша, скажем, пять к одному, но не гарантирует, что каждая пятая ставка (поведение) будет вознаграждено (подкреплено) выигрышем. .

Все эти расписания имеют разные преимущества. В целом, пропорциональные расписания всегда вызывают более высокую частоту отклика, чем интервальные расписания из-за их предсказуемости.Например, если вы фабричный рабочий, которому платят за каждый предмет, который вы производите, у вас будет мотивация производить эти предметы быстро и последовательно. Варианты расписания категорически менее предсказуемы, поэтому они, как правило, сопротивляются исчезновению и поощряют постоянное поведение. И игроки, и рыбаки могут понять чувство, что еще одно нажатие на рычаг игрового автомата или еще один час на озере изменит их удачу и принесет соответствующие награды. Таким образом, они продолжают играть и ловить рыбу, несмотря на ранее неудачную обратную связь.

Простые ответы по графику подкрепления : Четыре графика подкрепления дают разные модели ответов. График с переменным соотношением непредсказуем и дает высокие и устойчивые показатели отклика с небольшими паузами, если они вообще есть, после поощрения (например, азартные игры). График с фиксированным соотношением предсказуем и дает высокую скорость отклика с короткой паузой после подкрепления (например, продажи очков). График с переменным интервалом непредсказуем и обеспечивает умеренную, устойчивую скорость отклика (например,г., рыбалка). График с фиксированным интервалом дает образец реакции в форме гребешка, отражающий значительную паузу после подкрепления (например, почасовая занятость).

Угасание поведения с подкреплением происходит в какой-то момент после прекращения подкрепления, и скорость, с которой это происходит, зависит от графика подкрепления. Среди графиков подкрепления переменное соотношение является наиболее устойчивым к исчезновению, в то время как фиксированный интервал является самым легким для тушения.

Простые и сложные графики

Все примеры, описанные выше, называются простыми расписаниями. Составные расписания объединяют как минимум два простых расписания и используют одно и то же подкрепление для одного и того же поведения. Сложные графики часто встречаются на рабочем месте: например, если вы получаете почасовую оплату (фиксированный интервал), но также имеете стимул получать небольшую комиссию за определенные продажи (фиксированный коэффициент), вас подкрепляет составной график. Кроме того, если по лотерее будет выплачиваться премия в конце года только трем сотрудникам, вас будет мотивировать переменный график.

Существует много возможностей для составных расписаний: например, наложенных расписаний используют как минимум два простых расписания одновременно. Параллельные расписания, , с другой стороны, предоставляют два возможных простых расписания одновременно, но позволяют участнику реагировать по любому расписанию по своему желанию. Все комбинации и виды графиков подкрепления предназначены для выявления определенного целевого поведения.

Применение принципов «стимул-реакция» в классе

В этом упражнении вы определите стратегии обучения, основанные на принципах «стимул-реакция», с особым акцентом на оперантное обусловливание.Выполняя упражнение, помните о следующих понятиях:

Положительное подкрепление: Каждый раз, когда реакция увеличивается в результате c последовательности , которая следует за ней, происходит подкрепление . Положительное подкрепление происходит, когда поведение усиливается в результате предъявления стимула (например, похвалы, наклейки почесать и понюхать, возможность провести свободное время).

Отрицательное подкрепление: Когда учащиеся ведут себя так, чтобы дать или избавиться от стимулом или общим положением вещей, происходит положительное подкрепление .Например, студент может выполнить задание, чтобы удалить его из своего списка дел, или студент может пожаловаться на боль в животе, чтобы избежать неожиданной популярной викторины. Не путайте отрицательное подкрепление с наказанием: отрицательное подкрепление увеличивает реакцию, за которой следует, тогда как наказание (по определению бихевиористов) уменьшает реакцию, за которой следует.

Cueing: В режиме cueing учитель подает вербальный или невербальный сигнал, чтобы напомнить ученикам, что (а) определенное поведение желательно или (б) определенное поведение недопустимо и его необходимо прекратить.Реплика — это пример предшествующего стимула , который идет перед ответом (а не после него, как это делает подкрепление).

На уроке, изображенном в следующем видео, учительница второго класса встречается с одной из своих групп чтения («Тигры»), в то время как другие ученики работают над индивидуальными заданиями за своими партами. Просматривая видео, думайте не только о том, эффективны ли стратегии учителя для ее 7–8-летних детей, но и о том, будут ли ее стратегии эффективны для учащихся средних и старших классов.

Группа чтения

Подкрепление — условный стимул, аверсивное обуславливание, обучение избеганию и условная реакция

В классическом или оперантном обусловливании — стимул, увеличивающий вероятность того, что произойдет определенное поведение.

В классическом (Павловском) кондиционировании , где реакция не влияет на возникновение стимула, подкрепление вызывает немедленную реакцию без какой-либо тренировки или кондиционирования.Когда голодной собаке предлагают мясо, она не учится выделять слюну, поведение происходит спонтанно. Точно так же отрицательное подкрепление, такое как электрический шок, вызывает немедленную безусловную реакцию бегства. Чтобы вызвать классически обусловленную реакцию, положительное или отрицательное подкрепление сочетается с нейтральным стимулом до тех пор, пока они не станут ассоциироваться друг с другом. Таким образом, если звук колокольчика сопровождает отрицательный стимул, такой как удар электрическим током, экспериментальный субъект в конечном итоге будет подготовлен к тому, чтобы вызвать реакцию бегства или избегания только на звук колокола.Как только обусловливание создало связь между определенным поведением и нейтральным стимулом, таким как звонок, сам этот стимул может служить подкреплением для обусловливания будущего поведения. Когда это происходит, ранее нейтральный стимул называется условным подкреплением, в отличие от естественного положительного или отрицательного поощрения, такого как еда или электрический шок.

В оперантном кондиционировании (разработанном Б. Ф. Скиннером ) положительные подкрепления — это награды, которые усиливают условную реакцию после того, как она произошла, например, кормление голодного голубя после того, как он клюнул ключ.Отрицательные подкрепления — это неприятные стимулы, которые удаляются после получения желаемой реакции. Применение отрицательного подкрепления можно разделить на два типа: побег и обусловливание избегания. При условном побеге субъект учится избегать неприятного или отталкивающего стимула (собака перепрыгивает через барьер, чтобы избежать поражения электрическим током). В условном рефлексе избегания субъекту предъявляют предупреждающий стимул, такой как зуммер, непосредственно перед тем, как возникает отталкивающий стимул, и он учится действовать в соответствии с ним, чтобы полностью избежать неприятного стимула.

Подкрепление может осуществляться по разным графикам. Определенное поведение может подкрепляться каждый раз, когда оно возникает, что называется постоянным подкреплением. Однако во многих случаях поведение подкрепляется лишь некоторое время, что называется частичным или периодическим подкреплением. Подкрепление также может быть основано на количестве ответов или запланировано на определенные временные интервалы. Кроме того, он может поступать регулярно или нерегулярно. Сочетание этих переменных дает четыре основных типа частичного армирования.В расписаниях с фиксированным соотношением (FR) усиление обеспечивается после определенного количества ответов (фабричный рабочий получает оплату за каждую собранную им одежду). В расписаниях с переменным соотношением (VR) подкрепление предоставляется после переменного числа ответов (игровой автомат рассчитывается после переменного числа попыток). График с фиксированным интервалом (FI) предусматривает усиление первого ответа, сделанного в течение заданного интервала после предыдущего (участники конкурса не имеют права на приз, если они выиграли его в течение последних 30 дней).Наконец, в расписаниях с переменным интервалом (VI) первые ответы вознаграждаются с разными интервалами по сравнению с предыдущими.

Дополнительная литература

Крейгхед, У. Эдвард. Модификация поведения: принципы, проблемы и приложения. Бостон: Хоутон Миффлин, 1976.

Скиннер, Б.Ф. О бихевиоризме. Нью-Йорк: Кнопф, 1974.

Когнитивная теория обучения в сравнении со стимулом-реакцией

Реферат

В своем обращении 1948 года в Отдел теоретико-экспериментальной психологии Американской психологической ассоциации Кеннет У.Спенс обсудил шесть различий между когнитивной теорией обучения и теорией «стимул-реакция» (S-R). В этой статье я сначала рассмотрю эти шесть различий, а затем остановлюсь на двух из них в контексте моего собственного исследования. Это исследование касается спецификации ассоциаций стимул-стимул в ассоциативном обучении и характеристики нейронных систем, лежащих в основе этих ассоциаций. В ходе описания взглядов Спенса и моих исследований я надеюсь передать некоторые из богатств психологии S-R Спенса и ее актуальность в рамках современного научного анализа поведения.

Спенс (1950, стр. 161) охарактеризовал когнитивные теории обучения как те, которые «подчеркивают формирование и изменение когнитивных паттернов, представляющих отношения в окружающей среде». По большей части в рамках этих теорий, таких как теории Коффки (1935), Колера (1940), Левина (1936) и Толмана (1932), обучение было истолковано как часть более широкой проблемы организации восприятия и реорганизации с опытом. . Напротив, теории стимула-реакции (SR), такие как теории Гатри (1935), Халла (1943), Спенса (1936) и Торндайка (1898), подчеркивали такие конструкции, как привычки и связи SR, которые относились к гипотетическим состояниям обучения. или промежуточные переменные.Теории S-R предоставили правила, связывающие факторы стимула, такие как величина, количество и время вознаграждения, с сильными сторонами этих промежуточных переменных, а также правила, связывающие эти переменные с эмпирическими мерами реакции. В целом Спенс увидел несколько точек разногласий между этими двумя теоретическими позициями и приписал большую часть разногласий между лагерями неправильной интерпретации теории S-R когнитивными теоретиками. С моей точки зрения, тон, переданный в его статье, был тон терпеливого учителя, указывающего на ошибки благонамеренных, но заблуждающихся студентов познания, но не щадя несколько менее распространенных (в его глазах) ошибок теоретиков S-R.

I. Шесть различий между когнитивной теорией и теорией СР

Метафоры: диспетчерские на карте и телефонные коммутаторы

«диспетчерских карт», в которых пространственные представления и отношения были получены, вычислены и использованы. Напротив, теории S-R стали привязаны к аналогии с «телефонными коммутаторами», с помощью которых входные сигналы стимулов посредством обучения соединялись с новыми выходными сигналами реакции (Tolman, 1948).Спенс (1950, стр. 161) утверждал, что «ни один научно ориентированный человек в психологии, однако, никогда не принял бы такие аналогии, будь то телефонные коммутаторы или диспетчерские на карте, как серьезную попытку теоретического представления изменений в обучении». Например, значение конструкции привычки Халла было «задано математической функцией, связывающей его с предшествующими экспериментальными переменными», и, таким образом, «любое сравнение распределительных щитов с диспетчерскими на карте совершенно неуместно» (Spence, 1950, p.163). Более актуальным был вопрос о том, было ли обучение в пространственных задачах более «похоже на карту» или «на привычку», то есть какая часть пространственной информации, содержащейся в этих задачах, была закодирована при обучении и могла быть использована для определения производительности. позже, когда, например, обычные пути были заблокированы или открыты ярлыки (Tolman, Richie, & Kalish, 1946a, b). Интересно, что большая часть этих дебатов в конечном итоге сводилась к вопросу о месте и ответе, который можно было бы так же легко сформулировать полностью в терминах S-R, как «подойти к сигналу X» или «повернуть направо».

Нейрофизиологическая основа обучения: поля мозга или рецепторно-эффекторные связи

Принимая во внимание, что когнитивные теоретики ссылались на реорганизацию «электрических полей мозга» и «нейрофизиологических следовых систем», Халл (1943) связал формирование привычки с установлением нейронных «рецепторов». эффекторные »связи. Спенс отметил, что эти различия не имели большого значения или не имели никакого значения для теории обучения, потому что эти нейрофизиологические модели были не чем иным, как аналогиями и не играли никакой роли в выводах или умозаключениях любого лагеря.Свойства «мозговых полей» были выведены из интроспекции, а не физиологического исследования, и, за некоторыми исключениями, знания или даже предположения о физиологической основе рефлексов не способствовали построению теорий S-R. В самом деле, Спенс (1950, стр. 164) заявил, что «изображение нейрофизиологических процессов без указания гипотетических отношений, которые связывают их с экспериментальными переменными и мерой отклика, — это почти полная трата времени, поскольку дальнейшее понимание обучающих явлений является пустой тратой времени. обеспокоенный.В разделе 3 этой статьи я приведу примеры прогресса в установлении связи между мозгом и поведением, которые были более полезны для характеристики характера обучения.

Стимул-стимул (S-S) или стимул-реакция (S-R)

Когнитивные теоретики того времени были уверены, что обучение включает ассоциации или реорганизацию сенсорно-перцепционных процессов. Напротив, Гатри, Торндайк, Халл и другие утверждали, что обучение включает S-R-ассоциации между стимулами и «сокращением мышц и секрецией желез» (Guthrie, 1946, стр.7). Однако Спенс (1950) указал, что акцент Халла на S-R-ассоциациях следует из его нейрофизиологизации, а не из его математического определения привычки. С точки зрения Спенса, в привычке, как она определена в системе Халля, не было ничего по существу S-R или S-S, хотя, как и Халл, он явно полагал, что большая часть обучения связана с формированием ассоциаций между стимулами и реакциями.

«Мне нетрудно представить, что оба типа организаций или ассоциаций создаются в процессе обучения.Конечно, простые типы перцептивного обучения могут включать межсенсорные ассоциации. Однако я серьезно сомневаюсь, является ли обучение исключительно этим типом или даже большей частью. В самом деле, …… данные, по-видимому, более убедительно подтверждают концепцию S-R, чем концепцию S-S »(Spence, 1950, стр. 164-165).

Большая часть этой статьи (раздел 2) будет посвящена этому вопросу.

Содержание и условия обучения

Спенс отметил, что теоретики когнитивной теории склонны подчеркивать «внутренние» свойства своих построений, в то время как теоретики S-R, как правило, озабочены эмпирическими отношениями между экспериментальными переменными, которые определяют их конструкции.По терминологии Рескорла (1975), когнитивные теоретики сосредоточились на содержании обучения, тогда как теоретики S-R сосредоточились на условиях, в которых происходит обучение. Критикуя когнитивных теоретиков за то, что они слишком полагаются на интроспекцию, чтобы делать выводы о содержании обучения, Спенс признал, что такое содержание все же можно строго определить в терминах переменных среды, хваля знак-гештальт-психологию Толмена. Таким образом, он пришел к выводу, что эти опасения отражают «очень реальное различие между двумя теоретическими лагерями, но… одно из акцентов, а не конфликта» (Spence, 1950, p.166).

Стимулирующие переменные: внутренние и внешние

Во время написания Спенса исследователи когнитивной традиции стремились изучить эффекты переменных, которые влияли на получение стимулов (например, ориентацию и внимание) и организацию восприятия (например, фигура). -основные отношения, отношения части-целого, принадлежность, множество). Напротив, большинство исследований поведения из традиции S-R сосредоточено на временных переменных и тех, которые связаны с мотивацией, такими как величина вознаграждения и состояние депривации.Но позиция Спенса (1950, стр. 167) заключалась в том, что «такие различия в акцентах…. не обязательно связаны с конфликтом », и отметил, что озабоченность теоретиков СР временем и мотивацией не исключает их интереса к восприятию стимулов и организационным переменным. Действительно, за последние 25 лет большое количество исследований, основанных на традиции СР, обращалось к этим более поздним вопросам, например, интересам к ориентации и вниманию (Holland, 1997; Mackintosh, 1975; Pearce & Hall, 1980) и перцептивному восприятию. организации (Кук, Райли и Браун, 1992; Рескорла, 1986).

Организм как активный или пассивный обработчик информации

Во время выступления Спенса велась активная дискуссия о «роли организма» в обработке информации, о том, действительно ли животные «просто пассивно воспринимают и реагируют на все раздражители, которые являются физическими». присутствует »(Tolman, 1948, p. 189), или активно обрабатывал эту информацию, выбирая и собирая элементы ассоциации до образования самих ассоциаций. И снова Спенс почувствовал, что когнитивные теоретики неверно истолковали позицию S-R:

«Трудно точно знать, что Толмен и другие, выразившие это понятие, имели в виду под таким утверждением.… .Большая часть теории СР связана с классической ситуацией обуславливания, в которой условия стимуляции чрезвычайно просты. Никакого «активного поиска» сигнала… или особой ориентации рецепторов не требуется… Но даже в случае этой простой обучающей ситуации теоретик обучения SR не предполагал, что организмы пассивно получают и реагируют на все стимулы, которые физически присутствуют »(Spence, 1950, p. 168.)

Таким образом, Спенс подготовил почву для последующего включения переменных, которые теперь описываются как «привлекающие внимание» в теорию СТО.Например, можно разумно ожидать, что непредвиденные обстоятельства подкрепления распространятся как на явную обработку внимания, такую ​​как движения глаз и ориентировочное поведение (например, Siegel, 1967), так и на более неявную обработку, предполагаемую более поздними теориями обучения, такими как изменения параметров скорости обучения. Все это могло повлиять на последующее восприятие и использование определенных стимулов в формировании ассоциации позже.

II. Изучение S-S или S-R?

Как заметил Спенс, в привычке по сути нет ничего S-S или S-R.Например, воспроизведите диаграммы Спенса (1950) и Холланда (1990), различая потенциальные S-S и S-R ассоциации в простом эксперименте по Павлову. Если второй член ассоциации опаздывает в потоке обработки, мы описываем ассоциацию как S-R, а если он ранний, мы описываем его как S-S. С этой точки зрения вопрос о том, насколько поздно и рано или поздно, определяет вопрос о том, является ли ассоциация или привычка S-R или S-S.

A: Диаграмма Спенса (1950), противопоставляющая ассоциации стимул-стимул (S-S) и стимул-ответ (S-R).Sc и Su относятся к условным и безусловным стимулам, соответственно, A1 и A2 относятся к афферентным процессам, производимым Sc и Su, E1 и E2 относятся к эфферентным процессам, производимым A1 и A2, а Ro и Ru — к ориентировочным и безусловным ответам. B: Диаграмма Холланда (1990), противопоставляющая ассоциации S-S и S-R. CS, US и UR относятся к условному раздражителю, безусловному раздражителю и ориентировочной реакции соответственно. Буквы a-d относятся к гипотетическим этапам обработки.

Поскольку в простейшем случае такие представления предполагают линейную цепочку обработки событий от получения стимула до двигательного выхода, кажется маловероятным, что дихотомическая категоризация усвоенного поведения могла быть реалистично сделана в рамках психологических или нейрофизиологических теорий, указав на различия в стимул против обработки ответа или сенсорная против двигательной области мозга.Тем не менее, вероятно, существует значительное согласие с тем, что одни события являются «большим стимулом», а другие — «большей реакцией». Возможно, самыми ранними тестовыми аренами для того, чтобы задать вопрос S-S или S-R, были те, в которых либо стимулы, либо аспекты реакции второго, «подкрепляющего» события в событии ассоциации были минимизированы.

Ответы без стимулов

Loucks (1935) исследовал обучение, когда сгибание передних ног в присутствии зуммера вызывается электрической стимуляцией соответствующей области моторной коры, а не обычным УЗИ передними ногами.В этой процедуре предполагалось, что электрическая стимуляция вызывает реакцию без предварительного ввода стимула. Таким образом, обучение S-S должно быть невозможным, а обучение S-R не должно затрагиваться при этой подготовке. Действительно, Лаукс не обнаружил доказательств приобретения реакции сгибания ноги, предполагая, что смежность стимула и реакции была недостаточной для обучения. Спенс (1950) согласился с этой точкой зрения, но затем отметил, что во втором эксперименте Лоукс (1935) обнаружил, что если за стимуляцией зуммерно-моторной коры также следовала еда, то приобреталось сгибание ног.Спенс утверждал, что эту пару результатов можно легко интерпретировать в рамках теории, основанной на вознаграждении SR: в отличие от шока ноги, стимуляция моторной коры вызывает реакцию сгибания, но не вызывает побуждения (боли), уменьшение которого может усилить формирование привычки, тогда как добавление пищи добавило такой реакции. источник вознаграждения. Хотя другие должны были найти успешное кондиционирование сгибания конечностей с помощью стимуляции моторной коры головного мозга (например, Doty & Giurgea, 1961), более поздние эксперименты (например, Thomas, 1971; Wagner, Thomas & Norton, 1967) ставят под сомнение, выявили ли такие исследования прямую Павловскую обусловленность. реакций на сгибание ног или инструментального кондиционирования ответов, которые уменьшали негативные постуральные последствия внезапных неконтролируемых движений ног, вызванных стимуляцией моторной коры головного мозга.И помимо этих опасений, можно легко усомниться в том, может ли массивная стимуляция моторной коры без рисунка обеспечить подходящую основу для пластичности, необходимой для обучения S-R в этой точке системы. Примечательно, что в некоторых системах, таких как кондиционирование век, и CS, и US могут быть заменены прямой стимуляцией нервных путей (например, Steinmetz, Lavond & Thompson, 1989; Thompson et al., 1998; см. Раздел 3 этой статьи).

Стимулы без ответов

По той же логике, блокировка ответов на УЗИ или выбор УЗИ с минимальными ответами должны существенно ухудшить обучение, если обучение — S-R, но иметь небольшой эффект, если обучение S-S.Ранние исследования периферической блокады ответов во время тренировки обычно выявляли существенную реакцию после снятия блокады (например, Finch, 1938). Однако снова легко возразить, что никто не ожидает, что обучение S-R будет локализовано в нервно-мышечном соединении или симпатическом нейроне. Такие исследования оказались более полезными при рассмотрении утверждений о том, что случайное инструментальное усиление двигательных реакций было ответственно за появление якобы павловских CR.

Более плодотворным направлением исследований было сенсорное прекондиционирование, в котором относительно нейтральные стимулы, такие как свет и звуки, были объединены в пару.Хотя обычно такие пары CS1-CS2 сами по себе не вызывают легко наблюдаемых изменений в поведении, последующее объединение одного из них (CS2) с более значительным событием, таким как еда или шок, обычно приводит к обучению, реагирующему на другой сигнал (CS1). (). Обычно считалось, что CR к нетренированному сигналу CS1 опосредовано сцеплением двух отдельно приобретенных ассоциаций во время выступления. На начальном этапе S-S-ассоциации формировались между событиями, которые носили преимущественно сенсорный характер.Затем, на втором этапе, были сформированы ассоциации между CS2 и США. Наконец, когда CS1 был представлен в тесте, он вызвал CS2, который, в свою очередь, вызвал CR (). Конечно, творческие теоретики S-R быстро предложили альтернативные, S-R решения проблемы сенсорной предварительной подготовки. Например (), в первой фазе S-R ассоциации могут быть сформированы между CS1 и ориентирующими ответами на CS2, а затем ассоциации между сенсорной обратной связью от этих ответов и реакцией на УЗ во второй фазе.Наконец, в тесте S1 будет вызывать условный OR, первоначально вызванный CS2, а обратная связь от этих условных OR, в свою очередь, будет вызывать UR-подобный CR, обусловленный этими стимулами обратной связи во второй фазе (Osgood, 1953, стр. 461-462) . Поскольку такие ответы часто нелегко было наблюдать, эти рассказы часто было трудно поддержать или опровергнуть. Тем не менее, сотни экспериментов по сенсорному прекондиционированию дали доказательства обучения в отсутствие очевидных реакций (например, Thompson, 1972).Я подозреваю, что Спенс был бы доволен описанием этих результатов как примеров сенсорно-сенсорных привычек.

Процедуры и результаты сенсорного эксперимента по предварительной подготовке. A: Экспериментальные процедуры. B: Отчет о производительности, опосредованный стимулом-стимулом. C: Расчет производительности, опосредованный стимулом-ответом. D: Отчет об обучении, опосредованном стимулом-стимулом. CS1, CS2 и US относятся к двум условным стимулам и безусловному стимулу. OR2 и OR2-s относятся к ориентировочной реакции, первоначально вызванной CS2, и к обратной связи со стимулом от OR2.Прочерки (—) обозначают установленные отношения; стрелки (→) обозначают выученные ассоциации; двуглавые стрелки (← →) означают двунаправленные ассоциации; линии (-) означают безусловные отношения.

Обе учетные записи S-S и S-R, приведенные выше, предполагают, что производительность CR для CS1 опосредуется во время тестовых презентаций путем объединения в цепочку отдельных ассоциаций, ранее установленных между CS1 и CS2, а также между CS2 и США. Прямых ассоциаций между CS1 и США не возникает. Альтернативный вариант состоит в том, что на втором этапе между CS1 и США формируются прямые ассоциации.Согласно этому «опосредованному обучению» (Holland, 1981a) или «обратному сенсорному прекондиционированию» (Ward-Robinson & Hall, 1996), во второй фазе CS2 ассоциативно активирует представление CS1, за которым затем следует США. Таким образом, ассоциации могут формироваться непосредственно между CS1 и США, которые затем выявляются в финальном тесте только CS1 (). Обычно трудно провести различие между этими альтернативами, хотя примечательно, что в раннем эксперименте по сенсорному прекондиционированию человека Брогден (1947) проводил различие между субъектами, которые приписывали свою реакцию на CS1 в тесте тем, что он напоминал им CS2, и субъектами, которые утверждали, что на Фазе 2 CS1 фактически работал в паре с США.Субъектов можно побудить использовать стратегию «опосредованного обучения», используя параметры кондиционирования, которые препятствуют использованию ассоциаций CS1-CS2, требуемых опосредованной учетной записью производительности, и вместо этого поощряют использование ассоциаций CS2-CS1, требуемых учетной записью опосредованного обучения. Например, Уорд-Робинсон и Холл (1996) представили два нейтральных стимула в порядке CS2-CS1 в первой фазе эксперимента по сенсорной предварительной подготовке и обнаружили существенную реакцию на CS1 в тесте.

Оценка характера обучения после обучения

В экспериментах, описанных выше, логика заключалась в том, чтобы изучить последствия изменения условий обучения так, чтобы они способствовали (или не способствовали) обучению S-S или S-R.Однако, хотя такие исследования были полезны для демонстрации того, что обучение может быть S-S или S-R, они не были информативными относительно того, было ли обучение в любой типичной процедуре кондиционирования S-S или S-R. Использование различного рода посттренировочных тестов часто позволяло собирать такую ​​информацию.

Тесты передачи

Возможно, наиболее распространенным использованием тестов передачи после обучения было определение того, изучали ли крысы в ​​простых лабиринтах пространственные атрибуты среды лабиринта или реакции поворота.Например, в эксперименте Толмена с «солнечными лучами» (Tolman et al., 1946a) крысы обучались в аппарате, в котором крысы сначала бегали прямо по аллее, а затем должны были сделать два поворота влево и два вправо, прежде чем найти пищу справа. сторона комнаты. В тесте переноса крысам предъявляли переулки, ведущие веерообразным множеством углов от стартовой зоны. Если крысы выучили реакции «повернуть налево» или «повернуть направо», можно ожидать, что они выберут левую (0 градусов) или правую (180 градусов) аллею, если они научились «идти прямо, то тогда делать повороты », они выбрали бы переулок, идущий прямо (90 градусов), но если бы они узнали приблизительное расположение еды в комнате, они могли бы выбрать переулок, указывающий на это место (135 градусов).Хотя Tolman et al. (1946a) обнаружили значительные индивидуальные вариации в выборе поведения крыс, большая часть данных подтверждала утверждение, что крысы узнали приблизительное местоположение пищи (или что они соответствующим образом интегрировали прямые и правильные векторы ответа). Версия этого эксперимента, которая длилась дольше, следует за тренировкой в ​​Т-образном лабиринте с тестом в лабиринте, когда он повернут на 180 градусов (Packard & McGaugh, 1996; Poldrack and Packard, 2003; Tolman, Richie, & Kalish, 1946b).Таким образом, в тесте стратегии «ответ» и «место» противопоставляются. Если крыса делает тот же поворот (например, вправо), что и при обучении, идентифицируется обучение реакции, тогда как если она приближается к той же стороне комнаты, что и при обучении, подразумевается обучение месту.

Изменения вознаграждения после тренировки

Другой способ сформулировать вопрос «S-R против S-S» заключался в том, способствует ли вознаграждение формированию ассоциаций или участвует в них. То есть награда просто запечатлела (Thorndike, 1898) или катализировала (Colwill & Rescorla, 1986; Rescorla, 1988) ассоциации стимул-ответ, или животные сформировали ассоциации между стимулами и сенсорными и другими свойствами вознаграждения? Первоначальный подход к этому вопросу заключался в том, чтобы установить стабильную производительность с определенной наградой, а затем заменить ее другой наградой.Если подкрепления просто устанавливают ассоциации, то никаких сбоев в работе не ожидается (при условии, что замененное подкрепление имеет сопоставимую ценность), тогда как если животные ожидают определенных наград, то аспекты производительности могут быть чувствительны к изменению. Ранние эксперименты с отложенным ответом показали, что обезьяны могут сохранять в памяти представления об определенных продуктах питания в течение относительно длительных интервалов. Например, работая с Колером, Тинкельпау (1928) обучал обезьян выполнению задания, в котором экспериментатор помещал пищу под одну чашку, а не под другую, идентичную чашке.После задержки, в течение которой чашки были закрыты из поля зрения обезьяны, экран был удален, и обезьяне приказали принести еду. На разных занятиях использовалось несколько разных продуктов. Обычно обезьяна выбирала правильную чашку и быстро съедала награду за еду. Однако, если экспериментатор спрятал банан, но затем подставил салат под чашку, пока он был скрыт от взгляда обезьяны, обезьяна исследовала, но не касалась салата, тщательно исследовала чашку и иногда визжала экспериментатору.Напротив, в последующем испытании, в котором салат был спрятан и сохранен под чашкой, обезьяна съела салат быстро и без происшествий. Таким образом, исходя из этих реакций на замененное вознаграждение, обезьяны должны были отражать в памяти определенные аспекты вознаграждения. К сожалению, поскольку ожидание вознаграждения было вызвано представлением самого вознаграждения, а не партнером вознаграждения, такие эксперименты проливают мало света на то, представлены ли свойства вознаграждения в ассоциативном обучении.Ближе к этому результату был эксперимент, проведенный в лаборатории Толмена Эллиотом (1928), в котором различные группы крыс были обучены бегать по сложному лабиринту либо для семян подсолнечника, либо для предпочтительного отрубного сусла. После серьезного обучения в группе отрубей награда за отруби была заменена менее предпочтительными семечками подсолнечника. Хотя крысы охотно употребляли семена подсолнечника без каких-либо признаков нарушения, производительность в последующих испытаниях была значительно ниже, чем у крыс, которых с самого начала приучили к семечкам подсолнечника.Это нарушение предполагало, что крысы ожидали особого вознаграждения. Однако Эллиот не выполнил аналогичную замену подсолнечника на отруби, и поэтому нарушение могло отразиться только на эффектах уменьшения величины вознаграждения.

В более поздних экспериментах изучались эффекты замещения УЗ в Павловской обусловленности более симметричным образом. Например, Holland и Forbes (1982) обнаружили, что любой из двух US (гранул сахарозы с разным вкусом) лучше сохранялся в памяти (по оценке с помощью процедуры подготовительного высвобождения, например.грамм. Terry & Wagner, 1976), если им предшествовала неконгруэнтная Павловская CS1 (т.е.для других США), чем конгруэнтная CS. Аналогичным образом, в моей лаборатории Александр Джонсон (неопубликованные данные) недавно обнаружил, что у мышей наблюдается нарушение потребления каждого из пары жидких УЗИ (лецитина и сахарозы), когда каждый из них сопровождался слуховым сигналом для другой жидкости. Таким образом, по крайней мере, некоторые свойства арматуры кажутся закодированными CS после простых процедур кондиционирования.

Переоценка подкрепления

Процедура переоценки подкрепления после обучения (формально описанная Rozeboom, 1958) стала золотым стандартом анализа наличия или отсутствия SS (павловских) или RS (инструментальных) ассоциаций (Pickens & Holland, 2004) .Животные сначала проходят обучение Павлова или инструментальное обучение с одним или несколькими подкреплениями. Затем ценность подкрепления изменяется при отсутствии сигналов или реакций обучения. Наконец, реакция оценивается при отсутствии какого-либо подкрепления. Часто уровень ответа, наблюдаемый в тесте, спонтанно изменяется, чтобы отразить изменения в ценности подкрепления, с которым он был ранее связан. Основные преимущества этой парадигмы включают ее полезность практически после любой процедуры обучения и доступность широкого спектра методов для изменения ценности вознаграждений в сторону увеличения («инфляция») или уменьшения («девальвация»).Например, мотивационные состояния, относящиеся к подкрепляющим веществам, могут быть вызваны химическим путем (например, увеличение или уменьшение баланса натрия после тренировки с помощью солевого раствора) или путем изменения воздействия на них (например, выборочное насыщение одной из двух пищевых наград). Точно так же отдельные аспекты вознаграждений могут быть изменены ассоциативно путем объединения их с различными агентами, которые увеличивают или уменьшают их привлекательность. Даже неассоциативные манипуляции, такие как простое воздействие на само подкрепление или более слабые или более сильные варианты подкрепления, могут быть эффективными (например,грамм. Рескорла, 1973, 1974).

Ранним применением этого метода было исследование Зенера и МакКарди (1939). Собаки, лишенные еды, получали пары из двух реплик с собачьим печеньем разного вкуса. Затем собак тщательно насытили одним из вкусов собачьего печенья. Наконец, были записаны реакции собак на каждый сигнал. Они гораздо менее энергично откликнулись на сигнал о бисквите, которым они насытились. Хотя по нынешним стандартам исследование было несколько некорректным, потому что печенье продолжало присутствовать в тесте (и, таким образом, снижение реакции могло отражать более низкую ценность подкрепления насыщенного печенья, а не спонтанную корректировку реакции на основе ее измененного значения), эти и другие результаты воодушевили Зинера (1937, стр.386) описывать обусловливание как «реорганизацию в некое функциональное целое систем восприятия, соответствующих условным и безусловным раздражителям; и в функциональном отношении этой организованной системы к системе побуждения или напряжения, первоначально возбужденной безусловным стимулом », а не в изучении ассоциаций S-R.

Подобная логика мотивировала ранние исследования различительного поведения лабиринта или переулка, проведенные Толменом (1933), Миллером (1935) и Толменом и Глейтманом (1949).Толмен (1933) первоначально обучал крыс в боксе с двумя вариантами выбора с двумя отличительными стимулами, черными или белыми занавесками. Прохождение (скажем) через черные занавески вело к ящику с едой, а прохождение через белые занавески вело в тупик, где не было еды. После значительного обучения этой задаче крыс помещали непосредственно в контейнер для корма и подвергали поражению электрическим током. Наконец, крыс возвращали в стартовую коробку и позволяли бежать. Если крысы действительно усвоили ассоциации «ответ-еда» или «ожидания знак-гештальт», то даже при первом испытании они не смогут бежать.Однако каждая крыса «сразу же весело и, как обычно, промчалась через весь распознающий аппарат и нанесла удар по отделению с едой, в котором она только что была потрясена» (Tolman, 1933, с. 250.)

В ответ Толмену ( 1933), Миллер (1935) пошел еще дальше, описав SR-объяснение того, как крысы могут проявлять гибкое поведение в такой ситуации, и приступил к его демонстрации. В своем отчете Миллер использовал концепцию дробных упреждающих целевых реакций. Крысы могут давать мощные целевые ответы (Rg, e.g., жевание), части которого (rg) могут быть адаптированы к аллейным сигналам, которые предшествуют самой коробке ворот. Когда крысу впоследствии помещали в коробку ворот и шокировали, реакция прыжка или замирания на шок могла быть обусловлена ​​обратной связью со стимулом от предыдущих целевых реакций, основанных на еде (например, Rg-Sg → Rshock). Затем, когда крысу поместили обратно в переулок, выполнение условного rg дало бы сигнал обратной связи sg, который, в свою очередь, вызвал бы условную дробную часть реакции на шок, мешающую бегу.Миллер предположил, что все, что потребуется для получения ожидаемых Толменом данных, — это дать блокам целей отчетливые ответы на цели. Он сделал это с помощью двух наград (еда и вода) и двух отличительных ворот, одна требовала подъема и резкого поворота вправо, а другая требовала прямого входа с последующим резким левым поворотом. В отличие от аппарата Толмена, который требовал одновременного распознавания выбора, Миллер использовал единственный переулок с одним боксом для ворот, но выставил крыс на другой бокс в отсутствие переулка.Когда позже крыс помещали непосредственно во вход в одну из коробок ворот и подвергали электрошоку, шоковая реакция была обусловлена ​​определенным Sg, возникающим из отличительного Rg в этой коробке. Если крысу ударили током в том же боксе ворот, который всегда находился в конце переулка, то размещение этой крысы обратно в стартовое окно переулка для теста вызовет рг, чья обратная связь sg была связана с дробной реакцией на шок, и, следовательно, производят помехи при работе. Напротив, если крысу ударили током в другом боксе, ответная реакция rg, вызванная переулком, не будет связана с реакцией на удар током, и такое вмешательство не ожидается.Миллер (1935) действительно нашел такой результат. Таким образом, счет S-R Миллера не только объяснял такую ​​девальвацию, но и предлагал условия, при которых она будет и не будет соблюдаться.

Интересно, что в классическом исследовании Т-образного лабиринта Толмана и Глейтмана (1949), в котором Толмену наконец удалось обнаружить характеристики спонтанной девальвации, две коробки для ворот также были сконструированы таким образом, что они требовали четких ответов на цели (хотя вместо этого Толман и Глейтман подчеркнули различия в восприятии ящиков).Наконец, в одном из наиболее причудливых поворотов логики rg-sg-посредничества эффектов девальвации, используя вариант процедуры Миллера (1935), Фаулер и Миллер (1963) обнаружили, что удары от ворот могут либо ухудшить, либо улучшить результаты теста. в зависимости от того, наносили ли удары током по передним или задним лапам крыс. Если бы удары были приложены к передним ногам, Rshock отскочил бы назад, но если бы они были применены к задним ногам, Rshock прыгнул бы вперед.При замене в переулках крысы, получившие удар от ворот по передним ногам, отпрыгивали назад, замедляя свою работу, но те, кто получил удар от ворот по задним ногам, прыгали вперед, улучшая свои показатели. Таким образом, еще раз, система посредничества rg-sg не только обеспечивала учет S-R для эффектов «девальвации», но также предсказывала характер результата на основе характеристик условной дробной упреждающей реакции.

Современный эксперимент по девальвации

Современный эксперимент по девальвации связан с использованием Рескорла процедуры для исследования содержания защитной (Rescorla, 1973, 1974) и аппетитной (Holland & Rescorla, 1975) условности по Павлову, а затем с последующим использованием процедура, проведенная Дикинсоном, Рескорла и их коллегами для изучения инструментального обусловливания вознаграждения (e.г., Адамс и Дикинсон, 1981; Баллейн и Дикинсон, 1991; Колвилл и Рескорла, 1985b, 1986; Рескорла, 1987). В каждом из этих исследований наблюдался умеренный эффект девальвации США после спаривания CS-US. Например, Холланд и Рескорла (1975) объединили тон с пищевыми гранулами, а затем обесценили корм, либо насытив крыс этими гранулами, либо сочетая их с высокоскоростным вращением, вызывая укачивание. Они обнаружили, что крысы, получившие такую ​​девальвацию, показали меньшую реакцию, чем те, которые не получали насыщения или которые получали непарные подачи пищи и вращения.В то же время крысы, получившие кондиционирование второго порядка одного и того же тона, не показали таких эффектов любой девальвационной обработки на CR второго порядка, что исключает множество простых основанных на производительности объяснений снижения реакции после девальвации.

Результаты, подобные этим, побудили авторов учебников и вводной психологии утверждать, что обусловленность — это преимущественно S-S. Но такой вывод не обязательно имеет веские основания. Во-первых, эффекты девальвации обычно невелики и, возможно, ограничиваются ограниченным диапазоном параметров обучения.Я получил много сообщений с просьбой предоставить информацию от исследователей, которые не смогли обнаружить эффекты девальвации. Хотя в целом мне удавалось направить их на путь успеха в получении этого явления, примечательно, насколько мало эффектов девальвации в абсолютном выражении. Например, показаны эффекты девальвации в последней дюжине экспериментов, опубликованных членами моей лаборатории. Большинство этих исследований было проведено на интактных животных, хотя некоторые из них представляют эффекты девальвации у крыс с фиктивными поражениями различных областей мозга, которые, как известно, важны для девальвации.Примечательной особенностью этих данных является то, насколько мала разница между условиями контроля и девальвации и насколько остаётся реакция после девальвации. В большинстве случаев девальвация самих США была полной, то есть крысы практически ничего не ели из самой пищи. Колвилл и Рескорла (1990) широко обсуждали этот вопрос в контексте инструментальной девальвации, указывая на важность таких переменных, как сходство между моделями предоставления услуг в США на стадиях обучения и девальвации.Тем не менее, в большинстве случаев остаток довольно велик (но см. Colwill & Rescorla, 1990; Kerfoot et al., 2007).

Результаты 12 экспериментов по девальвации из моей лаборатории. В каждом эксперименте слуховой или зрительный условный раздражитель (CS) сначала сочетался с пищей, затем еда была либо обесценена путем сочетания ее с хлоридом лития (LiCl), либо поддерживалась путем подачи пищи и непарного LiCl, и, наконец, CS был представлен отдельно в тестовое задание.

Во-вторых, результаты экспериментов по девальвации могут существенно различаться в зависимости от выбранного агента девальвации.Например, Холланд и Штрауб (1979) и Холланд (1981b) исследовали эффекты обесценивания пищи за счет насыщения или сочетания ее с хлоридом лития или высокоскоростным вращением. показывает потребление пищи и эффективность упреждающих реакций при входе в чашку с едой на сигналы в паре с едой после девальвации каждым из этих трех методов. В этих исследованиях обнадеживает тот факт, что степень снижения потребления положительно коррелировала со степенью уменьшения реакции чашки с едой во время CS.В то же время заметно отсутствие такой корреляции. Например, Galarce, Crombag и Holland (2007) обучили крыс двум слуховым сигналам, передающим сигнал о двух пищевых продуктах (сахарозе и мальтодекстрине). Один продукт был спарен с LiCl, а другой — нет. Наконец, крыс тестировали на присутствие двух тонов. Необычной особенностью этого эксперимента было то, что в различных тестовых сессиях либо предотвращенный, либо неперевернутый УЗ был представлен в чашке с едой во время теста на девальвацию.Интересно, что постоянное присутствие любого из этих продуктов в чашках с едой мало влияло на реакцию на CS. Хотя неудивительно, что крысы проводили больше времени в чашке с пищей, когда она содержала неотвернутую пищу, чем когда она содержала отвергнутую пищу, CS для чашки с неотвернутой пищей, усиленной пищей, реагировала больше, чем сигнал для отклоненной пищи, независимо от того, какая пища была физически присутствует. Таким образом, ответ, основанный на ожидаемой цели, может иметь место, несмотря на явно не подтверждающие доказательства цели.

Левая полоса: Показатели условных реакций чашки с едой (CR) только на условный стимул (CS) в тестовой сессии после того, как еда была обесценена путем сочетания ее с хлоридом лития (LiCl) или высокоскоростным вращением, или насыщением этой пищей. . Правые столбцы: количество пищевых гранул, потребленных за 10 мин после того, как 50 пищевых гранул были помещены в чашку для корма в экспериментальных камерах. Реакция в состоянии Поддержания представляет собой совокупность реакции на тестовую CS, которая была представлена ​​после непарных предъявлений пищи и LiCl или вращения, или в отсутствие насыщения пищей.Данные взяты из Голландии (1981b) и Голландии и Штрауба (1979).

Еще одна проблема в экспериментах по девальвации — это показатель, выбранный для отражения ожидаемого результата. Во-первых, некоторые меры более чувствительны к девальвации, чем другие. Холланд и Штрауб (1979) обнаружили, что поведение более поздней цепи (например, прикосновение и захват гранулы) показало большую чувствительность к девальвации пищи за счет сочетания с LiCl, чем поведение на ранней стадии (приближение к чашке с едой). Интересно, что некоторые другие косвенные меры обучения, которые, как часто думают, отражают обусловленные побудительные мотивационные свойства, кажутся особенно нечувствительными к девальвации.Например, Холланд (2004) и Рескорла (1994) не нашли доказательств того, что на Павловский инструментальный перенос повлияла девальвация подкрепления. В исследовании Холланда (2004) после тренировки с двумя CS, двумя US и двумя инструментальными реакциями пары одного US с LiCl снижали исходные уровни инструментального ответа для этого US и уменьшали ответы чашки еды на CS, которые предсказывали, что US, но никак не повлиял на то, насколько эта CS улучшила инструментальную реакцию, которая обычно зарабатывала эти США.Аналогичным образом, Parkinson et al. (2005) обнаружили, что, хотя после повторного тестирования, девальвация США полностью устранила реакцию, вызванную CS, эта CS не утратила своей способности служить вторичным или условным подкреплением.

Во-вторых, меры реагирования и методы девальвации могут взаимодействовать. Например, хотя Холланд и Штрауб (1979) обнаружили, что обесценивание пищи за счет LiCl уменьшало вход в чашку с едой больше, чем обесценивание за счет высокоскоростного вращения, на восприятие визуальных сигналов и реакции испуга на слуховые сигналы больше влияло вращение с высокими затратами, чем при быстром вращении. пары еда-LiCl.Напротив, насыщение уменьшило оба класса ответов на промежуточную степень. Ясно, что «американская ценность» не одномерна в своем отношении к системам поведения. Различные поведенческие реакции могут быть опосредованы разными сенсорными свойствами представлений США, которые, в свою очередь, могут быть по-разному чувствительны к различным методам обесценивания. Я вкратце вернусь к этому вопросу в разделе 3.

В-третьих, аппетитные и последовательные CR могут по-разному реагировать на подкрепляющую девальвацию.Хотя, как отмечалось в, реакции на подход с чашкой еды часто показывают относительно низкую чувствительность к обесцениванию подкрепления, постоянные CR, такие как облизывание, и различные так называемые вкусовые реакции (TR; Berridge, 2000; Grill & Norgren, 1978), меры, которые, как считается, отражают гедонистические подходы. или аспекты вкусовых качеств вознаграждений часто полностью устраняются. Используя крыс с хроническими внутриротовыми канюлями, Kerfoot et al. (2007) соединили тональный CS с внутриротовой доставкой раствора сахарозы за один сеанс в двух группах крыс и представили эти события неспаренными у других крыс.Затем крысы в ​​группе Devalue заболели инъекцией LiCl после одного сеанса внутриротовой доставки сахарозы в отсутствие тонов, в то время как крысы в ​​группе поддержки получали сахарозу и LiCl в отдельные дни. Контрольные крысы, тренированные с использованием тонуса и неспаренной сахарозы, также получали сахарозу и LiCl в паре или без пары в этой фазе. Наконец, все крысы были протестированы с сочетанием тона с настоями простой воды. Крысы в ​​группе «Поддержание» показали высокие уровни TR положительного (гедонистического) воздействия в тестовых испытаниях ().Хотя эти реакции были особенно очевидны в присутствии воды, которая обеспечивала основу для их выступления, они также возникали во время одного тона перед вливанием воды в каждом испытании. Напротив, у крыс из группы Devalue не было больше лизания или положительных TR, чем у контрольных крыс. Таким образом, девальвация завершилась. Кроме того, у этих крыс было значительно больше отрицательных TR, таких как зияние и сокращенные облизывания, которые обычно проявляются в ответ на сами предотвращенные ароматы, чем у контрольных или поддерживающих крыс ().Возникновение этих отрицательных TR особенно важно, потому что крысы Devalue никогда ранее не выполняли отрицательные TR ни к тону, ни к сахарозе. Во время сочетания тон-сахароза и во время введения одной сахарозы перед инъекцией LiCl сахароза выявляла только положительные TR, и сахароза больше не представлялась после однократной инъекции LiCl. Таким образом, проявление отрицательных TR-ответов крыс с парной девальвацией в тесте не могло отражать обучение S-R, даже через механизмы посредничества S-R (Osgood, 1953) или rg-sg (Miller, 1935), описанные ранее.

Положительные (панель A) и отрицательные (панель B) реакции вкусовой реактивности (TR) во время тестовых презентаций тонального условного стимула (CS) и простой воды в тесте на девальвацию. Крысы сначала получали пары тон → сахароза, за которыми следовали пары сахароза-хлорид лития (LiCl) (Devalue) или непарные представления этих событий (Maintain). Контрольные крысы получали тонус и сахарозу неспаренными при обучении, за которыми следовали сахароза и LiCl, либо парные, либо непарные. Все жидкости были доставлены внутрь ротовой полости.Данные взяты из Kerfoot et al., 2007.

На основании результатов Kerfoot et al. (2007) заманчиво предположить, что усвоенные окончательные или TR-ответы особенно чувствительны к девальвации. Однако более простая возможность состоит в том, что внутриротовая доставка подкрепления и использование этого метода доставки как во время фазы обучения, так и во время фазы девальвации являются более важными факторами. В соответствии с этой возможностью, Colwill и Rescorla (1990) обнаружили почти полную девальвацию нажатия на оперантный рычаг после тренировки и девальвацию при внутриротовой подаче подкрепления.Совсем недавно Holland, Lasseter и Agarwal (2008) изучали консумативные и TR-реакции в экспериментах по девальвации с интраоральной или традиционной (в утопленную чашку) доставкой усилителей сахарозы. Стаканы с едой были оборудованы камерами, позволяющими измерять TR-ответы в условиях чашки, а также в условиях внутриротовой доставки. Положительные ответы TR показали одинаковую картину независимо от метода введения сахарозы. Как при внутриротовом, так и в чашечном способах доставки крысы в ​​состоянии девальвации показали почти полную потерю положительных TR после девальвации сахарозы по сравнению с крысами в состоянии поддержания, и только крысы в ​​состоянии девальвации показали отрицательные TR-ответы ().В то же время прием пищи из чашки показал лишь частичную чувствительность к девальвации сахарозы. Кроме того, при обоих условиях доставки простые реакции облизывания, охарактеризованные Berridge (2000) как последовательные, но негедонические, показали умеренную, но не полную чувствительность к девальвации. Таким образом, результаты исследования Holland et al. (2008) показывают, что, независимо от метода введения подкрепления, оценочные TR-ответы особенно чувствительны к обесцениванию по сравнению с неоценочными консумативными ответами (простое лизание) и (с традиционной доставкой) к аппетитные реакции (прием пищи в чашке).

A: Чашка для еды и положительная реакция вкуса и реактивности (TR) во время тестовых презентаций на тон и обычную воду после минимального количества пар тон-сахар, за которыми следует либо сочетание (девальвация) сахарозы с хлоридом лития (LiCl), либо непарные презентации тех событий (Поддерживать). B: То же, что и панель A, за исключением обширного тренинга по тону сахарозы. C: Простое (неоценочное) лизание, положительный TR и отрицательный TR, ответ во время тестовых презентаций тона и простой воды, после минимального количества сочетаний тон-сахароза, с последующим либо сочетанием (Devalue) сахарозы с LiCl, либо непарными представлениями этих событий ( Поддерживать).D: То же, что и панель C, за исключением обширной тренировки тона сахарозы. Все жидкости доставлялись в утопленную чашку для еды (панели A и B; Holland et al., 2008, эксперимент 1) или внутрь ротовой полости (панели C и D; Holland et al., 2008, эксперимент 2).

Вторая цель исследования Холланда и др. (2008) состояла в том, чтобы изучить влияние объема обучения на эффективность девальвации со всеми этими показателями. В контексте инструментального обучения часто утверждается (например, Adams, 1982; Kimble & Perlmuter, 1970; но см. Colwill & Rescorla, 1985a; Colwill & Triola, 2002; Holland, 2004), что наученная реакция становится все более невосприимчивой к подкреплению. девальвация с расширенным обучением.Действительно, одним из алиби (его слов) Толмена (1933) о том, что он не получил эффекта девальвации, было то, что его крысы перетренировались и «зациклились» на беге. Мы никогда не наблюдали такого эффекта у Павлова; То есть, павловские CRs по крайней мере так же чувствительны к обесцениванию пищи за счет сочетания с LiCl после продолжительной тренировки, как и после минимальной тренировки (например, Holland, 1998; 2004, 2005). Тем не менее, мы часто наблюдали резкую потерю способности павловской системы обучения участвовать в «опосредованном обучении» по мере продолжения обучения.

Holland (1981a, 1990) обнаружил, что опосредованное обучение отвращению к пище может быть установлено, когда ассоциативно-активированное представление о еде сочетается с болезнью (недавний обзор см. В Holland & Wheeler, в печати). Например, в одном эксперименте (Holland, 1981a) крысы сначала получали пары из двух слуховых CS с двумя пищевыми усилителями, которые различались только по вкусу (например, тон → сахароза со вкусом грушанки и шум → сахароза со вкусом мяты перечной), чтобы дать им CS способность выборочно активировать представления того или иного из этих подкреплений.Затем презентация только одного из слуховых CS сочеталась с инъекцией токсина хлорида лития (LiCl) при отсутствии каких-либо запахов. Последующие тесты на потребление показали установление легкого отвращения к пище, чей CS-партнер был связан с болезнью, как если бы активация CS представления пищи непосредственно перед индукцией болезни позволила сформировать ассоциации пища-болезнь. Позже Холланд (1990, 1998, 2005) обнаружил, что, хотя пары CS-LiCl выявляют значительную опосредованную отвращение к пище после 16-24 пар CS-еда, крысы, тренированные с 40 или более парами CS-еда, не показали никаких доказательств такого опосредованного отвращения к пище.В то же время другие крысы, обученные с целыми 160 парами CS-US, продолжали демонстрировать доказательства обучения S-S тон-еда, на что указывают процедуры обесценивания подкрепления. Эти результаты привели Холланда (1990, 1998, 2005) к предположению, что на ранних этапах обучения CS активируют широкий спектр обработки, обычно активируемой самими США, включая раннюю стадию обработки восприятия, но по мере продолжения обучения этот доступ сужается до более ограниченного. комплекты систем обработки. Таким образом, с этой точки зрения, опосредованное обучение отвращению к вкусу не наблюдалось на более поздних этапах обучения, потому что CS больше не активировал перцептивную обработку отсутствующего аромата, которая могла вступить в ассоциацию с болезнью.

Логика, лежащая в основе исследований Холланда и др. (2008), заключалась в том, что если кондиционирование TR-ответов на сигналы в паре с сахарозой отражает активацию сигналами перцепционной обработки отсутствующей сахарозы, и что такая активация происходит только на ранних этапах обучения , то только минимально обученный CS будет контролировать эти положительные оценочные ответы, а более тщательно обученный CS — нет. В каждом из своих экспериментов Holland et al. (2008) тренировали каждую крысу с двумя CS: одна была соединена с сахарозой US 16 раз, а другая — 112 раз.показать ответ на минимально обученный CS (описанный ранее), тогда как показать ответ на хорошо обученный CS. Как и ожидалось, проявление условных ТУ-ответов наблюдалось только после минимальной тренировки. В то же время аппетитные и неоценочные конечные ответы (простые облизывания) были чувствительны к обесцениванию сахарозы после минимальной или обширной тренировки.

Эти данные, как и данные исследований опосредованного обучения, согласуются с точкой зрения (Holland, 1990), что на ранних этапах обучения CS активирует обработку восприятия, обычно активируемую самой пищей.С этой точки зрения любая функция, обычно контролируемая вкусом США, должна быть доступна CS. Таким образом, можно было бы ожидать опосредованного обучения отвращению к этому подкреплению, если бы CS был соединен с инъекцией LiCl, потому что крыса испытала бы болезнь после того, как попробовала отсутствующий US. Точно так же этот CS должен контролировать оценочные TR-ответы, соответствующие этому вкусу, как наблюдали Holland et al. (2008) и Kerfoot et al. (2007). Поскольку CS активирует предоценочную перцептивную обработку пищи US, наблюдаемая TR будет согласована с текущей оценкой вкуса этой пищи и, таким образом, будет чувствительна к посттренировочным изменениям в ценности подкрепления, как это наблюдается в тех случаях, когда исследования.Напротив, по мере продолжения обучения CS теряет доступ к этой низкоуровневой обработке восприятия США и вместо этого активирует аспекты обработки подкрепления, которые не включают в себя сам перцептивный опыт или способность контролировать оценочные реакции, соответствующие текущей оценке этого. перцептивный опыт. Эти более концептуальные аспекты США, тем не менее, должны включать в себя как сенсорную, так и своего рода мотивационную информацию, потому что эффекты девальвации подкрепления остаются в высокой степени специфичными для США даже после того, как CS теряют способность контролировать реакции TR или опосредовать обучение новому отвращению к вкусу (Holland, 1998). .

Ясно, что в этой истории есть нечто большее, чем ассоциации S-S и S-R. Представления, активируемые CS после минимального и расширенного обучения, можно отличить по их способности участвовать в новом (опосредованном) обучении и по их способности контролировать соответствующие оценочные TR-ответы. Тем не менее, даже после длительного обучения CS могут активировать подкрепляющие репрезентации, которые включают богатую сенсорную информацию, которая может поддерживать эффекты обесценивания подкрепления. Это различие напоминает различие, предложенное Конорски (1967, e.g., pp. 170-181), который различал ассоциативную активацию «галлюцинации» и «образа» CS. В первом случае считалось, что CS вызывает активность сенсорных «проективных» единиц, которая может напоминать активность этих единиц, когда они активируются самими США. Напротив, в последнем случае CS активировала только «гностические» единицы, которые кодировали информацию о США, но которые обычно не генерировали перцепционную обработку. Проще говоря, галлюцинация включает чувственное переживание отсутствующего объекта, тогда как можно представить этот объект и его сенсорные свойства, не испытывая их.

III. Может ли нейросистемный анализ помочь нам понять содержание обучения?

В разделе I я отметил, что Спенс пренебрег физиологизацией, даже физиологией Халла, как скорее вводящей в заблуждение, чем полезной для характеристики математических и поведенческих аспектов обучения привычкам. Однако результаты описанных мною задач по девальвации подразумевают, что ассоциативное обучение может задействовать различные уровни нейронной обработки. Пластичность не уникальна ни для одного из кругов в. Например, исследования нервной пластичности в кондиционировании век (например,г., Medina et al., 2000; Steinmetz et al., 1989; Thompson et al., 1998) идентифицировали участки пластичности мозжечка, которые можно охарактеризовать как находящиеся в пределах «выходных» путей и, следовательно, более «S-R», а также другие участки ранее в потоке обработки. Разумная исследовательская программа могла бы представить себе обстоятельства, при которых сигналы управляют обработкой в ​​различных системах мозга, которые преимущественно контролируют различные аспекты поведения. Понимание потока информации в мозге может помочь нам понять, почему, например, некоторые продукты обучения, такие как контроль TR-ответов и способность поддерживать опосредованное обучение, связаны между собой своими функциями быстрого битонического усвоения, почему другие, кажется, поддерживают чувствительность. к девальвации из-за обширных тренировок, а третьи, похоже, теряют такую ​​чувствительность из-за тренировок.

Для получения информации, необходимой для понимания содержания обучения, использовались различные нейробиологические методы. Методы стимуляции мозга вышли далеко за рамки грубой стимуляции моторной коры, как в экспериментах Лаукса (1935). Например, при анализе нервных систем кондиционирования век замена реальных событий, таких как CS и US (или того и другого, например, Steinmetz et al., 1989), стимуляцией мозга выявила события, критические для кондиционирования век.Сходным образом структурированная стимуляция миндалины помогла выяснить механизмы приобретения и исчезновения условного рефлекса страха (Vidal-Gonzalez et al., 2006).

Точные фармакологически селективные поражения и обратимая инактивация различных групп клеток могут избирательно изменять чувствительность крыс к девальвации, не влияя на другие аспекты производительности. Например, повреждение компонентов схемы, включая базолатеральную миндалину (BLA), орбитофронтальную кору (OFC), субрегионы медиальной префронтальной коры и, в некоторых случаях, медиодорсальный таламус, мешают работе крыс по Павловской девальвации, не влияя на получение пищи. чашки CR или отвращение к вкусу (Gallagher et al., 1999; Hatfield et al., 1996; Maddux & Holland, 2007; Пикенс, 2008; Пикенс и др., 2003). Более того, эти исследования показывают, что различные части этой схемы выполняют специализированные функции в рамках задачи девальвации. Например, для того, чтобы крысы демонстрировали эффекты девальвации с помощью процедур с одним подкреплением, функция BLA необходима во время начальных пар CS-еда, но не после этого. То есть, если крысы приобрели ассоциации CS-еда, в то время как функция BLA не нарушена, то последующие поражения не ухудшают производительность этой формы девальвации, как будто функция BLA необходима крысам для приобретения ассоциаций SS, а не SR, но не для использования ранее -установленные ассоциации SS для контроля поведения (Pickens et al., 2003). Напротив, функция OFC, по-видимому, имеет решающее значение для выражения, а также приобретения таких ассоциаций в задачах девальвации. Поражения OFC нарушают эффективность девальвации (то есть крысы не могут спонтанно снижать реакцию на CS после девальвации в США), независимо от того, выполняются ли они до CS-еды, отвращения к пище или заключительных фаз тестирования (Pickens et al., 2003, 2005) . Наконец, участие этих областей мозга может варьироваться в зависимости от требований задачи. Например, хотя при использовании одной комбинации сигнал-подкрепление, функция BLA не требуется после установления ассоциаций сигнал-подкрепление, при использовании двух или более сигналов и подкреплений функция BLA также должна быть неизменной во время тренировки отвращения вкуса. и / или тестирование девальвации (Johnson et al., 2007). Точно так же Пикенс (2008) обнаружил, что функция медиодорсального таламуса важна для выполнения задачи по Павловской девальвации только в том случае, если эта задача требует изменения стратегии по сравнению с предыдущей задачей.

Результаты недавних исследований электрофизиологической записи также предполагают, что процедуры кондиционирования могут устанавливать различные типы ассоциаций как внутри, так и между взаимосвязанными областями мозга. Например, используя задачу распознавания по запаху, Schoenbaum, Chiba и Gallagher (1998) обнаружили нейроны в BLA и OFC, которые можно охарактеризовать как отражающие ассоциации S-S и ответ-стимул (R-S).Эти нейроны первоначально избирательно реагировали на один из двух подкрепляющих элементов, используемых в задаче, но в ходе обучения их активность находилась под контролем либо конкретной запаховой подсказки, либо определенной реакции. Более поздние исследования показали, что природа нейронного кодирования информации о стимуле или ответе в этих двух областях мозга зависит от связи между ними (например, Saddoris, Gallagher & Schoenbaum, 2005; Schoenbaum, et al., 2003). Совсем недавно Furuyashiki, Holland и Gallagher (2008) также сравнили активность нейронов OFC, кодирующих информацию о результатах, с нейронами, кодирующими информацию об ответах.Эти последние нейроны специфически реагировали на определенные ответы, но не на определенные подкрепления. Хотя эти последние нейроны не могут быть истолкованы как субстрат для ассоциаций S-R, поскольку они увеличивают свою активность только после выполнения закодированного ответа, их существование показывает, что по крайней мере в некоторых областях мозга отдельные нейроны могут кодировать различные виды информации о задачах.

Наконец, мы использовали методы немедленной экспрессии генов, чтобы связать функцию мозга с производительностью в простых задачах обесценивания (и других).Наша цель — связать различия в производительности в разных условиях с различиями в системах мозга, задействованных в этих условиях. Посмертный анализ ткани может выявить подробную информацию об отдельных нейронах, которые были активны (Lee et al., 2005) или претерпевали пластические изменения (Guzowski & Worley, 2001; Petrovich et al., 2005) в течение довольно ограниченных интервалов времени, таких как конкретный эпизод поведенческого теста перед жертвоприношением. Например, после оценки ответов TR на минимально тренированный тон CS в отсутствие сахарозы Kerfoot et al.(2007;) пожертвовали своих крыс, чтобы исследовать экспрессию FOS, белкового продукта зависимого от активности гена предраннего развития c-fos . Они обнаружили, что зависимая от обучения и девальвации экспрессия FOS в ряде областей мозга, известных из экспериментов с повреждениями (только что описанных), имеет решающее значение для обучения, чувствительного к девальвации результатов (базолатеральная миндалина и орбитофронтальная кора; Holland & Gallagher, 2004) в регионы, связанные с отображением TR-ответов (оболочка accumbens; Reynolds & Berridge, 2002), и регионы, связанные с обработкой информации о вкусе (вкусовая кора; Kiefer & Orr, 1992).Эти последние наблюдения особенно интересны из нашего более раннего предположения, что обусловливание может наделить CS способностью активировать перцептивную обработку отсутствующих US. Если в результате сочетания тона и сахарозы тон вызывал ощущение сладости, делая вкус простой воды сладким, можно было ожидать, что крысы в ​​условиях девальвации и сохранения будут демонстрировать повышенную активность ФОС во вкусовой коре головного мозга, что они и сделали. Более того, поскольку крысы в ​​состоянии Поддержания будут реагировать на сладкое аппетитными реакциями вкуса и реактивности, один только тон также будет вызывать эти реакции и активность ФОС в части прилежащей оболочки, коррелирующую с такими реакциями.Напротив, поскольку крысы в ​​состоянии девальвации будут реагировать на сладкое с помощью аверсивных ответов, тон вызовет аверсивные реакции и FOS в другой субрегионе прилежащей раковины, коррелирующей с аверсивными TR-ответами. Все эти результаты были соблюдены. Учитывая результаты Холланда и др. (2008), было бы интересно определить, является ли более тщательно обученный CS, который не вызывает аппетитных TR-ответов при обучении или вызывает отрицательные TR-ответы после девальвации и не поддерживает опосредованный вкус -аверсионное обучение, также не может вызвать ФОС в прилежащей оболочке или вкусовой коре.

Интересно, хотя Kerfoot et al. (2007) обнаружили зависимую от кондиционирования экспрессию FOS в центральном ядре миндалевидного тела (CeA), это выражение не зависело от состояния девальвации (обесценивалось или сохранялось). Это наблюдение примечательно по трем причинам. Во-первых, это предполагает, что ассоциативно активируемые вкусовые воспоминания не полностью взаимозаменяемы с самими вкусами. Информация о вкусах и болезнях сходится в этом регионе (Bernstein & Koh, 2007; Yamamoto, 2007), и известно, что CeA играет важную роль во многих аспектах обучения и выражения вкусовых отвращений (Lamprecht and Dudai, 2000; Yamamoto, 2007).Однако, если бы ассоциативно активируемая память вкуса стимулировала эти аспекты обработки вкуса, мы бы наблюдали различную активность CeA в условиях сохранения и девальвации. Во-вторых, повреждения CeA не влияют на эффективность девальвации (Hatfield et al., 1996). В-третьих, функция CeA имеет решающее значение для приобретения условных OR, которые при других обстоятельствах Holland и Straub (1979) обнаружили, что они относительно нечувствительны к девальвации за счет сочетаний пищи и LiCl. Взятые вместе, эти последние два наблюдения предполагают наличие сходных доказательств, которые связывают различия в чувствительности условных ОР и связанных с пищей CR к процедурам девальвации на основе LiCl (Holland & Straub, 1979) с различиями в мозговых цепях, влияющих на эти выученные реакции.Различия в рабочих характеристиках этих систем могут определять дифференциальную чувствительность разных поведенческих систем к параметрам девальвации.

Эти нейросистемные исследования девальвации и связанных с ней явлений проясняют, что вопросы содержания обучения являются сложными. Даже в очевидно простых поведенческих системах, таких как рефлекс моргания, возможности для пластических изменений имеются в изобилии в нервных системах, которые их обслуживают. Последствия экспериментальных манипуляций со стимулами окружающей среды для обучения могут значительно различаться в зависимости от этих систем и их компонентов.Становится все труднее различать ассоциации S-S и S-R с какой-либо уверенностью на основе какого-либо одного поведенческого анализа или аспекта нейронной обработки. Характеристика множественных поведенческих и нейронных последствий вариаций в процедурах ассоциативного обучения должна привести к более богатым, хотя, возможно, менее понятным описаниям природы обучения.

Выводы

В контексте ассоциаций S-S и S-R в обучении маятник решительно качнулся в когнитивную сторону со времен Спенса.В настоящее время существует множество демонстраций кодирования детализированных сенсорных аспектов подкреплений с помощью CS из ряда поведенческих парадигм, включая сенсорное предварительное кондиционирование, девальвацию подкрепления, опосредованное обучение и другие. Возможно, из-за этого множества примеров приобретение S-R ассоциаций редко непосредственно исследуется. Ассоциация S-S стала стандартом по умолчанию, и отсутствие доказательств для нее больше не используется в качестве доказательства для ассоциаций S-R, как это было раньше. Например, хотя эффекты девальвации часто незначительны, преобладающее мнение, кажется, состоит в том, что остаточная реакция после девальвации отражает неадекватность процедуры девальвации, а не обучения S-R.Это мнение может быть необоснованным. Существует множество примеров неудачной девальвации, и примечательно то, что некоторые из множества поражений головного мозга, которые ухудшают эффективность девальвации, приводят к общему снижению измеряемых CR. Вместо этого животные с такими поражениями работают на нормальном уровне до девальвации, но не могут скорректировать свою реакцию вниз после девальвации. Таким образом, эти поражения, по-видимому, изменяют то, что извлекается из ассоциаций S-S и S-R, не затрагивая наиболее очевидные аспекты формы CR.Более того, из исследований нейронных систем ясно, что происходит пластичность ответного конца и что посредством ассоциативного обучения нейроны могут кодировать аспекты поведения, а также стимулы.

Что можно сказать о других 5 характеристиках Спенсом «когнитивных теорий обучения и теорий стимула-реакции»? С точки зрения метафор , и телефонные коммутаторы, и диспетчерские карты стали анахронизмами. Как и во времена Спенса, большинство современных количественных моделей обучения и поведения подчеркивают ассоциативные структуры, которые можно одинаково истолковывать как S-S или S-R.Широкое представление о задачах и результатах обучения и гибкость их использования в процессе работы широко считаются правилом, но, вероятно, они не лучше определены в рамках формальных моделей, чем карты прошлых лет.

Спенс, вероятно, поступил мудро, проигнорировав нейрофизиологизацию своего времени, потому что она имела мало оснований для изучения нервной системы. Нейрофизиологические характеристики обучения сегодня имеют гораздо более прочную основу, чем в 1950 году, и с большей вероятностью будут основаны на данных, чем на предположениях.Методы электрофизиологического перекодирования могут характеризовать нейронное кодирование различных видов информации, а функциональные анатомические методы могут использоваться для изучения основ изначально гипотетических сетей мозга, лежащих в основе аспектов ассоциативного обучения. Хотя многие современные редукционистские анализы обучения подчеркивают клеточные и молекулярные изменения, лежащие в основе обучения, этот анализ редко используется в качестве замены поведенческого анализа. Хотя я считаю, что лучший способ углубить наше понимание поведения — это изучить поведение, нейронный анализ часто может дать нам подсказки и подсказки о поведенческих процессах и организации.Возможно, не менее важно то, что изучение нейронной основы обучения может связать изучение обучения с гораздо более широкой научной базой и сообществом.

В современных исследованиях в области обучения наш выбор переменных стимулов гораздо более эклектичен, чем во времена Спенса, с теми же лабораториями, часто исследующими перцепционные, мотивационные и другие переменные, и в равной степени углубляясь в определение содержаний и условий из обучение. Мы, по крайней мере, более восприимчивы к идее о том, что условия и содержание обучения не являются независимыми, и с большей вероятностью будем проводить программы, которые исследуют, например, условия, способствующие формированию обучения SS или SR, чем просто спрашивать: такое изучение СС или СР?

Обращаясь к состоянию теоретизирования в изучении обучения, Спенс (1950, стр.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *