Классическое и оперантное обусловливание – Научение: классическое vs. оперантное — Практическая психология на Aboutyourself.ru

Обусловливание — Психологос

Обусловливание — создание условий, дающих возможность управлять поведением человека. Обусловить — сделать череду процедур, организовать такую жизнь и ситуацию, что теперь, меняя те или иные подконтрольные нам условия, мы меняем состояние организма человека, его реакции и поведение.

Нужно учесть, что благодаря всемирно известным трудам Павлова и Скиннера из всех разнообразных условий, которыми можно управлять поведением, обычно имеется в виду только ситуацию формирования условного рефлекса (классическое павловское обусловливание) и оперантное обусловливание по Скиннеру.

Условный рефлекс — не от слова условность, а от слова УСЛОВИЕ, некоторое важное обстоятельство. Рефлекс, запускаемый тем обстоятельством, что лампочка всегда загорается вместе с подачей мяса собаке. Рефлекс, возникающий только при УСЛОВИИ (при том обстоятельстве), что вместе с подачей мяса загорается лампочка.

Обусловливание — это такая естественная или искусственная «стыковка» внутренних ожиданий и представлений человека со случайно или преднамеренно аранжированными аспектами его текущей ситуации, которая приводит к более или менее устойчивому изменению поведения в сравнении с предыдущими привычками данного индивида. Искусственное (организованное, целенаправленное, намеренное) обусловливание строится на провоцировании пошаговых, постепенных изменений в поведении и мышлении, каждое из которых в отдельности (особенно на первых этапах) кажется естественным («логичным») развитием привычных способов мышления и поведения или лишь незначительным, мелким и временным отклонением от них.

Из этих мелких шагов и формируется та пропасть между «прежней» и «новой» жизнью «отдрессированного» человека, которая в начале пути не могла присниться и в страшном сне. При этом человеку кажется, что на каждом шаге он вполне самостоятельно принимал достаточно здравые решения, но отсутствует — для данного случая — понимание того, что эта самостоятельность была подобна той, которую проявляет утка, вполне самостоятельно плывущая на звук охотничьего манка. Собак и прочих животных, кстати, тоже дрессируют не «с нуля», а эксплуатируют их безусловные рефлексы и механизмы формирования условных рефлексов.

Виды обусловливания

  • Викарное обусловливание

Исследования «викарного обусловливания» показали, что простое наблюдение за реакцией страха на специфический условный стимул может действовать как безусловный стимул, который достаточен, чтобы служить подкреплением для выработки условной реакции страха. Рожденные на воле макаки-резус обычно боятся змей. Это не врожденный страх, так как его не проявляли малыши макаки-резус, появившиеся на свет в лаборатории. Но детенышу макаки достаточно один раз увидеть, как реакцию страха на змею демонстрирует взрослая особь, чтобы страх змей возник и у него (Mineka, 1987). Это лишь один из способов, с помощью которого родители могут непреднамеренно влиять на поведение своих детей. См.→

Классическое обусловливание — это процесс научения, при котором ранее нейтральный стимул начинает ассоциироваться с другим стимулом вследствие того, что второй стимул сопровождает первый.

Изучение классического обусловливания началось в первые годы XX века, когда российский физиолог Иван Павлов, уже получивший тогда Нобелевскую премию за исследования пищеварения, обратился к научению. См.→

Оперантное обусловливание — форма научения, сама по себе имеющая разные формы. В оперантном обусловливании подкрепляется то спонтанное поведение, которое признается желательным. Автор понятия и основной разработчик темы — Беррес Фредерик Скиннер.

Обусловливать (в соответствии с нормами русского языка допускаются обе формы — и обуслОвливать, и обуслАвливать) — подкреплять поведение теми или иными УСЛОВИЯМИ окружения. См.→

Обозначает возможность заставить испытуемого видеть какой-то объект и слышать какой-то звук в точности так же, как можно вызвать у него коленный рефлекс, мигание или слюноотделение. Термин в 1936 г. ввёл Кейзон (Cason H.).

Для этого необходимо предъявить испытуемому достаточное число раз определённый звук в паре с некоторым зрительным изображением, затем прекратить предъявление изображения, и субъект будет видеть отсутствующее изображение всякий раз, когда он услышит данный звук. Так же как и «слышать» данный звук, всякий раз когда увидит изображение.

  • Социально-психологическое обусловливание

Социально-психологическое обусловливание — это, в таком случае, «привязывание» определенных реакций человека к соответствующим внешним стимулам, своего рода социальная дрессировка.

Организаторы такой дрессировки не «программируют» человека «с нуля», а всего лишь умело помогают внутренним предрассудкам человека «связаться» с однозначно заданными опорными ориентирами (реперными точками): фигурой лидера (авторитета), «своей» группой, «своей» идеологией, навязанным мировоззрением и правилами поведения.

Обусловливание и генетическая предрасположенность

Обусловливание происходит быстрее, если к нему есть видовая генетическая предрасположенность, и с большим трудом, если генетически такое обусловливание не предусмотрено.

В серии исследований Охман и его коллеги показали, что возникающая у людей в результате обусловливания кожно-гальваническая реакция более устойчива к затуханию, если условный стимул — изображение змеи или паука, а не изображение цветов или грибов (Ohman, 1986). Кук и Минека (Cook & Mineka, 1990) получили доказательства существования подобного избирательного страха у обезьян. Младенцы обезьян пугались змей после просмотра видеозаписи, на которой взрослая обезьяна проявляла на змею реакцию страха, но не обнаруживали никакой реакции страха на цветы после наблюдения искусно отредактированной видеозаписи, на которой взрослая обезьяна демонстрировала состояние паники при виде цветка. Подобные результаты были интерпретированы как свидетельство существования биологической предрасположенности к связыванию некоторых видов стимулов с определенными последствиями: в эволюционной истории ранних гоминид или других африканских приматов змеи и пауки были потенциально опасны, в то время как цветы и грибы не были. Есть и другие вопросы, остающиеся без ответа в рамках теорий научения. В экспериментах Охмана установлено, что страх перед змеями угасает медленнее, чем страх перед цветами, но приобретаются они с однаковой скорость. Другие эксперименты показали, что изображения змей так же легко воспринимаются в качестве безопасных сигналов, как и изображения цветов (McNally & Reiss, 1984). Детеныши обезьян в экспериментах Кука и Минеки, просмотрев видеозаписи, на которых взрослые обезьяны демонстрировали реакцию страха на цветы, а не на змей, все-таки проявляли существенный страх перед живой змеей (и никакого страха перед цветами). См.→

www.psychologos.ru

Классическое и оперантное обусловливание. Научение на модели. — КиберПедия

Классическое обусловливание. И. П. Павлов заметил, что у собаки уже на один вид кормушки выделяется слюна. В предыдущих исследованиях он всегда наблюдал выделение слюны через фистулу (небольшой разрез, который позволяет выводить с помощью трубочки продукты секреции желез наружу) слюнной железы во время поглощения собакой пищи. Но эта собака, по предположению Павлова, научила связывать вид миски со вкусом еды. Вскоре было принято решение проверить, могут ли животные научиться связывать пищу с такими индифферентными (незначимыми) раздражителями, как вспышка света или звонок. В специальную установку с автоматически подаваемой кормушкой помещали собаку и фиксировали ее ремнями (рис. 6-1). Всякий раз после включения звонка животному подавали в кормушке сухарный порошок с мясом. После многократных сочетаний включения звонка с подачей пищи у животных возникало обильное выделение слюны на одно предъявление звонка. То есть собака научалась связывать звонок с пищей.

 

· Классическое обусловливание-выработка условных рефлексов.

Павлов назвал звонок условным раздражителем, а пищу — безусловным раздражителем, вызывающим выделение слюны, или безусловным рефлексом. Выделение слюны в ответ на предъявление условного раздражителя стали называть условным рефлексом. Павлов полагал, что в процессе выработки условных рефлексов устанавливается связь между условным и безусловным раздражителями, в результате чего условный раздражитель заменяет безусловный. Повторное сочетание условного раздражителя с безусловным называется фазой выработки условного рефлекса. После того как условный рефлекс четко возникает на предъявление условного сигнала (звонок), можно приостановить подачу пищи, и тогда выделение слюны в ответ на предъявление условного раздражителя постепенно приостанавливается. Другими словами, происходит угасание условного рефлекса. Это угасание, по мнению Павлова, не приводит к разрушению связи между условным и безусловным раздражителем, так как при возобновлении подачи безусловного раздражителя после условного вскоре восстанавливается и условный рефлекс.

Важно отметить, что в качестве условного раздражителя может выступать любое событие, а в качестве безусловного раздражителя — любое биологически значимое для организма событие или предмет (например, пища, вода или удар током). В зару­бежной психологии выработку условных рефлексов стали называть обусловливанием, а после появления ее новых форм — классическим обусловливанием. В рамках сравнительной психологии ученые разработали множество вариантов классического обусловливания и стали применять их для изучения животных разных видов. Например, так вырабатывали условные рефлексы у плоских червей: вспышку света многократно сочетали с ударом тока, вследствие которого черви все время судорожно стягивали свое тело. После нескольких десятков сочетаний черви стягивали тело в ответ на одну вспышку света.


В России после смерти Павлова механизмы выработки условных рефлексов на долгие годы стали основным предметом исследования в физиологии нервной системы. В результате возникла новая наука о высшей нервной деятельности (ВНД), теснейшим образом связанная с учением Павлова. Метод выработки условных рефлексов стали применять и в других научных областях. Так, в психиатрии при лечении алкоголизма вырабатывали условные рефлексы рвоты в ответ на предъявление водки. Для этого больному вначале давали выпить алкоголь, а затем искусственно вызывали рвоту. Вследствие многих сочетаний уже один запах начинал вызывать рвоту у больных. Такой метод «оздоровления» на медицинском жаргоне называли «водка-рвота», но ввиду того, что условным рефлексам свойственно угасать, он не приводил к внушительным результатам.

В классическом обусловливании условный рефлекс идентичен с безусловным, поэтому организм научается не реализовывать какие-то новые акты, а лишь связывать одно событие с другим. Поэтому когда исследователи хотят обучить животное какому-то новому поведению, они не используют процедуру классического обусловливания.

 

Оперантное обусловливание. В цирке дрессировщики побуждают зверей совершить какое-то действие, а затем хвалят их и дают маленький кусочек пищи. После того как животное научилось делать это новое действие, его побуждают к совершению следующего действия. Если действие не то, которое нужно дрессировщику, то он не дает животному кусочка пищи, т. е. не поощряет его. Животное начинает совершать разные попытки и в итоге реализует нужное действие.


· Оперантное обусловливание —научение, в ходе которого приобретение нового опыта и реализация его в поведении приводят к достижению определенной цели.

Если мы понаблюдаем за поведением собственной собаки, когда она во дворе играет с мячом, то мы заметим, что она может его кусать, прижимать к земле и отпускать или подкидывать его. В естественных условиях обитания организмы не только отвечают на стимулы, но и воздействуют на среду. Но как только организм совершил новое действие, дальнейшее появление этого действия в поведенческом репертуаре будет зависеть от того, каков был его результат. Так, собака чаще будет подбрасывать мяч, если мы будем поощрять это действие поглаживанием или кусочком лакомой пищи.

Оперантное обусловливание (от лат. оperatic — действие) означает такое научение, в ходе которого приобретение определенного нового опыта и реализация его поведении приводят к достижению определенной цели. Оно позволяет нам воздействовать на среду и присуще не только людям, но и более простым существам, так как паук или таракан. Сам термин был введен Б. Ф. Скиннером, хотя процедуру oпeрантного обусловливания использовали веками для дрессировки животных. У Скиннера также был предшественник, который вплотную приблизился к описанию этой формы научения.

На рубеже XIX и XX вв. американский исследователь Э. Торндайк пытался выяснить, существует ли у животных разум, или интеллект. Для этого он построил «проблемный ящик» (рис. 6-2), в который помещал голодных котов. Вне клетки находилась пища, как правило, рыба. Животное могло открыть дверку ящика только в том случае, если оно нажало на педаль внутри ящика или потянуло за рычаг. Но коты вначале пытались достать приманку, просовывая лапы сквозь решетку клетки. После серии неудач они обычно обследовали все внутри, производили разнообразные действия. В конце концов животное наступало на рычаг, и дверка от­крывалась. В результате многочисленных повторных процедур животные постепенно переставали совершать лишние действия и сразу нажимали на педаль.

Торндайк назвал это научением путем проб и ошибок, поскольку перед тем как животное научается совершать нужный акт, оно реализует множество ошибочных. Такое научение можно представить графически. На рис. 6-3 изображен график, или кривая научения, где по линии абсцисс отложено количество процедур, а по линии ординат — время, за которое животное открывает дверку. Но нему можно увидеть, что чем больше раз животное попадало в проблемный ящик, тем быстрее оно оттуда выходило или, другими словами, тем меньше совершалось ошибок перед реализацией нужного действия.

Важно остановиться на одном моменте, который был отмечен американским исследователем и возведен в ранг закона. Он обнаружил, что те действия, которые поощряются, т. е. подкрепляются, с большей вероятностью возникали в последующих пробах, а те, которые не подкреплялись, не использовались животным в последующих пробах. Другими словами, животное научалось совершать только те действия, за которыми следовало подкрепление — это и есть закон эффекта.

Каковы же были выводы Торндайка по поводу разумного поведения животных? Исследователь отрицал наличие у них каких-либо признаков интеллекта, так как научение происходит путем «слепых» проб и ошибок, а механизм научения заключается в установлении связей между стимулами и реакциями. Не вдаваясь в теоретические подробности, отметим только, что уже упоминавшееся направление — бихевиоризм — стало формироваться после публикации работ Торндайка.

Самый радикальный представитель бихевиоризма, Б. Ф. Скиннер, полагал, что оперантное поведение спонтанно и возникает без каких-либо очевидных стимулов, а реактивное поведение является следствием какого-то стимула. Оперантное поведение можно модифицировать путем подкрепления. По сути, поведение можно контролировать и им можно управлять, создав соответствующий порядок подкрепления. Скиннер много экспериментировал, в основном с крысами и голубями, и утверждал, что закономерности научения одинаковы как для животных, так и для человека.

Разберем типичный эксперимент Скиннера. Голодного голубя сажают в так называемый «ящик Скиннера» (рис. 6-4). Внутри ящика нет ничего, кроме кнопки и находящейся под ней кормушки. Голодная птица, попав в клетку, начинает все обследовать, рассматривать и в результате ударяет клювом по кнопке. Опять повторяется поиск: голубь клюет пол или кормушку, в итоге опять клюет кнопку. Так животное в течение некоторого времени несколько раз клюет кнопку. Количество клеваний по кнопке, скажем, за полчаса, условно принимают за исходный оперантный уровень. Далее включают кормушку, и теперь голубь после каждого удара по кнопке получает зернышко. Через некоторое время птица научается клевать кнопку, так как это действие подкрепляется. Чем больше она клюет кнопку, тем больше она получает пищи. Если голубь будет клевать кнопку с высокой частотой, то это действие характеризуется высоким оперант ным уровнем, если будет клевать ее редко, то действие будет иметь низкий оперантный уровень.

Оперантный уровень, таким образом, показывает уровень обученности подкрепляемому акту. Но что будет, если перестать подавать подкрепление? Как и в классическом обуславливании, произойдет угасание оперантного поведения. Приведем пример. Маленький мальчик проявлял истерические формы поведения, если родители не уделяли ему нужного внимания, особенно перед сном. Так как родителей такое поведение сильно тревожило, они все время успокаивали его и этим подкрепляли дальнейшее появление истерики. Им посоветовали перестать обращать внимание на ребенка, как бы сильно ни плакал. Отмена подкрепления в форме внимания должна была привести к угнетению, т. е. к исчезновению всех истерических проявлений, что и произошло. Плач мальчика исчез уже через одну неделю.

Процедуру оперантного обусловливания применяют для научения животных сложным формам поведения, которые не возникли бы в естественных условиях. Например, медведя можно научить водить мопед, а дельфина — прыгать через горящий круг. Поведение такой сложности можно выработать у животных, применяя процедуру формирования поведения. Для примера приведем ситуацию научения кролика потягиванию кольца.

В небольшой клетке в одном углу находится автоматическая кормушка, напротив, в другом углу, — кольцо. Голодный кролик, попав в клетку, в первые минуты все обнюхивает, становится на задние лапы и выглядывает из клетки. Экспериментатор начинает подавать кормушку с пищей. Кормушка работает с шумом, поэтому животное не сразу залезает в нее. После того как кролик привык к шуму, он уже связывает его с появлением пищи и смело залезает в кормушку за ней. Через некоторое время перестают подавать пищу, после чего кролик вновь начинает осуществлять поисковое поведение. Когда животное поворачивает в сторону кольца, снова подают кормушку с пищей. После множества реализаций поворота кролику начинают давать пищу только в том случае, если он подходит к кольцу. Когда подход к кольцу сформирован, опять перестают подавать пищу. Животное начинает поисковое поведение, повторяет все формы выученных ранее актов, начинает грызть кольцо и тянет его. Срабатывает кормушка. Через некоторое время животное уже научается потягиванию за кольцо.

В оперантном научении особую роль занимает подкрепление. Подкреплением называется любой предмет или событие, которое значимо для организма и ради достижения которого им совершается поведение. Выделяют положительное подкрепление и отрицательное подкрепление. В качестве положительного подкрепления всегда выступают биологически необходимые для организма объекты, например пища, вода, половой партнер и т. д. У людей к биологически необходимым объектам добавляются продукты культуры или культурные ценности. Отрицательное подкрепление опасно для жизни, поэтому организм пытается избежать его или предотвратить его действие. В качестве отрицательного подкрепления исследователи часто используют электрический ток или громкий звук, а процедуру научения в таких случаях принято называть аверзивным обусловливанием (от англ. aversive— отвращающий).

· Подкрепление — предмет или событие, которое значимо для организма.

Теперь нам становится понятно, почему Скиннер полагал, что поведением можно манипулировать через подкрепление. Но на самом деле все оказалось гораздо сложнее. Мак-Фарленд сообщает, что некоторые исследователи пытались научить цыплят стоять спокойно на ровной площадке, чтобы получить вознаграждение, но те все время скребли пол. Другие пытались научить свинью вкладывать в копилку особую монету. Но свинья ни за какое подкрепление не хотела научиться этому, она многократно роняла на пол монету и поднимала опять. Проводили также исследования с голубями, в ходе которых их обучали клевать кнопку либо взмахивать крыльями. Оказалось, что птицы быстрее научались клевать кнопку, если в качестве подкрепления выступала пища (положительное подкрепление), а взмахивать крыльями — если этим поведением они избегали удара электрического тока (негативное подкрепление). С точки зрения Скиннера, голуби должны были научиться клевать кнопку или встряхивать крыльями независимо от рода подкрепления.

Такой парадокс объяснили этологи — исследователи поведения животных в естественных условиях. У голубей акт клевания является частью пищевого поведения, поэтому голубь быстрее научается клевать кнопку, если за этим следует подкрепление в виде пищи. А взмахивание крыльями является частью избегательного поведения, так как птицы совершают этот акт перед тем как взлететь. Ограничения такого рода показывают, что научение связано с имеющимся опытом животного, а также с врожденными формами поведения.

 

Американский психолог А. Бандура утверждает, что люди по большей части учатся не путем проб и ошибок, а посредством наблюдения. Это уникальное свойство людей позволяет им достигать великих высот, не рискуя при этом своей жизнью. Довольно сложно разграничить имитацию и научение путем наблюдения, так как сам Бандура полагает, что имитация является частью последнего. Одной из отличительных особенностей имитации является неосознанность. Научение путем наблюдения по большей части протекает осознанно.

Бандура выделяет четыре основных процесса в научении путем наблюдения. Первый — процесс внимания. На этой стадии человек должен обратить внимание на поведение «модели» и правильно его понять. Наблюдая за «моделью», человек запоминает ее поведение в виде информации, которая представлена в репрезентациях. Это — процесс сохранения. Репрезентации бывают невербальными и вербальными: одни возникают путем образного, а другие — путем вербального кодирования. На третьем этапе (моторно-репродуктивного процесса) происходит перевод символически закодированной информации в действия. Последний этап сильно зависит от мотивационных процессов, т. е. от разных переменных подкрепления. Приведем пример из школьной жизни. Дети наблюдают, как учитель рисует тригонометрические фигуры (первый этап). Моделью в данном случае является учитель. Дети запоминают все движения учителя при рисовании на доске фигур (второй этап). Дома каждый ребенок может попробовать нарисовать запомнившиеся ему фигуры (третий этап). Но одни дети сделают это, потому что боятся не выполнить задание учителя, другие — потому что любят рисовать, и т. д. (четвертый этап).

Концепция Бандуры, по сути, объясняет научение, в ходе которого усваивается социальный и культурный опыт.

Рассмотрев разные формы научения, в заключение нам хотелось бы остановиться на метафоре, которая предложена для эволюции организмов, но применима и к научению. Д. Деннет, автор метафоры, назвал ее «генерирующей и тестирующей вышкой». Она очень упрощена, в этом сознается и сам Деннет. «Вышка» обозначает эволюционный процесс, а «генерирующая» и «тестирующая» — функции, за счет которых обеспечивается протекание этого процесса. Вышка имеет несколько этажей.

По мнению Деннета, вначале была дарвиновская эволюция видов. Протекала она за счет естественного отбора. Возникало множество простейших организмов путем рекомбинаций и мутаций генов. Такие организмы имели фиксированную форму по­ведения. Они проходили испытания в среде, и только самые лучшие из них выжили и размножились. Это и есть первый этаж вышки, а живущие на ней существа называются «дарвиновскими существами» (рис. 6-6). Автор пишет, что такой процесс прошел многие миллионы циклов, пока среди существ не возникли такие, которые обладали фенотипической гибкостью. Это означает, что помимо врожденных качеств и фиксированных форм поведения новые существа могли изменяться и приобретать новые качества и новый опыт в процессе повторяющихся взаимоотношений со средой. Модификации происходили в организмах, главным образом, по ходу приспособления к разным событиям, которые происходили в окружающей среде. Многие из этих существ погибали, так как не могли реализовать свое поведение в изменившейся среде, но многие выживали, так как имели целый набор актов. Существа генерировали разные акты и далее пробовали применить их по одному. Это происходило до те пор, пока не обнаруживался наиболее подходящий акт.

Но каким образом эти существа узнавали про то, подходит ли выбранный акт. Путем положительной либо отрицательной обратной связи, которую организм получал от внешней среды. И эта обратная связь увеличивала либо уменьшала вероятность использования акта в следующий раз (закон эффекта). Можно догадаться, что здесь идет речь об оперантном обусловливании. Очевидно, что такие существа умели оценивать исходящие из среды положительные или отрицательные события, или подкрепления. Деннет называет эти организмы «скиннеровскими существами» (рис. 6-7), так как «Скиннер показал, что такая форма ;оперантного обусловливания; является не только аналогией естественного отбора по Дарвину, но и расширением после него» (Dennett D. С., 1996). Эти существа живут на втором этаже вышки.

Мы с вами видели, что множество животных научается с одного раза, не проходит через сложный путь научения путем проб и ошибок. Для чего возникла такая форма приспособления? Деннет пишет по этому поводу, что «;скиннеровское обусловливание; — хорошая штука, если не предположить, что организм не будет убит в сам начале, в результате своей какой-то фатальной ошибки» (Dennett D. С., 1996). Поэтому более эффективным способом выживания является предварительная селекция возможных форм поведения, или актов. Делается такая селекция для того, чтобы «очевидно видно глупые шаги» заранее были отброшены, перед тем как их реализовать в cреде обитания. Животные третьего этажа, «попперовские существа», совершают так предварительную селекцию. Деннет называет эти существа попперовскими, так как К. Поппер отмечал, что такое строение организма позволяет, «чтобы вместо нас самих погибали наши гипотезы» (Popper К. R., 1995).

Каким образом «попперовские существа» совершают предварительную селекцию? Откуда должна приходить обратная связь? Для этого должен быть внутренний фильтр, состоящий из модели (а не точной копии) внешней среды. Эта модель среды содержит максимальное количество информации о наружной среде. Организм с помощью внутреннего проигрывания актов отбирает те из них, которые подкрепляются моделью среды, аналогично тому, как это происходило бы во внешней среде (рис. 6-8). Конечно, и здесь могут возникать ошибки, особенно если организм попадает в какую-то экстраординарную ситуацию, но их становится гораздо меньше! У нас может возникнуть вопрос: а каких животных на самом деле можно считать попперовскими? Деннет полагает, что таковыми являются большинство животных, начиная с самых простых и кончая человеком.

 

cyberpedia.su

Оперантное обусловливание — Википедия

Материал из Википедии — свободной энциклопедии

Текущая версия страницы пока не проверялась опытными участниками и может значительно отличаться от версии, проверенной 17 ноября 2019;
проверки требует 1 правка.
Текущая версия страницы пока не проверялась опытными участниками и может значительно отличаться от версии, проверенной 17 ноября 2019;
проверки требует 1 правка.

Оперантное обусловливание — поведенческий процесс, при котором поведенческая реакция приводит к субъективно желательному для особи последствию, называемому подкреплением, в результате реакция в дальнейшем происходит чаще. Этот процесс имеет схожие черты с дарвиновским естественным отбором в том смысле, что поведение отбирается по его последствиям в течение жизни особи подобно тому, как виды отбраковываются по последствиям выживания в процессе эволюции. Понятие оперантного обусловливания введено Б. Ф. Скиннером.

Оперантное научение основывается на оперантном поведении — поведении, воздействующем на окружение, которым управляют непосредственные последствия этого поведения, в противоположность ответному (респондентному) поведению, которым управляет предшествующий стимул[1]. Б. Ф. Скиннер сформулировал концепцию оперантного обусловливания после многолетних экспериментов на животных, проведённых им в университете Гарварда.

Оперантное обусловливание Угасание
Подкрепление
Усиливает поведение
Наказание
Ослабляет поведение
Положительное подкрепление
Сделать приятный стимул
вслед за правильным поведением
Отрицательное подкрепление Положительное наказание
Сделать неприятный стимул
после поведения
Отрицательное наказание
Удалить приятный стимул
в ответ на поведение
Устранение
Удалить неприятный стимул
вслед за правильным поведением
Активное уклонение
Поведение уклоняется от неприятного стимула

Множество действий, определяющихся по последствиям (постцедентными воздействиями), называется оперантом. Операнты определяются функционально, то есть по тем изменениям, которые вызывает поведение человека в его непосредственном окружении. Связи между оперантным поведением и событиями, происходящими вокруг него, называются контингенциями[2]. Наиболее распространённой схемой для оперантного анализа является трёхчастная контингенция, состоящая из связи между[1]:

Предшествующим событием, или обстановкой, в которой произошло поведение → Поведением → Последствиями

Термин условие указывает на сочетания, возникновение которых вероятно, но не неизбежно. В исследованиях поведения влияние некоторого условия на поведение необходимо доказывать.

Теоретические постулаты оперантного бихевиоризма применяются на практике в некоторых вариантах программированного обучения, поведенческой терапии[3], прикладного анализа поведения[1].

  1. 1 2 3 Варгас Дж. Анализ деятельности учащихся. Методология повышения школьной успеваемости. — М.: Оперант, 2015.
  2. Варгас Э. А. «Вербальное поведение» Б. Ф. Скиннера: Введение // Вестник Новосибирского государственного университета. Серия: Психология. — 2010. — Т. 4, № 2. — С. 56–78.
  3. ↑ Скиннер Беррес Фредерик / Зинченко В. П., Мещеряков Б. Г. Большой психологический словарь. — М.: ОЛМА-ПРЕСС, 2003.

ru.wikipedia.org

Оперантное обусловливание — Психологос

Оперантное обусловливание — форма научения, сама по себе имеющая разные формы. В оперантном обусловливании подкрепляется то спонтанное поведение, которое признается желательным.

Автор понятия и основной разработчик темы — Беррес Фредерик Скиннер.

Обусловливать (в соответствии с нормами русского языка допускаются обе формы — и обуслОвливать, и обуслАвливать) — подкреплять поведение теми или иными УСЛОВИЯМИ окружения.

Типа «это не я тебя награждаю или наказываю, а жизнь такая».

«Оперантное» — от слова «операция» (имеющее последствие воздействие на среду). В этом методе подкрепляют не реакции, а акции, свободные и спонтанные действия, где есть авторство.

Виды оперантного обусловливания

Оперантное обусловливание имеет две основные формы: инструментальное научение и творческое научение.

В инструментальном научении подкрепляется просто случайное поведение, нужное нам или находящееся на пути к нужному нам. Подкрепление производится в простейшей форме, методом наград и наказаний (вариант — методом элементарного положительного и отрицательного подкрепления), и научение происходит за счет примитивных форм нервной деятельности, без включения разума. См.→

В творческом научении подкрепляется в первую очередь включение разума, поисковой творческой активности в нужном направлении, для чего используются сложные и творческие методы подкрепления, существенно отличающиеся от простого метода наград и наказаний. См.→

Приучение

Оперантное обусловливание — основа приучения, которое происходит через повторение с позитивным подкреплением. Чтобы приучать к чему-либо более эффективно, полезно знать следующие правила: образец или четкая инструкция, смысл или неотвратимость, легкое начало, позитивный фон, экологичная система подкреплений, методичность↑.

www.psychologos.ru

Сравните классическое и оперантное обусловливание. Основные термины

Классическое обусловливание — форма научения, исследованная И.П. Павловым — . Характеризуется тем, что вместе со стимулом, закономерно вызывающим определенную реакцию, подается нейтральный стимул. В дальнейшем этот стимул приобретает значение условного раздражителя, автоматически запускающего ту же реакцию. Синоним — Classical conditioning.

Оперантное обусловливание — форма научения — . Характеризуется тем, что подкрепляется то спонтанное поведение, которое признается желательным. Синоним — инструментальное научение, operant conditioning.

        Теория инструментального, или О. о. связана с именами Торндайка (Thorndike E. L.) и Скиннера (Skinner В. F.). В отличие от принципа классического обусловливания (S->R), они разработали принцип О. о. (R->S), согласно которому поведение контролируется его результатами и последствиями. Основной путь воздействия на поведение, исходя из этой формулы, — влияние на его результаты.

        Для различения стимула классического условного рефлекса и стимула инструментального условного рефлекса Скиннер предложил обозначать первый как Sd (дискриминантный стимул), а второй — Sr (pecпондентный стимул). Sd — стимул, по времени предшествующий определенной поведенческой реакции, Sr — стимул, подкрепляющий определенную поведенческую реакцию и по времени следующий за ней. Хотя в повседневной жизни эти стимулы часто совмещены в одном объекте, они могут быть разделены путем анализа с целью систематизации и определения последовательности мер воздействия на модифицируемое поведение. При использовании оперантных методов управление результатами поведения осуществляется для воздействия на само поведение. Поэтому здесь очень важен этап функционального анализа или поведенческой диагностики. Задача этого этапа состоит в определении подкрепляющей значимости окружающих пациента объектов, установлении иерархии их подкрепляющей силы. Это делается путем прямого наблюдения за поведением человека и установления связи между частотой и интенсивностью проявляемого поведения (зависимая переменная) и имеющимися в это время объектами и событиями, происходящими в окружении (независимая переменная).
        Оперантные методы могут быть использованы для решения ряда задач.
        1. Формирование нового стереотипа поведения, которого до этого не было в репертуаре поведенческих реакций человека (например, кооперативное поведение ребенка, поведение самоутверждающего типа у пассивного ребенка и т. д.). Для решения этой задачи может быть использовано несколько стратегий выработки нового поведения.
        Под шейпингом понимается поэтапное моделирование сложного поведения, которое не было свойственно ранее индивиду. В цепи последовательных воздействий важным является первый элемент, который, хотя и отдаленно, связан с конечной целью шейпинга, однако с большой степенью вероятности направляет поведение в нужное русло. Этот первый элемент должен быть точно дифференцирован, а критерии оценки его достижения четко определены. Для облегчения проявления первого элемента желательного стереотипа должно быть выбрано условие, которое может быть достигнуто быстрее и легче всего. Для этого используется разнообразное варьирующее подкрепление, от материальных предметов до социального подкрепления (одобрение, похвала и др.). Например, при обучении ребенка навыкам самостоятельного одевания первым элементом может быть привлечение его внимания к одежде.

        В случае «сцепления» используется представление о поведенческом стереотипе как о цепи отдельных поведенческих актов, при этом конечный результат каждого акта является дискриминантным стимулом, запускающим новый поведенческий акт. При реализации стратегии сцепления следует начинать с формирования и закрепления последнего поведенческого акта, находящегося ближе всего к самому концу цепи, к цели. Рассмотрение сложного поведения как цепи последовательных поведенческих актов позволяет понять, какая часть цепи хорошо сформирована, а какая должна быть создана с помощью шейпинга. Тренинг должен продолжаться до того момента, пока желательное поведение всей цепи не осуществляется с помощью обычных подкрепляющих стимулов.

        Фейдинг
— это постепенное уменьшение величины подкрепляющих стимулов. При достаточно прочно сформированном стереотипе пациент должен реагировать на минимальное подкрепление прежним образом. Фейдинг играет важную роль при переходе от тренировок с психотерапевтом к тренировкам в повседневном окружении, когда подкрепляющие стимулы исходят от других людей, замещающих психотерапевта.

        Побуждение является вариантом вербального или невербального подкрепления, который повышает у обучающегося уровень внимания и фокусировки на желательном стереотипе поведения. Подкрепление может выражаться в демонстрации этого поведения, прямых инструкциях, центрированных или на нужных действиях, или на объекте действия и т. д.

        2.
Закрепление уже имеющегося в репертуаре индивида желательного стереотипа поведения. Для решения этой задачи может использоваться положительное подкрепление, отрицательное подкрепление, контроль стимула.

        3.
Уменьшение или угашение нежелательного стереотипа поведения. Достигается с помощью методик наказания, угашения, насыщения.

        4.
Лишение всех положительных подкреплений.

        5.
Оценка ответа.


agespsyh.ru

ОПЕРАНТНОЕ ОБУСЛОВЛИВАНИЕ — это… Что такое ОПЕРАНТНОЕ ОБУСЛОВЛИВАНИЕ?



ОПЕРАНТНОЕ ОБУСЛОВЛИВАНИЕ
        Теория инструментального, или О. о. связана с именами Торндайка (Thorndike E. L.) и Скиннера (Skinner В. F.). В отличие от принципа классического обусловливания (S->R), они разработали принцип О. о. (R->S), согласно которому поведение контролируется его результатами и последствиями. Основной путь воздействия на поведение, исходя из этой формулы, — влияние на его результаты.
        Для различения стимула классического условного рефлекса и стимула инструментального условного рефлекса Скиннер предложил обозначать первый как Sd (дискриминантный стимул), а второй — Sr (pecпондентный стимул). Sd — стимул, по времени предшествующий определенной поведенческой реакции, Sr — стимул, подкрепляющий определенную поведенческую реакцию и по времени следующий за ней. Хотя в повседневной жизни эти стимулы часто совмещены в одном объекте, они могут быть разделены путем анализа с целью систематизации и определения последовательности мер воздействия на модифицируемое поведение. При использовании оперантных методов управление результатами поведения осуществляется для воздействия на само поведение. Поэтому здесь очень важен этап функционального анализа или поведенческой диагностики. Задача этого этапа состоит в определении подкрепляющей значимости окружающих пациента объектов, установлении иерархии их подкрепляющей силы. Это делается путем прямого наблюдения за поведением человека и установления связи между частотой и интенсивностью проявляемого поведения (зависимая переменная) и имеющимися в это время объектами и событиями, происходящими в окружении (независимая переменная).
        Оперантные методы могут быть использованы для решения ряда задач.
        1. Формирование нового стереотипа поведения, которого до этого не было в репертуаре поведенческих реакций человека (например, кооперативное поведение ребенка, поведение самоутверждающего типа у пассивного ребенка и т. д.). Для решения этой задачи может быть использовано несколько стратегий выработки нового поведения.
        Под шейпингом понимается поэтапное моделирование сложного поведения, которое не было свойственно ранее индивиду.


В цепи последовательных воздействий важным является первый элемент, который, хотя и отдаленно, связан с конечной целью шейпинга, однако с большой степенью вероятности направляет поведение в нужное русло. Этот первый элемент должен быть точно дифференцирован, а критерии оценки его достижения четко определены. Для облегчения проявления первого элемента желательного стереотипа должно быть выбрано условие, которое может быть достигнуто быстрее и легче всего. Для этого используется разнообразное варьирующее подкрепление, от материальных предметов до социального подкрепления (одобрение, похвала и др.). Например, при обучении ребенка навыкам самостоятельного одевания первым элементом может быть привлечение его внимания к одежде.
        В случае «сцепления» используется представление о поведенческом стереотипе как о цепи отдельных поведенческих актов, при этом конечный результат каждого акта является дискриминантным стимулом, запускающим новый поведенческий акт. При реализации стратегии сцепления следует начинать с формирования и закрепления последнего поведенческого акта, находящегося ближе всего к самому концу цепи, к цели. Рассмотрение сложного поведения как цепи последовательных поведенческих актов позволяет понять, какая часть цепи хорошо сформирована, а какая должна быть создана с помощью шейпинга. Тренинг должен продолжаться до того момента, пока желательное поведение всей цепи не осуществляется с помощью обычных подкрепляющих стимулов.
        Фейдинг — это постепенное уменьшение величины подкрепляющих стимулов. При достаточно прочно сформированном стереотипе пациент должен реагировать на минимальное подкрепление прежним образом. Фейдинг играет важную роль при переходе от тренировок с психотерапевтом к тренировкам в повседневном окружении, когда подкрепляющие стимулы исходят от других людей, замещающих психотерапевта.
        Побуждение является вариантом вербального или невербального подкрепления, который повышает у обучающегося уровень внимания и фокусировки на желательном стереотипе поведения. Подкрепление может выражаться в демонстрации этого поведения, прямых инструкциях, центрированных или на нужных действиях, или на объекте действия и т. д.
        2. Закрепление уже имеющегося в репертуаре индивида желательного стереотипа поведения. Для решения этой задачи может использоваться положительное подкрепление, отрицательное подкрепление, контроль стимула.
        3. Уменьшение или угашение нежелательного стереотипа поведения. Достигается с помощью методик наказания, угашения, насыщения.
        4. Лишение всех положительных подкреплений.
        5. Оценка ответа.
        См. также БИХЕВИОРИЗМ, ПОВЕДЕНЧЕСКАЯ ПСИХОТЕРАПИЯ, ПОЛОЖИТЕЛЬНОЕ И ОТРИЦАТЕЛЬНОЕ ПОДКРЕПЛЕНИЕ.

Психотерапевтическая энциклопедия. — С.-Пб.: Питер.
Б. Д. Карвасарский.
2000.

  • ОНТОПСИХОЛОГИЯ
  • ОРГАНИЗАЦИЯ ПСИХОТЕРАПЕВТИЧЕСКОЙ ПОМОЩИ

Смотреть что такое «ОПЕРАНТНОЕ ОБУСЛОВЛИВАНИЕ» в других словарях:

  • оперантное обусловливание — термин, введенный американским психологом Б. Ф. Скиннером для обозначения особого пути образования условных связей (см. условный рефлекс). В отличие от классического (павловского) пути, названного Скиннером респондентным, при О. о. животное… …   Большая психологическая энциклопедия

  • Оперантное Обусловливание — форма научения . Характеризуется тем, что подкрепляется то спонтанное поведение, которое признается желательным. Синоним инструментальное научение, operant conditioning …   Психологический словарь

  • ОПЕРАНТНОЕ ОБУСЛОВЛИВАНИЕ — Вид обусловливания, при котором оперантная реакция помещается под контроль стимула. Операцией, с помощью которой происходит такое обусловливание, является предъявление подкрепления непосредственно после реакции организма. Этот операциональный… …   Толковый словарь по психологии

  • Оперантное обусловливание — – стратегии научения, при которых человек или животное должны реагировать на раздражитель, чтобы получить подкрепление. Подкрепление повышает вероятность того, что данный вид поведения повторится. Оперантное обусловливание ведет свое начало от… …   Словарь-справочник по социальной работе

  • Оперантное обусловливание — обозначение особого пути образования условных связей). В отличие от классического (павловского) пути, названного Скиннером респондентным, при О. о. животное сначала производит какое нибудь движение (спонтанное или инициированное… …   Энциклопедический словарь по психологии и педагогике

  • Оперантное обусловливание — (operant conditioning) процесс научения, при котором поведение, приносящее удовлетворительные последствия или вознаграждения, будет, скорее всего, повторено …   Общая психология: глоссарий

  • Оперантное обусловливание — (operant conditioning). ТТип обусловливания, которое имеет место, когда организм получает подкрепление (вознаграждение или наказание) за произвольно получаемую реакцию. В этом случае происходит научение только тому, что подкрепляется …   Психология развития. Словарь по книге

  • Оперантное обусловливание (operant conditioning) — Термин О. о. применительно к научению используется в двух значениях. В более узком смысле с ним связывается набор процедур, использующихся при изучении процессов инструментального обусловливания. В более широком и более фундаментальном смысле… …   Психологическая энциклопедия

  • РАЗЛИЧИТЕЛЬНОЕ ОПЕРАНТНОЕ ОБУСЛОВЛИВАНИЕ — См. различение (1) …   Толковый словарь по психологии

  • ОБУСЛОВЛИВАНИЕ — Общий термин для группы эмпирических понятий особенно тех. которые означают условия, при которых происходит ассоциативное научение. Часто в этой группе выделяются два отдельных тита: классическое обусловливание (или тип S. или реактивный, или… …   Толковый словарь по психологии

dic.academic.ru

Оперантное обусловливание

Теория инструментального, или оперантного обусловливания связана с именами Э. Л. Торндайка (Е. L. Thorndike) и Б. Ф. Скиннера (В. Е Skinner). Скиннер и Торндайк — виднейшие представители бихевиоризма — показали, что воздействие окружающей среды определяет поведение человека. Они рассматривают в качестве главного фактора формирования человеческого поведения культуру, содержание которой выражается в определенном наборе комплексов подкреплений. С их помощью можно создавать и модифицировать человеческое поведение в нужном направлении. На таком понимании основаны методы модификации поведения, использующиеся не только в психотерапевтической практике, но и, например, при воспитательных воздействиях.

Термины «инструментальное научение» и «оперантное обусловливание» означают, что реакция организма, которая формируется по методу проб и ошибок, является инструментом для получения поощрения и предполагает оперирование средой, то есть поведение есть функция его последствий.

Согласно принципу оперантного обусловливания, поведение контролируется его результатом и последствиями. Модификация поведения осуществляется за счет влияния на его результаты и последствия. В соответствии со схемой оперантного обусловливания экспериментатор, наблюдая поведение, фиксирует случайные проявления желательной, «правильной», реакции и сразу же подкрепляет ее. Таким образом, стимул следует после поведенческой реакции, используется прямое подкрепление через поощрение и наказание. Результатом подобного научения является оперантное научение, или оперант. В этом случае подкрепляется не стимул, а реакция организма, именно она вызывает подкрепляющий стимул, поэтому такое научение обозначается как научение типа R. Оперантное, или инструментальное, поведение (поведение типа R) — это поведение, вызванное подкреплением, следующим за поведением. Скиннер, подчеркивая различия между респондентным и оперантным поведением, указывает, что респондентное поведение вызвано стимулом, предшествующим поведению, а оперантное поведение — стимулом, следующим за поведением. Иными словами, в классическом обусловливании стимул предшествует поведенческой реакции, а в оперантном — следует за ней.

Необходимо обратить внимание на соотношение таких понятий, как позитивное и негативное подкрепление и наказание, различать наказание и негативное подкрепление. Позитивное или негативное подкрепление усиливает поведение, наказание — ослабляет. Позитивное подкрепление основано на предъявлении стимулов (наград), которые усиливают поведенческую реакцию. Негативное подкрепление заключается в усилении поведения за счет удаления негативных стимулов. То есть всякое подкрепление (и позитивное, и негативное) усиливает частоту реакции и поведение, наказание же, напротив, уменьшает частоту реакции, ослабляет поведение. (Например, позитивное подкрепление: животное находит выход из лабиринта и получает пищу; негативное подкрепление: животное находит выход из лабиринта, где действует электрический ток, и ток выключают; наказание: животное в лабиринте упирается в тупик, и ток включают. Таким образом, первые два вида воздействия экспериментатора усиливают реакцию, поскольку являются подкреплением, а третий — уменьшает, являясь наказанием.)

Для различения стимула классического условного рефлекса и стимула оперантного условного рефлекса Скиннер предложил обозначать первый как Sd (дискриминантный стимул), а второй — как Sr (респондентный стимул). Дискриминантный стимул по времени предшествует определенной поведенческой реакции, респондентами стимул, подкрепляющий определенную поведенческую реакцию, следует за ней.

Итак, сравнительные характеристики классического и оперантного обусловливания:
Классическое обусловливание S—R. Научение типа S. Классическая парадигма Павлова. Реакция возникает только в ответ на воздействие какого-либо стимула. Стимул предшествует реакции. Подкрепление связано со стимулом. Респондентное поведение — поведение, вызванное определенным стимулом, ему предшествующим.

Оперантное обусловливание R—S. Научение типа R. Оперантная парадигма Скиннера. Желательная реакция может появиться спонтанно. Стимул следует за поведенческой реакцией. Подкрепление связано с реакцией. Оперантное поведение — поведение, вызванное подкреплением, за ним следующим.

psyera.ru

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *