Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Подкрепление в теории оператного обуславливания. Виды подкрепления и режим подкрепления



Под подкреплением понимается какое–либо действие, призванное усилить определенную реакцию. Хотя оперантное обусловливание опирается в первую очередь на использование подкрепления с положительной валентностью, основанных на приближении организма к, такого, как пища, деньги или похвала, последователи Скиннера подчеркивают также важность подкреплений, основанных на бегстве организма от, или на избегании им отвращающих (неприятных) стимулов. В таких случаях реакции подкрепляются устранением неприятных стимулов или возможностью их избежать, а не появлением приятных стимулов. Во всех этих случаях результатом должно быть сохранение или усиление реакции. В связи с этим различают два вида подкреплений:

Позитивное подкрепление – это приятный стимул, который следуя за желательной реакцией, усиливает ее или поддерживает на том же уровне, т.е. повышает вероятность ее повторения.

Негативное подкрепление – это неприятный стимул, устранение которого усиливает желательную реакцию.

Вместе с тем существует и множество самих способов подкрепления. К наиболее распространенным относятся поощрение (предъявление приятных стимулов) и наказание (предъявление неприятных стимулов).

в практике воспитания чаще всего используются четыре разновидности подкрепления:

1) если вслед за желательной реакцией ребенка следует вызывающее приятные ощущения и переживания подкрепляющий стимул, то результат – положительное поощрение;

2) если за нежелательной реакцией следует не вызывающий приятные ощущения и переживания подкрепляющий стимул, то результат – положительное наказание;

3) если вызывающий неприятные ощущения и переживания подкрепляющий стимул устраняется после получения желательной реакции, то результат– отрицательное поощрение;

4) если приятный стимул устраняется после той или иной нежелательной реакции ребенка, то результат– отрицательное наказание.

Скорость, с которой оперантное поведение приобретается и сохраняется, зависит от режима применяемого подкрепления. Режим подкрепления — правило, устанавливающее вероятность, с которой подкрепление будет происходить. Режим подкрепления можно построить, задавая определенный временной интервал или определенный интервал реакций.

Возможны многие различные режимы подкрепления, их все можно классифицировать в соответствии с двумя основными параметрами: 1) подкрепление может иметь место только после того, как истек определенный или случайный временной интервал с момента предыдущего подкрепления (так называемый режим временного подкрепления), 2) подкрепление может иметь место только после того, как с момента подкрепления было получено определенное или случайное количество реакций (режим пропорционального подкрепления).В соответствии с этими двумя параметрами выделяют четыре основных режима подкрепления.

1. Режим подкрепления с постоянным соотношением (ПС). В данном режиме организм подкрепляется по наличию заранее определенного или «постоянного» числа соответствующих реакций. Этот режим является всеобщим в повседневной жизни и ему принадлежит значительная роль в контроле над поведением. Во многих сферах занятости сотрудникам платят отчасти или даже исключительно в соответствии с количеством единиц, которые они производят или продают. В промышленности эта система известна как плата за единицу продукции. Режим ПС обычно устанавливает чрезвычайно высокий оперантный уровень, так как чем чаще организм реагирует, тем большее подкрепление он получает.

2. Режим подкрепления с постоянным интервалом (ПИ). В режиме подкрепления с постоянным интервалом организм подкрепляется после того, как твердо установленный или «постоянный» временной интервал проходит с момента предыдущего подкрепления. На уровне человека режим ПИ действителен при выплате зарплаты за работу, выполненную за час, неделю или месяц. Подобно этому, еженедельная выдача денег ребенку на карманные расходы образует ПИ форму подкрепления. Университеты обычно работают в соответствии с временным режимом ПИ. Экзамены устанавливаются на регулярной основе и отчеты об академической успеваемости издаются в установленные сроки. Любопытно, что режим ПИ дает низкую скорость реагирования сразу после того, как получено подкрепление – феномен, названный паузой после подкрепления. Это показательно для студентов, испытывающих трудности при обучении в середине семестра (предполагается, что они сдали экзамен хорошо), так как следующий экзамен будет еще нескоро. Они буквально делают перерыв в обучении.

3. Режим подкрепления с вариативным соотношением (ВС). В этом режиме организм подкрепляется на основе какого-то в среднем предопределенного числа реакций. Возможно, наиболее драматической иллюстрацией поведения человека, находящегося под контролем режима ВС, является захватывающая азартная игра. Рассмотрим действия человека, играющего в игральный автомат, где нужно опускать монетку или специальной рукояткой вытягивать приз. Эти аппараты запрограммированы таким образом, что подкрепление (деньги) распределяется в соответствии с числом попыток, за которые человек платит, чтобы управлять рукояткой. Однако выигрыш непредсказуем, непостоянен и редко позволяет получать свыше того, что вложил игрок. Это объясняет тот факт, почему владельцы казино получают значительно больше подкреплений, чем их постоянные клиенты. Далее, угасание поведения, приобретенного в соответствии с режимом ВС, происходит очень медленно, так как организм точно не знает, когда будет следующее подкрепление. Таким образом, игрок принуждается опускать монеты в прорезь автомата, несмотря на ничтожный выигрыш (или даже проигрыш), в полной уверенности, что в следующий раз он «сорвет куш». Такая настойчивость типична для поведения, вызванного режимом ВС.

4. Режим подкрепления с вариативным интервалом (ВИ). В этом режиме организм получает подкрепление после того, как проходит неопределенный временной интервал. Подобно режиму ПИ, подкрепление при этом условии зависит от времени. Однако время между подкреплениями по режиму ВИ варьирует вокруг какой-то средней величины, а не является точно установленным. Как правило, скорость реагирования при режиме ВИ является прямой функцией примененной длины интервала: короткие интервалы порождают высокую скорость, а длинные интервалы порождают низкую скорость. Также при подкреплении в режиме ВИ организм стремится установить постоянную скорость реагирования, и при отсутствии подкрепления реакции угасают медленно. В конечном итоге, организм не может точно предвидеть, когда будет следующее подкрепление.

10. Анализ работы В. Хьюитта, Дж. Хамелла «Научение через наблюдение».

11. Теоретические и экспериментальные исследования Д. Уотсона. Анализ работы Д. Уотсона «Поведение как предмет психологии».

Д.Уотсон начинал свою научную деятельность в центре функциональной психологии - Чикагском университете, под руководством Д. Энджелла. После защиты докторской диссертации он по приглашению Д. М. Болдуина стал профессором университета Джона Гопкинса в Балтиморе, где заведовал кафедрой и лабораторией экспериментальной психологии. Импульсивный и легко увлекающийся Уотсон стремился дисциплинировать себя. Возможно, этим объясняется и его активная исследовательская деятельность, и его концепция научения, игнорировавшая любые эмоциональные контакты с обучаемым.

В 1913г. вышла его статья «Психология с точки зрения бихевиориста», оцениваемая как манифест нового направления. Вслед за этим появились его книги «Поведение: введение в сравнительную психологию» (1914), «Бихевиоризм» (1925), в которых впервые в истории психологии был решительно опровергнут постулат о том, что предметом этой науки является сознание (его содержание, процессы, функции и т. д.).

Находясь под влиянием философии позитивизма, Уотсон доказывал, будто реально лишь то, что можно непосредственно наблюдать. Он утверждал, что поведение следует объяснять из отношений между непосредственно наблюдаемыми воздействиями физических раздражителей на организм и его также непосредственно наблюдаемых ответов (реакций). Отсюда и главная формула Уотсона, воспринятая бихевиоризмом: «стимул-реакция» (S-R). Из этого вытекало, что процессы между стимулом и реакцией - будь то физиологические (нервные) или психические - психология должна устранить из своих гипотез и объяснений. Поскольку единственно реальными в поведении признавались различные формы телесных реакций, Уотсон заменил все традиционные представления о психических явлениях их двигательными эквивалентами.

Связь психических функций и двигательной активности была в те годы точно установлена экспериментальной психологией. Это касалось, например, зависимости зрительного восприятия от движений глазных мышц, эмоций - от телесных изменений, мышления - от речевого аппарата и т.д. Эти факты Уотсон использовал в качестве доказательства того, что объективные мышечные процессы могут быть достойной заменой субъективных психических актов. Исходя из такой посылки, он объяснял развитие умственной активности. Эксперименты Уотсона, направленные на исследование речи и мышления, доказывали правильность понимания интеллектуальных операций как интериоризованных действий, сформированных путем проб и ошибок, о которых писал Торндайк. Уотсон просил испытуемых произнести какую-то фразу и измерял при этом движения мышц гортани. Эти мышечные движения появлялись на экране осциллографа и записывались самописцами. Затем испытуемых просили подумать эту же фразу про себя, и на экране появлялись те же линии, только с меньшей амплитудой. Таким образом, с точки зрения Уотсона, было доказано, что речь и мышление имеют одинаковую природу и мышление - это та же речевая реакция, сопровождаемая точно такими же мышечными сокращениями, но только меньшей интенсивности.

Это также позволило ему изучить этапы формирования внутренней речи, которая, по его мнению, развивалась из внешней путем редукции (снижения) мышечного напряжения, поэтому этапы ее формирования выглядели следующим образом: внешняя речь -шепот - внутренняя речь. Это исследование привело его к выводу о том, что речь у ребенка возникает из неупорядоченных звуков. Когда взрослые соединяют с каким-нибудь звуком определенный объект, этот объект становится значением слова. Постепенно у ребенка внешняя речь переходит в шепот, а затем он начинает произносить данное слово про себя. Такая внутренняя речь (неслышная вокализация) не что иное, как мышление. Данные Уотсона впоследствии были пересмотрены в работах Пиаже, Выготского, Блонского, выявивших другую, более точную динамику формирования внутренней речи.

Методологи бихевиоризма исходили из положения о прижизненности формирования основных психических процессов. Доказательства этого были даны Уотсоном в его экспериментах по формированию эмоций. Он экспериментально продемонстрировал, что можно сформировать реакцию страха на нейтральный стимул. В его опытах ребенку показывали кролика, которого он брал в руки и хотел погладить, но в этот момент получал разряд электрического тока. Естественно, ребенок испуганно бросал кролика и начинал плакать. Однако в следующий раз он опять подходил к животному и получал удар током. На третий-четвертый раз у большинства детей появление кролика даже в отдалении вызывало страх. После того как эта негативная эмоция закреплялась, Уотсон старался еще раз изменить эмоциональное отношение детей, сформировав интерес и любовь к кролику. В этом случае ребенку начинали показывать его во время вкусной еды. Наличие этого важного первичного раздражителя было непременным условием формирования новой реакции. В первый момент ребенок прекращал есть и начинал плакать, но так как кролик не приближался к нему, оставаясь вдалеке, в конце комнаты, а вкусная еда (например, шоколадка или мороженое) была рядом, ребенок быстро успокаивался и продолжал есть. После того как ребенок переставал реагировать плачем на появление в конце комнаты кролика, экспериментатор постепенно придвигал кролика все ближе и ближе к ребенку, одновременно добавляя вкусных вещей ему на тарелку. Постепенно ребенок переставал обращать на кролика внимание и под конец спокойно реагировал, даже когда он располагался около его тарелки, брал кролика на руки и старался накормить чем-то вкусным. Таким образом, доказывал Уотсон, наши эмоции являются результатом наших привычек и могут кардинально изменяться в зависимости от обстоятельств.

Наблюдения Уотсона показали, что в том случае, если сформированная реакция страха на кролика не переделывалась на положительную, в дальнейшем сходное чувство страха возникало у детей при виде других покрытых мехом объектов. Исходя из этого, он стремился доказать, что у людей на основе условных рефлексов можно формировать по заданной программе стойкие аффективные комплексы. Более того, он считал, что открытые им факты доказывают возможность формирования определенной, строго заданной модели поведения у всех людей. Он писал: «Дайте мне сто детей одного возраста, и через определенное время я сформирую из них абсолютно одинаковых людей, с одинаковыми вкусами и поведением».

Принцип управления поведением получил в американской психологии после работ Уотсона широкую популярность. Его заслугой является и то, что он расширил сферу психического, включив в нее телесные действия животных и человека. Но этого новшества он добился дорогой ценой, отвергнув как предмет науки огромные богатства психики, несводимые к внешне наблюдаемому поведению.





Дата публикования: 2015-02-03; Прочитано: 1210 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2025 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.006 с)...