Позитивное подкрепление (похвала, оценки, награды). Психология мотивации

Существуют альтернативные варианты использования земли . Иначе говоря, землю можно использовать не только для возделывания пшеницы, овса, проса, выращивания скота, но и в качестве участка под дом или завод. О чем говорит этот факт?

С точки зрения общества , нет альтернативы в использовании земли, как только самим обществом. Совокупное предложение земли всегда будет, даже если никакая рента не выплачивается за ее использование, поэтому для общества рента ¾ это излишек, который должен принадлежать всем членам общества. Иначе говоря, с точки зрения общества, земля не имеет издержек производства .

С точки зрения же фирм , земля имеет альтернативные варианты использования, поэтому рентные платежи должны производиться конкретными фирмами, чтобы исключить иное применение земли. Исходя из этого для фирм рентные платежи выступают как издержки. Причем рента взимается с земель, используемых не только для сельского хозяйства, но и для добычи полезных ископаемых, строительства и т. д. Для этих земель также применим механизм действия дифференциальной, абсолютной и монопольной ренты.

Позитивное подкрепление (похвала, оценки, награды)

Что такое позитивное подкрепление?

Позитивное подкрепление и наказание

Виды позитивного подкрепления

Зависимость эффекта подкрепления от интенсивности позитив­ных эмоций (силы удовольствия)

Сочетание подкрепления с быстрой обратной связью и фиксаци­ей результатов деятельности

Сочетание подкрепления с поэтапной программой выполнения серии систематических рабочих шагов

Развитие социально нежелательных привычек и потребностей вследствие позитивного подкрепления

Ослабление интереса (процессуально-содержательной мотива­ции) под влиянием регулярного внешнего подкрепления

1.1. Что такое позитивное подкрепление?

Позитивное подкрепление - это некоторые приятные для человека последствия или результаты деятельности (вознагра­ждение, похвала, успех и др.), которые побуждают его к вы­полнению какой-либо деятельности.

Человек после выполнения определенной деятельности мо­жет получить одобрение, позитивную оценку, материальное вознаграждение, т.е. позитивное подкрепление. Удовольствие вследствие позитивного подкрепления связывается с деятельностью, таким образом устанавливается связь «деятельность - Удовольствие». У человека, согласно принципу удовольствия Фрейда, возникает стремление и в будущем получить удовольствие (похвалу, материальное вознаграждение и т.п.), что побуждает его к выполнению той деятельности, которую подкрепля­ли, т.е. которая связывалась с удовольствием.

Если процесс деятельности или его результат не подкрепля­ется (т.е. когда не было ни одобрения, ни вознаграждения и соответственно удовлетворения), то в таком случае менее веро­ятно, что в будущем человек будет выполнять эту деятельность по собственному желанию. Следовательно, при отсутствии связи «деятельность - удовольствие» субъект не будет стремиться к ее выполнению.

Позитивные переживания, которые связываются с опреде­ленной деятельностью, выполняют роль эмоционального под­крепления того, что происходило до или во время переживания. Вследствие этого человек будет стремиться выполнять то, что вызвало удовольствие или то, что предоставило возможность избежать неудовольствия. Если какое-то действие сочеталось с приятным переживанием, то сочетание позитивных эмоций с деятельностью усиливает мотивацию (интерес) к этой деятель­ности.

Приведем несколько примеров позитивного подкрепления.

1. Вследствие успешных занятий физикой ученик получает одобрения от учителей, родителей и друзей (подкрепление 1), высокие оценки (подкрепление 2), призовые места на олимпиа­дах (подкрепление 3), одобрения друзей за интересные опыты и помощь в решении задач (подкрепление 4). Удовольствие, ко­торое возникает вследствие подкрепления, будет побуждать его к занятиям физикой. Предвкушая получение удовольствия, уче­ник будет усиленно заниматься этим предметом. Физика связы­вается с удовольствием и в будущем сама по себе будет прият­на для ученика. Чем сильнее подкрепление (большее число под­креплений и соответственно большее удовольствие), тем более привлекательной становится физика для ученика.

2. Ребенок за определенные действия (например, за помощь старшим) получает похвалу от взрослых (подкрепление 1), ма­териальное вознаграждение, например конфеты, шоколад (подкрепление 2), определенные поблажки (подкрепление 3). Стремление получить удовольствие (похвалу, конфеты, поблаж­ки и т.п.) будет побуждать ребенка и в будущем к выполнению этих действий.

3. Если изготовив, например, полку или стул, человек почувст­вовал удовольствие вследствие успешного завершения работы и пользы от него (подкрепление 1), материального вознагражде­ния (подкрепление 2), одобрения жены или родителей (подкреп­ление 3), то, предвкушая возможность получить подкрепление (и удовольствие), он и впредь будет стремиться что-либо изго­тавливать.

1.2. Позитивное подкрепление и наказание

Определенные формы поведения закрепляются (и повторя­ются в будущем) тогда, когда они сопровождаются позитивны­ми последствиями (вознаграждением, одобрением, возможно­стью самоутвердиться). И вероятность их повторения, как пра­вило, уменьшается, если эти действия не связаны с приятными эмоциями, или же, наоборот, сопровождаются чем-то негатив­ным (наказанием, неодобрением и т.п.).

Эти закономерности часто используют учителя и родители: регулярно прибегая к похвале, они формируют у детей соответ­ствующую мотивацию и поведение. А чтобы удержать детей от нежелательных действий и поступков, применяют наказание, неодобрение, выражая неудовлетворенность действиями ребен­ка. Если человек получает позитивное подкрепление (одобрение, вознаграждение) за определенные формы поведе­ния, то такие действия закрепляются и в будущем воспроизво­дятся. А прибегая к наказанию, человека заставляют избегать определенных действий: например, наказывая ребенка за кра­жу, стремятся принудить его не воровать в будущем.

Родители, по мнению Скиннера, могли бы целиком полагать­ся на позитивное подкрепление (например, на одобрение), ни­когда не наказывая ребенка. Вследствие использования одоб­рения воспитание ребенка является высокоэффективным и гу­манным. Однако в воспитательном процессе нередко прибегают к наказанию, которое не всегда является эффективным, а часто и вредит воспитанию личности. Подвергаясь наказанию за оп­ределенные действия или бездеятельность, человек впредь бу­дет действовать «так, как нужно» не потому, что ему так хочет­ся, а потому, что боится наказания, И когда угроза наказания исчезает, то предыдущие нежелательные формы поведения восстанавливаются.

Прибегая исключительно к наказанию, по нашему мнению, невозможно сформировать внутренне мотивированную деятель­ность. В случае же использования наказания эффективно сочетать его с позитивным подкреплением. Например, поругав девочку за то, что она не помогла бабушке (наказание), следует также напомнить, что она раньше помогала маме (позитивное подкрепление 1), всегда помогает брату (позитивное подкреп­ление 2). Любые попытки помочь следует эмоционально подкреплять.

1.3. Виды позитивного подкрепления

Чтобы сформировать необходимое поведение, следует вы­делять такие действия ребенка, которые являются социально желательными, и подкреплять их одобрением, вознаграждением и другими видами подкрепления. Можно выделить разнообраз­ные виды позитивного подкрепления.

Похвала (одобрение). Учитель, руководитель, тренер одобряет действия своего подчиненного (ученика) за высокие результаты работы. Позитивное подкрепление (похвала) в из­вестной степени зависит от взаимных отношений руководителя и подчиненного. Похвала старших (руководителей, родителей и др.), с которыми субъект деятельности (подчиненный, ученик) пребывает в хороших отношениях, как правило, имеет большое влияние. Однообразие форм одобрения и слишком регулярное их использование уменьшает действие такого подкрепления.

Привилегии и увеличение статуса. За высокую академиче­скую успеваемость студента могут выбрать старостой группы, спортсмена - капитаном команды, рабочего - бригадиром, инженера - руководителем отдела и т.п. Изменение формаль­ного или неформального статуса имеет эффект подкрепления. Ожидание повышения статуса оказывает большое влияние на личность (стимулирует к деятельности).

Лучшие фирмы умеют использовать этот мотивационный фактор в управлении. Достаточно разветвленная иерархизированная система управления (наличие многих подразделений, групп) оказывает существенное влияние на мотивацию как ру­ководящего состава, так и рядовых работников. У человека есть стимул стать руководителем даже небольшого структурно­го подразделения или группы, а достигая желанного статуса, он пытается подняться еще выше по иерархической лестнице.

Возможность получить определенные привилегии, повыше­ние заработной платы, возможность руководить и тем самым удовлетворять свою потребность во власти - существенный мотивационный фактор. Это побуждает человека добиваться должности, прилагать большие усилия для ее получения. Он стремится подняться выше в иерархии управления. Возмож­ность влиять на людей и быть субъектом изменений («источ­ником»), а не объектом и пассивным исполнителем чужой воли («пешкой») является достаточно привлекательной. Человек стремится сам влиять, определять, решать, а не быть объектом влияния других людей,

Доверие, внимание, оценка твоих способностей, возмож­ность продемонстрировать себя руководителем (лидером) - все это побуждает человека работать еще настойчивее (Уотермен, 1988).

Фирмы в США и Европе практикуют также создание вре­менных формальных и неформальных групп (например, для разработки определенного проекта). Назначается руководитель (лидер) группы, наделенный некоторыми полномочиями. Это имеет большое мотивационное влияние на данного человека, он будет стремиться оправдать доверие и самоутвердиться. Разно­образие форм руководства, иерархизованность и разветвленность управленческих структур - это возможность самоутвер­диться для многих людей.

Оценки, баллы, тестовые показатели. Оценки «хорошо» и «отлично», высокий рейтинг, высокие тестовые баллы оказыва­ют значительное побуждающее влияние. Следует отметить, что более дифференцированная система оценивания имеет большее мотивационное значение. В этом случае подчиненный (ученик) может сравнивать собственные достижения не только с резуль­татами других людей, но и со своими предыдущими достиже­ниями. Например, получив за выполнение теста по английскому языку 480 баллов, он будет стремиться улучшить свой показа­тель (ведь это далеко не максимальный, хотя относительно и неплохой результат). Это будет сильнее побуждать к деятельно­сти, чем просто оценка «хорошо». Стимулирует к работе не только позитивная оценка, но и видение перспектив, стремление превзойти свои достижения.

Наибольший мотивационный эффект наблюдается тогда, ко­гда представлена не только общая (средняя) оценка, но и оценка по каждому из компонентов. Например, после выполнения т еста по английскому языку, кроме общего результата (480), сообщают также показатели по каждому из трех его компонен­тов.

Так, по шкале восприятия устной речи ученик получил 430 бал­лов, по шкале понимания грамматических конструкций резуль­тат составил - 520, а словарный запас (третья шкала) был оце­нен в 490 баллов.

Такая дифференцированная система оценивания имеет характер позитивного подкрепления (ведь 520 и 490 баллов - это впол­не пристойный результат), и одновременно наблюдается нега­тивная обратная связь (ведь 430 баллов по первой шкале - это низкий показатель). Ученик понимает, что на восприятие устной Речи следует обратить большее внимание. Это побуждает его к интенсивным занятиям в данном направлении. Он ощущает не­обходимость самосовершенствоваться и видит перспективы (стремится превзойти собственное достижение).

Традиционная система оценивания, которая до сих пор прак­тиковалась в наших школах и вузах, лишена всех преимуществ тестирования и дифференцированного оценивания. Ведь полу­чив оценку «отлично» за контрольную работу (или на экзаме­не), человек не знает, каков уровень его знаний по сравнению с десятью учениками (студентами), получившими такие же оценки. Тогда как, например, двадцатибалльная система оценивания имела бы большее мотивационное влияние.

Я получил 12 баллов из 20 (вместо традиционной оценки «отлично»). Это высокий показатель, но не самый высокий (я шестой по рейтингу). Я начинаю рассуждать: почему у меня не первый-второй результат, ведь я считал себя, по крайней мере, вторым в группе. Я стремлюсь улучшить собственное достиже­ние, работаю над своими ошибками, внедряю новые формы и методы работы. В следующий раз я получил 14 баллов из 20. Это уже лучший показатель, я удовлетворен, но на этот раз я только второй по рейтингу. Опять работаю над собой, пытаясь превзойти собственное достижение и улучшить свой рейтинг.

Материальное вознаграждение. Призы, подарки, премии, денежное вознаграждение оказывают большое влияние на мо­тивацию любой деятельности. Но при систематическом исполь­зовании эти формы позитивного подкрепления могут негативно влиять на процессуально-содержательную мотивацию. Напри­мер, если ребенок получает деньги (или что-то материальное) за хорошие оценки, то вряд ли у него возникнет понимание важности учебы самой по себе. Если прекратить давать деньги за оценки, то ребенок, привыкая получать материальное возна­граждение, будет менее склонен выполнять эту деятельность (т.е. процессуально-содержательная мотивация может умень­шаться).

Позитивное подкрепление

Любой стимул, подкрепляющий поведение, которое ему предшествовало. Позитивные стимулы обычно нейтрализуют состояние «первичного драйва» (например, ), являются наградой или создают привлекательную ситуацию. В определенном смысле, позитивное подкрепление определяется его последствиями. Оно укрепляет реакцию и делает более вероятным ее проявление в будущем. В роли позитивного подкрепления могут выступать самые странные события. Например, для некоторых детей выговор от учителя в присутствии сверстников может рассматриваться как позитивное подкрепление, если он повышает «уличную репутацию» потерпевшего. Любое поведение, которое приводит к позитивному подкреплению, становится более частым.


Психология. А-Я. Словарь-справочник / Пер. с англ. К. С. Ткаченко. - М.: ФАИР-ПРЕСС . Майк Кордуэлл . 2000 .

Смотреть что такое "Позитивное подкрепление" в других словарях:

    - (positive reinforcement). Также называется обучением вознаграждением; субъект получает вознаграждение за свое поведение, и проявление такого поведения повышается … Психология развития. Словарь по книге

    Позитивное подкрепление - (Positive reinforcement). Предъявление приятного стимула после реакции, повышающее вероятность ее повторения … Теории личности: глоссарий

    КОГНИТИВНО-ПОВЕДЕНЧЕСКАЯ ПСИХОТЕРАПИЯ - Первый опыт применения поведенческой терапии основывался на теоретических положениях И. П. Павлова (классическое обусловливание) и Скиннера (Skinner В. F.), (оперантное обусловливание). По мере того как новые поколения врачей… …

    Модификация привычных (а) представлений о ком либо или о чем либо, сформированных ранее знаний, (б) отношений, убеждений, (в) моделей, программ, действий, операций, способов привычного поведения, образа жизни, О.; сформированных ранее умений,… …

    Дрессировка - (от фр. dresser выправлять, обучать) выработка фиксированных форм поведения с помощью чередования положительных и отрицательных подкреплений. Дрессировка один из древнейших методов управления животными и людьми. Многие люди … Википедия

    МЕТОДИКА НАВОДНЕНИЯ - Относится к поведенческим методам. Если при систематической десенсибилизации погружение в ситуацию, вызывающую страх, происходит постепенно, то в других методиках подчеркивается эффективность быстрого столкновения, переживания сильной… … Психотерапевтическая энциклопедия

    СКИННЕР - Беррес Фредерик (Skinner В. F., 1904 1990). Известный психолог, лидер современного бихевиоризма. С. родился в 1904 г. в Саксуэханне, штат Пенсильвания, США. Окончил Гамильтон колледж в 1926 г. Степень доктора философии получил в 1931 г. в … Психотерапевтическая энциклопедия

    - (от англ. behavior поведение) ряд тщательно разработанных методов лечения (в т. ч. сексуальной дисфункции в семье, супружеских конфликтов), направленных на изменение или формирование новых шаблонов О., т. е. на искоренение нежелательного… … Психология общения. Энциклопедический словарь

    Девиантное поведение (Д. п.) (от англ. deviant отклоняющийся; лат. deviatio отклонение, расстройство) это устойчивое поведение личности, отклоняющееся от наиболее важных социальных норм, причиняющее реальный ущерб обществу или самой личности, а… … Психология общения. Энциклопедический словарь

    - (от лат. complexus связь, сочетание) одно из центральных понятий фрейдизма, возникающий в раннем детстве комплекс представлений и чувств, главным образом бессознательных, заключающихся в половом влечении к родителю противополо … Большая психологическая энциклопедия

Применяя закон эффекта Торндайка, Скиннер использовал свою терминологию. Согласно Скиннеру, первая часть закона, в которой поведение выполняется для получения приятного или удовлетворяющего последствия, называется подкреплением . Вторая часть, в которой поведение не выполняется, поскольку его последствие является неприятным или неудовлетворительным, называется наказанием . Каждое из этих обстоятельств может разделяться согласно тому, что - предъявление или удаление некоего стимула происходит при осуществлении целевого поведения. Результатом такого разделения являются четыре возможных варианта последствий: позитивное подкрепление, негативное подкрепление, позитивное наказание и негативное наказание , как показано в таблице.

При позитивном подкреплении , или обучении вознаграждением, субъект получает вознаграждение за свое поведение, и такое поведение усиливается (становится более вероятным). Голубь клюет клавишу и таким образом получает доступ к кормушке с пищей; ребенка хвалят за то, что он поделился игрушкой с другим ребенком.

При негативном подкреплении , также называемом обучением спасением, или обусловливанием активным избеганием, в результате поведения нечто неприятное или отвратительное удаляется или просто не происходит. Здесь можно предсказать усиление такого поведения. Голубь клюет клавишу, чтобы отключить слабый электрический ток, подведенный к его ступне (спасение — сайт), или клюет клавишу, чтобы предотвратить включение тока (избежание). С точки зрения оперантного обусловливания фобии человека поддерживаются негативным подкреплением: человек, испытывающий фобию, приближаясь к объекту или ситуации, вызывающим ее, чувствует испуг и уходит, но страх остается. Поэтому если оставлять фобию без лечения, она будет постоянно рождать сама себя. Человек никогда не выдержит достаточно долгого пребывания вблизи от объекта его страхов. Он не успеет понять их необоснованность, т. е. выяснить, что пчелы обычно не кусаются до тех пор, пока их на это не спровоцируют, что большинство змей не опасны и т.д.

При позитивном наказании , также называемом пассивным избеганием, результатом поведения является предъявление или осуществление чего-либо неприятного. Голубь, наученный клевать клавишу для получения пищи, сейчас вместо нее получает удар током и вскоре перестает клевать клавишу. Ребенка ругают за плохое поведение, и, в идеале, оно прекращается.

Наконец, при негативном наказании , или обучении прекращением, поведение приводит к тому, что нечто приятное или желательное удаляется; это также должно вызывать прекращение такого поведения или делать его менее вероятным. В случае с голубем кормушка с пищей появляется регулярно, за исключением тех случаев, когда он клюет клавишу. В случае с ребенком у него отнимаются такие привилегии, как просмотр телевизора. Популярной версией негативного наказания в школе является процедура тайм-аута. Ребенок, который плохо себя ведет, отводится в тихую комнату и остается в одиночестве на короткий период времени. Логика этой техники заключается в том, что ребенок ведет себя плохо, чтобы привлечь к себе внимание других детей и учителя, поэтому последствиями такого поведения является лишение внимания вообще.

Существуют еще две важные процедуры оперантного обусловливания. Первая из них - это формирование реакции, благодаря которой закрепляются различные модели поведения. Например, голуби обычно не занимаются тем, что клюют клавиши, но их необходимо научить этому. Научение осуществляется посредством последовательных приближений. При помощи ручного управления экспериментатор вызывает появление кормушки всякий раз, когда голубь просто поворачивается в сторону клавиши. Затем кормушка появляется, когда голубь подходит к клавише, далее, когда он случайно касается ее, и только со временем, когда он клюет ее. Ту же самую процедуру можно использовать для приучения ребенка к туалету: сначала похвала достается ребенку за то, что он движется в сторону уборной, затем - за вход внутрь, после этого - за карабканье на горшок и успешное осуществление акта опорожнения.

Формирование реакции также имеет хороший терапевтический эффект при работе, например, с аутичными детьми, которые вообще не говорят, и поэтому их невозможно втянуть в процесс общения: первое вознаграждение ребенок получает за издание любых вокальных звуков, затем - за звуки, напоминающие речь, и только после этого - за настоящие слова.

Вторая процедура - частичное подкрепление - более типична для повседневной жизни, чем обсуждавшееся до сих пор «продолжительное» подкрепление. При частичном подкреплении подкрепляются только некоторые случаи определенного поведения, а не каждый случай реализации такого поведения. Частичное подкрепление может принимать различные формы, но наиболее эффективным его вариантом является план переменного соотношения. Непредсказуемым образом некоторые примеры поведения подкрепляются, а некоторые - нет. Результат данной процедуры выражается в том, что если подкрепление долго не появляется, субъект упорно и гораздо дольше демонстрирует поведение. Результаты плана частичного подкрепления можно увидеть у детей, закатывающих истерики в магазине в попытке получить игрушку или сладость. Иногда родители уступают ребенку и покупают ему игрушку, чтобы прекратить демонстрируемое им смущающее и раздражающее их поведение. Поэтому ребенок научается упорствовать в своих попытках, даже когда родители не откликаются на них. Если его действия не имели успеха в этот раз, то это не значит, что они не помогут потом. Родители могут невольно формировать более длительные и более интенсивные вспышки негативного поведения, если будут долго пытаться сдерживаться, а затем уступать ребенку.

Все рубрики

Выберите рубрику Диагностика и коррекция детско-подростковой дезадаптации Закономерности формирования взглядов на психику ребенка Криминологический анализ психобиологических предпосылок асоциального поведения Обследование детей с неврозами, личность родителей и отношения в семье Особенности воспитания, патогенез неврозов у детей и подростков Особенности личности и психолого-педагогическая поддержка дезадаптированных детей и подростков Отклоняющееся поведение несовершеннолетних как нарушение процесса социализации Подходы к развитию детей в основных психологических школах Познавательные процессы, способности и эмоции юношеского возраста Превентивная психология — современная охранно-защитная концепция профилактики Предупреждение нарушений процесса социализации несовершеннолетних в семьях группы риска Психоаналитическая педагогика в оценке агрессивности и страхов Развитие самосознания у подростков, самоуважение и самооценка Роль неформальных подростковых криминогенных групп в десоциализации несовершеннолетних Своеобразие психического развития детей, страх и тревога в генезе неврозов Управление и педагогическое руководство, семейное воспитание Юность и юношество, социализация и ее институты Дополнительные тематические материалы: исследования, статьи, обзоры и пособия Динамика семейных отношений Семья и брак, супружество и брачные отношения Супружеские конфликты Истинные причины старения человека Поведение человека Демографические и экологические проблемы Психология и педагогика Волевая сфера человека Мотивационная сфера человека Предметно-практическая сфера человека Учебная деятельность школьника Эмоциональная сфера и учебная деятельность Реализация умственного потенциала Скрытый гипноз и тайны технологий гипноза Общие положения Оперативное гипновоздействие — эриксонианский гипноз и нейролингвистическое программирование Основы внушения (суггестии) Порча и сглаз Процесс освоения приемов скрытого гипноза Цыганский гипноз Цвет в нашей жизни Ахромные цвета Зеленые тона Основные периоды и этапы в процессе взросления человека Символика цвета, цвет в искусстве и в моде Социальность и цветовая символика Теплые цвета Эволюция человека от рождения и до самой смерти Беременность и периоды развития плода, рождение ребенка и его здоровье Взаимосвязь между личностными особенностями человека, его семьей и его работой Выход на пенсию, стрессы и чувство удовлетворенности в пожилом возрасте Дети в возрасте от 2 до 6 лет: физическое и речевое развитие, мышление и познание мира Научно-исследовательские подходы к пониманию закономерностей развития человека Подростковый возраст, физическое развитие и особенности мышления в этот период Проблемы, с которыми часто сталкиваются люди среднего возраста Процесс взросления подростков — формирование идентичности, становление личности и рискованное поведение Развитие младших школьников в рамках социального познания, ответственности и предписаний Раннее детство — страхи, тревоги и агрессивность. Стили воспитания и просоциальное развитие детей Смерть и отношение к смерти в разных культурах, представления об умирании Социальный и культурный контексты развития человека и методы их изучения Среда обитания и наследственность человека: генетика, семья и развитие Средняя взрослость — физическое развитие и изменения интеллектуального функционирования Физические изменения, которые несет с собой старение, и основные проблемы пожилых людей Физическое развитие в период ранней взрослости и факторы, воздействующие на жизнь взрослого Физическое развитие детей младшего школьного возраста. Мышление и интеллект, моторика и обучение Формирование личности младенца, просоциальное поведение и социокультурное развитие Человек Этапы физического и речевого развития ребенка в его первые два года

Когда ребенок делает что-то нехорошее – врет, не хочет умываться, плохо учится, – родители реагируют немедленно. Но сделанное как надо нередко остается без внимания. Один из самых авторитетных психологов мира, руководитель Центра по воспитанию детей в Йеле Алан Каздин считает, что похвала может быть исключительно действенной. Однако, чтобы она повлияла на изменение поведения, необходимо применять ее особым образом.

Бесполезно по сто раз в день просто говорить: «Прекрасно! Молодец!» О том, как хвалить правильно, и рассказывает эта книга.

Книга:

Основные методы позитивного подкрепления

Позитивное подкрепление связано со стимулированием желательного поведения – это так. Однако большинство родителей хотят исправить или прекратить нежелательное поведение. Их раздражает, что дети прерывают взрослых, балуются за столом, ругаются с братьями и сестрами, огрызаются, лгут, воруют и т. п. Может ли в этом случае помочь позитивное подкрепление? Да. На самом деле это единственный надежный способ исправления подобного поведения. Поэтому я расскажу о некоторых методиках, основанных на позитивном подкреплении.

1. Подкрепление позитивных противоположностей. Если вы хотите прекратить нежелательное поведение, неважно – ребенка, супруга или коллеги, начните с определения позитивной противоположности. Это будет целью вашей работы. Вы должны точно описать, какое поведение хотите видеть вместо нежелательного. Имея в виду эту цель, вы можете использовать временную линию – предшествующие события, поведение в настоящее время и результаты. Эти методы помогут вам подкрепить желательное поведение и при этом не поощрять случайно нежелательных действий. Но вся ваша работа основана на определении желательного поведения: что вы хотите увидеть ?

Это жизненно важно. Родителям, окончившим «курс обучения», мы предлагаем тест. Мы разработали несколько довольно распространенных гипотетических ситуаций и спрашиваем родителей, как бы они исправили нежелательное поведение – грубые выходки за обедом, капризы в магазине и т. д. Мы считаем, что поработали с родителями успешно, если они говорят примерно так: «Думаю, что позитивной противоположностью этого поведения было бы…» Если родители пропускают этот первый этап и сразу переходят к результатам, например, к наказаниям или игнорированию действий ребенка, мы понимаем, что не слишком помогли этой семье – т. е. научили методикам, но родители не до конца разобрались, с чего начинать, и не очень преуспели в работе над исправлением поведения. Нельзя прекратить нежелательные действия и подкрепить позитивное противоположное поведение, не определив его. Вам не нравится, как супруг выдавливает пасту из тюбика? Жалуйтесь, ворчите, кричите, повторяйте без конца: «Неужели трудно выдавливать пасту из конца тюбика? Сколько можно просить тебя?» Все будет бесполезно. Но через 5 или через 25 лет, когда вы все-таки определите позитивную противоположность и обратитесь к временн?й линии, вы добьетесь желаемого результата. И первый шаг для этого – определение желательного поведения: в данном случае это выдавливание зубной пасты из конца тюбика.

Рэй работал на дому. Большую часть времени у него занимали телефонные переговоры с клиентами. Старшему ребенку Рэя было уже 6 лет, и большую часть дня он проводил в школе. Но у 4-летней Анны была привычка обращаться к отцу с вопросами, когда он говорил по телефону. Она постоянно перебивала его. «Можно на улицу? Я хочу есть. Поиграй со мной!» Создавалось впечатление, что Анна только и ждет телефонного звонка, чтобы подойти к отцу. В выходные к ней присоединялся и брат.

Вмешательство детей в разговор взрослых – интересная проблема. Когда дети прерывают взрослых, это трудно игнорировать, а если это игнорировать, дети продолжают вторжение, пока становится невозможным не обращать на них внимание. В этот момент взрослый либо выполняет то, о чем просит ребенок, либо орет на него, или же истерически взывает к супругу… Это прекрасный пример, который показывает, насколько силен стимул – внимание к неподобающему поведению и формирование нежелательного навыка. Ребенок добился, что вы обратили на него внимание, и дальше будет продолжать в том же духе. Так было и с Рэем. Деловые звонки приводили к скандалам, которые часто заканчивались нервным срывом.

Рэй хотел, чтобы Анна не подходила к нему, когда он разговаривал по телефону, и обращалась со своими просьбами только до или после звонка. Теперь поставьте себя на место Рэя и вспомните временную линию. Начните с предшествующих событий. Что вы можете сделать, пока не зазвонил телефон? Когда вы не говорите по телефону, то можете спокойно сказать ребенку, чтобы он не мешал, когда раздастся звонок. Вам следует точно объяснить, что значит «мешать». Скажите ребенку, что во время разговора по телефону, ваш ответ на любой его вопрос – «нет». Но если он подождет, пока вы закончите разговор, и обратится с вопросом или просьбой, то может получить желаемое (или не получить – все зависит от конкретного случая). Но вы постараетесь разобраться в проблеме ребенка и помочь ему.

Работая над желательным поведением, инструктируйте ребенка непосредственно перед тем, как он будет выполнять желаемое действие. Такая подсказка особенно эффективна. Но Рэй не мог сказать точно, когда зазвонит телефон. Поэтому он объяснил все дочери в самом начале рабочего дня. Когда раздался первый звонок и Анна оказалась рядом, он сказал: «Ну вот, Анна, можешь посмотреть, дождешься ли ты окончания моего разговора». (Это очень хорошая формулировка – небольшое задание.)

Мы полагали, что в этой ситуации Рэй может применить также метод формирования навыка – за частичное проявление желательного поведения хвалить дочь. Мы решили, что Рэю следует оказывать внимание Анне. Через 2 минуты разговора по телефону в начале дня Рэй будет улыбаться Анне, показывать ей знаками, что она – молодец, шепотом скажет пару ободряющих слов и погладит по голове, если будет возможно. Достаточно будет проделать такие вещи во время нескольких первых звонков. Мы хотели, чтобы Рэй сразу похвалил Анну за то, что она не прерывает его, и похвалил с энтузиазмом. Если же Анна вмешивалась в каждый разговор, не оставляя Рэю шанса вознаградить желательное поведение, то следовало найти время и смоделировать ситуацию – поиграть в «Не мешай». Во время игры Рэй мог бы хвалить дочь, награждать ее призами и жетонами и т. д.

Что делать, если поведение ребенка вас не устраивает? Вы знаете, с чего начинать: понять, какое именно поведение вы хотите увидеть.

А теперь – результат. Мы рекомендовали Рэю подкреплять позитивное противоположное поведение Анны: обращения и вопросы до или после телефонного звонка. Если Анна демонстрирует нежелательное поведение, не обращать на нее внимания. Рэй должен отвернуться или строго посмотреть на ребенка. Если Анна обращалась к нему, когда он был свободен, следовала похвала: «Молодец! Ты просишь у меня печенье, когда я не говорю по телефону!» Рэй не должен был забывать и о других поощрениях (например, обнять или погладить дочь по спине). Между телефонными звонками следовало хвалить Анну за то, что она не мешала или почти не мешала.

Рэю и его жене понравилась программа исправления поведения, потому что она была совершенно реальной. Иногда мать могла похвалить Анну или, если был выходной, то обоих детей за то, что они тихо играли и не мешали отцу говорить по телефону.

Рэю приходилось звонить не менее 20 раз в день. До начала работы над поведением Анна прерывала Рэя около 30 раз; в первые же два дня количество ее вмешательств сократилось до 5, а через 5 дней нежелательное поведение прекратилось вообще. Нам понадобилось два выходных, чтобы научить тому же ее 6-летнего брата – в будни у него не было достаточно времени для отработки желательного поведения. Через 8 дней работы родители перестали хвалить детей: они целую неделю не вмешивались в разговоры, и стало понятно, что вознаграждения больше не требуются. Через две недели проблема, казалось, была решена. Через 4 недели Рэю опять помешали, через 8 недель единичный случай повторился. Оба раза Рэй просто игнорировал ребенка, и помехи прекратились навсегда.

Это очень типичная ситуация. Ребенок дразнит собаку или кошку, не относит грязную одежду в стирку, рано утром в воскресенье врывается в вашу в спальню, роняет еду на пол… Список бесконечен. Чтобы прекратить это, в первую очередь спросите себя: «Какую позитивную противоположность я хочу увидеть?»

Подкрепление позитивного противоположного поведения – универсальный инструмент, который можно использовать почти всегда. Но существует два более узкоспециализированных способа его применения.

2. Подкрепление действий, которые не совсем точно соответствуют позитивной противоположности. Как быть, если ребенок никогда не совершал ничего похожего на позитивную противоположность? Как подкрепить нужное поведение? Первый вариант – смоделировать ситуацию, чтобы отработать желательное поведение – это поведение в настоящем (середина временной линии), которое мы обсуждали в предыдущей главе. Мы говорили и о формировании навыка, тоже стратегии настоящего времени. Но в данном случае нет основы для формирования навыка. Проблему нужно решать иначе. Ключ к решению находится в Будущем (это последствие).

Метод состоит в том, что вы подкрепляете все или почти все, что ребенок делает иначе , – все, что отличается от нежелательного поведения. Фактически в любой момент времени ребенок совершает: или (1) нежелательное действие, или (2) другое действие. Последнее – это поведение, которое отличается от нежелательного. Мы принимаем это другое поведение, если необходимо немедленно исправить нежелательное.

Я на всю жизнь запомнил, как впервые применил этот метод. Это произошло благодаря одному 10-летнему мальчику по имени Эван. Учительница попросила меня поработать с ним прямо в школе. Эван был чрезмерно активным и сильно мешал на уроках. Активный – это еще мягко сказано. Во время урока Эван ходил по партам, наступая на вещи других учеников, громко разговаривал, со всеми пререкался и т. д. Учительница сказала, что он никогда не садится на свое место, и она ничуть не преувеличивала.

Какое действие подкреплять? Позитивное противоположное поведение – тихо сидеть за партой, работать, внимательно слушать учителя. Но Эван никогда не делал ничего подобного! Поначалу казалось, что формирование навыка невозможно. Поэтому мы решили начать с того, что хвалили Эвана за любое действие, кроме хождения по партам и громкого разговора. Иногда он на некоторое время замолкал. На самом деле иногда он останавливался около своей парты, но не работал. Тем не менее в эти моменты он не совершал ни одного из двух нежелательных действий, которые мы хотели прекратить: он не ходил по партам и не говорил вслух. Это не совсем соответствовало описанию позитивной противоположности его разрушительного поведения, но было лучше, чем ничего. С этого мы начали.

В течение двух дней я работал в классе по 30 минут, подсказывая учительнице, что делать. У меня был лист цветной бумаги (точнее, два листа, скрепленных вместе): одна сторона красная, другая зеленая. Когда Эван демонстрировал поведение, отличное от нежелательного, я немедленно показывал учительнице зеленую сторону. Это означало, что она должна была похвалить Эвана, если могла (это зависело от того, в каком месте класса она находилась в этот момент): подойти ближе, спокойно сказать ободряющие слова и погладить по голове. Если она не могла подойти ближе, то лишь громко хвалила Эвана. Было очень важно помочь учителю увидеть желательные действия Эвана, потому что обычно она реагировала на нежелательное поведение. Это нормально, поскольку человек устроен так, что немедленно реагирует на отрицательные стимулы и пропускает положительные. Эволюция сделала нас такими.

Учительница быстро овладела предложенным методом. За 30 минут, которые я находился в классе, она похвалила Эвана трижды – я подсказал только первые два раза, а третий она отметила сама. (Я ослабил подсказку; об этом приеме мы говорили в первой главе.) На второй день учительница похвалила Эвана дважды, без моей подсказки. Она пропустила третью возможность похвалить мальчика за поведение, отличающееся от обычного, чудовищного, – но в этот момент она отвернулась к доске. Поэтому, как только она опять повернулась к классу, я показал зеленый лист, и она похвалила Эвана. Мы решили, что попробуем наш метод на первых уроках и, если он сработает, то после обеда продолжим – главным образом потому, что корректное и своевременное подкрепление было очень трудно обеспечить, ведь в классе шел учебный процесс.

Через пару дней стало ясно, что метод работает. Эван меньше ходил по партам и почти не кричал. Теперь он даже время от времени садился на место – чего раньше никогда не наблюдалось. Поэтому мы перешли от вознаграждения любого поведения, отличного от желательного, к поощрению Эвана, сидящего за своей партой. Когда Эван сидел на своем месте, он частично демонстрировал желательное поведение, которое мы и хотели развить. Каждый раз, когда он просто садился на место, даже если он не работал и не слушал учителя, его поведение особо отмечалось. Если же Эван выполнял задание, то получал дополнительную похвалу. Процесс шел медленно (в конце концов у учителя был полный класс учеников) и занял несколько недель. Но мы добились, что большую часть урока Эван проводил на своем месте и больше не ходил по партам – именно последнее было наиболее нежелательно. Мало того, его привычка громко говорить в классе пропала сама собой. Очевидно, она была непосредственно связана с хождением по партам и тоже прекратилась.

Результативность метода поощрения поведения, близкого к желательному, подтверждает не только этот пример. Мы применяли его и в домашних условиях. Например, в одной семье два брата, 4 и 5 лет, постоянно ссорились, дразнились и задирали друг друга. Передышка наступала, только когда старший мальчик уходил на занятия. Сначала я подробно расспросил родителей, какое именно поведение они хотят увидеть. Они хотели, чтобы дети играли в одной комнате (пусть не вместе, но без драки); занимались чем-то вместе (например, играли в кубики или смотрели телевизор); мирно сосуществовали в других ситуациях (за обедом, в машине и т. д.). Из инструментов настоящего времени (поведение в настоящем) можно было бы выбрать моделирование и поиграть с ребятами в игру «Живем дружно». Но был и другой путь – инструменты будущего времени, т. е. последствия, использующие подкрепление другого поведения.

Под «другим поведением» мы понимали любые действия, кроме драки, которые мальчики совершали, находясь в пределах видимости друг друга (в одной комнате, в машине). Программа была разделена на две части. Когда братья были вместе и не ругались, один из родителей хвалил их. Кроме того, мальчиков предупредили, что за 2 минуты мирного поведения они получат очко. Так что на самом деле мы не подкрепляли позитивное противоположное поведение. Вместо этого мы поощряли поведение, отличающееся от потасовок, перебранки и т. п. «Отличающееся поведение» и есть «другое», поэтому наш метод и назывался подкреплением другого поведения.

Очки назначались не каждому мальчику, а команде. Не было случая, чтобы один брат заработал очко, а другой нет. И приз, на который они могли обменять очки, также предназначался для двоих. Например, они могли потратить 4 очка на то, чтобы поиграть лишних 15 минут перед сном; оба мальчика могли лечь спать позже. Заработав 4 очка, братья могли потратить их или сберечь, чтобы накопить на другой приз. Родители хорошо знали своих детей и спросили нас, что будет, если братья не смогут договориться насчет приза. Мы объяснили, что это обязательное условие: одинаковый приз для обоих. Если они не придут к согласию, то в этот вечер не получат приза, но смогут сохранить очки до следующего дня. (Очень важно, чтобы вы предложили ребенку приз, действительно ценный для него, а не просто вещь, которую, как вы думаете, он должен оценить.) Предложенный метод заработал прекрасно. Оба мальчика высоко оценили возможность подольше не ложиться спать и поиграть во дворе с отцом. Поэтому они не спорили о том, на что потратить заработанные очки.

Когда дети получили заслуженное вознаграждение, родители сказали: они очень рады, что мальчики повзрослели. Они подчеркнули, что именно «взрослого» сделали братья: «Вы сидели рядом и не ругались». Они не забыли обнять и приласкать детей. Спустя три дня мальчики все еще задирали друг друга, но не все время, и даже были моменты, когда они нормально общались. Родители отметили это, похвалили детей и наградили их дополнительными 5 очками. Через некоторое время родители перешли от поощрения другого поведения (отличного от нежелательного) к подкреплению некоторых позитивных противоположностей, которые они определили с самого начала – например, нормального разговора. Уже на следующей неделе родители отметили значительные изменения, продолжали хвалить детей, но перестали назначать очки за хорошее поведение. (Они разрешили братьям собрать все полученные очки, чтобы потратить их на суперприз – поездку за город.) Потасовки не прекратились, но остались на приемлемом уровне, и родители посчитали, что это их устраивает. Братья теперь играли вместе, а не просто терпели присутствие друг друга.

Это был другой пример подкрепления поведения, отличающегося от нежелательного. Когда «другое» поведение будет закреплено и мы увидим проявления позитивных противоположностей, то можем двигаться дальше и переходить к поощрению собственно желательного поведения.

3. Подкрепление более редких проявлений нежелательного поведения. Это звучит совсем уж парадоксально, но поверьте, это работает. Допустим, какие-то действия – вопли, ругательства, агрессия и т. д. – происходят по 10 раз в день, а то и по 10 раз в течение одного утра. Единственный способ устранить проявления подобного поведения – сделать так, чтобы оно проявлялось все реже, пока совсем не прекратится. Ребенка следует похвалить, если он выругается не 10, а только 8 раз. Многие родители не могут поверить, что это необходимо: «Я не ослышался? Мой ребенок бранится, а я должен его хвалить за это?» Именно так, и вы делаете это потому, что формируете процесс ослабления потока брани, который в конце концов должен иссякнуть.

Вот пример. Я работал с 7-летним Тедом, который задирал и толкал других учеников, портил их тетради и мешал работать. Кроме того, он обзывал их дураками, идиотами и т. д.

Мы хотели подкрепить позитивное противоположное поведение, нормальное общение с одноклассниками, но казалось, что Тед может либо издеваться над ними, либо молчать. Мы сказали, что он может заработать специальное вознаграждение для себя и для всего класса. Если Тед сделает то, о чем его просят, то у всего класса будет дополнительная перемена или же учитель расскажет им что-нибудь интересное перед обедом. Каждый день Тед может выбирать, на что потратить заработанное вознаграждение – на свободное время или на рассказ. Чтобы получить награду, Тед не должен никого пинать в течение 15 минут после начала уроков в 8:30. (Естественно, мы четко определили, что такое «пинать».) Если Тед никого не тронет до 8:45, он получит вознаграждение. Мы сказали, что это очень трудно, и выразили сомнение, что Теду такое по силам. (Очень сильный предшественник; см. главу 1.) Но мы предложили мальчику попробовать.

Тед был хорошо подготовлен, и в первый же день в 8:45 учитель подошел и радостно сказал ему: «Ты выиграл! Поскольку ты не сказал ни одного плохого слова, класс получает награду, и не имеет значения, что ты будешь делать в остальное время. Можешь выбрать приз!» Все утро Тед вел себя необычно тихо: он почти не задирал ребят. (Мы просили учителя защищать жертв издевательств Теда. Он должен был немедленно подозвать обиженного к себе. Мы хотели, чтобы он (конечно, временно) не обращал внимания на Теда – был огромный риск случайно поощрить его нежелательное поведение.) Работа продолжалась в течение следующих трех дней. В один из дней Тед ничего не заработал, но затем получил награду два дня подряд. Потом мы сказали ему: «Ты молодец; но посмотрим, сможешь ли ты не ругаться целых полчаса?» Это усложнение задачи, хороший предшественник.

Три с половиной недели мы работали над желательным поведением, и теперь Тед мог получить дополнительный приз в конце дня, помимо обещанного вознаграждения перед обедом. Если он хорошо вел себя весь день, то класс получал дополнительную перемену и учитель рассказывал историю. Затем мы стали награждать его за правильное поведение в течение двух и трех дней подряд. Он почти прекратил издеваться и обзываться. Кроме того, он стал вести себя так, как положено в коллективе.

Мы старались отмечать каждое проявление позитивного противоположного поведения. Это сделало нашу работу еще более эффективной. Тед стал проявлять не только нежелательное или «другое» поведение (молчать либо издеваться), его действия стали разнообразнее. Как и большинство хулиганов, он на самом деле много общался с одноклассниками: обсуждал телешоу, компьютерные игры и т. д. Мы рассматривали эти регулярные нейтральные действия как желательные и старались вознаграждать их. Мы его «ловили на социальном поведении» и подкрепляли нужные действия.

Таким образом, помимо систематической работы над устранением нежелательного поведения Теда, увеличении периодов его нормального поведения, мы также подкрепляли позитивную противоположность – социальные взаимодействия с одноклассниками. Мы работали над тем и над другим одновременно, потому что просто социальные взаимодействия не устраняли издевательств; у Теда было достаточно времени в течение дня, чтобы успеть и пообщаться, и обидеть. Поэтому мы работали над прекращением издевательств и над формированием их позитивной противоположности.

В этом примере показано, как постепенно снижать частоту проявления поведения. Он также говорит о том, что поведение состоит из массы компонентов – я уже упоминал, что истерика может проявляться дракой, руганью, криками и рыданиями. Чтобы ослабить истерику, устраняют один из компонентов, потом другой или стараются ослабить их проявление. В конце концов от первоначальной истерики ничего не остается. Это значит, что некоторое время вы вынуждены хвалить ребенка за «правильную» истерику. Надеюсь, что теперь эта идея не кажется вам сумасшедшей?

Метод положительного подкрепления можно применять при дрессировке любых животных, но особенно он подходит для собак. Это система, целиком опирающаяся на побудительный мотив (стимул) и отвергающая физическое воздействие или силу в любых их проявлениях. Этим методом могут пользоваться даже дети. Он не требует какого-либо природного дара (таланта) дрессировщика. Он не связан с каким-то особым тоном, выбором подходящего времени, не основан на регулярной практике и не опирается на какую-либо из традиционных теорий дрессировки собак. Все, что требуется – ваш разум и какой-нибудь лакомый кусочек.

Как научить собаку, чтобы она по команде ложилась в каком-нибудь определенном углу комнаты? Для этого существует два способа:

1. Можно бить собаку плеткой всякий раз, когда она пойдет в какой-либо другой угол и вообще бить до тех пор, пока она не усвоит, что указанное вами место – единственное безопасное убежище.

2. Можно дать собаке особенно вкусный кусочек в этом уголке и полностью ее игнорировать, когда она пойдет в какую-то другую часть комнаты.

Я совершенно уверен, что, прочитав эти строки вы сказали себе: «Ну, это рассуждения на уровне здравого смысла. Что тут такого нового?» Разумеется, это здравый смысл. Каждый владелец собаки ежедневно поступает подобным образом и дома, и вне его стен, не задумываясь о том, что и как он делает. Хотя почему-то, когда требуется сделать некоторое усилие и чему-нибудь научить свою собаку, мы становимся в позу дрессировщика и вспоминаем стародавний подход: «Ты собака, я хозяин. Я приказываю, ты подчиняешься».

Когда дома вы подзываете собаку, вы обычно намерены покормить ее или взять на поводок и повести на прогулку, или показать, что вы уронили еду на пол в кухне и хотите, чтоб она все подчистила. Действительно, дома мы редко зовем собаку просто так, обычно это происходит по какой-то причине, и в большинстве случаев выполнение команды сулит собаке что-то приятное. В результате лишь немногие люди жалуются, что собака не идет на зов дома. А в ближайшем парке дело обстоит совсем иначе. Вы гуляете, она свободно бегает, играя с другими собаками, охотится за белками, роется в мусорных урнах, в то время как вы погрузились в собственные мысли. У ворот парка вы зовете ее, чтобы вести домой. И тут она, бросив на вас взгляд, направляется в противоположную сторону. (Такое все мы видим на улице чуть не каждый день.) В этот момент вы говорите себе: «Я должен наконец выдрессировать свою собаку». Вы ее уже выдрессировали. Вы преуспели в том, что научили ее не подходить к вам. Как? Очень просто. Собака быстро усвоила: если она не подойдет, то будет вознаграждена более длительной прогулкой. Если же она к вам подойдет, то лишится удовольствия: ее отведут домой.

Если бы вы применили ваши «домашние приемы» дрессировки команды «Ко мне!», подзывая пса около ворот, давая лакомство и затем делая еще круг по парку, то вскоре, услышав зов, он летел бы к вам пулей. Подкуп? Я называю это здравым смыслом. Сколько раз уже мне приходилось прятать улыбку, когда ко мне обращались люди, которые сталкиваются с проблемами нежелательного поведения своих собак, и я в ответ предлагаю им попробовать награждать собаку за хорошее поведение, вместо того чтобы думать, каким образом наказать ее за нежелательное поведение. Хозяева недоумевают: «Вы хотите сказать, что я должен его подкупать?» По-моему, это довольно забавно: то, чему ученые, психологи и бихевиористы (специалисты по проблемам поведения) придумали замысловатые названия вроде «модификации поведения», «реабилитационная психотерапия», «психология поведения» и так далее, широкой публикой все еще расценивается как подкуп.

Впрочем, на самом деле важно другое – при правильном применении положительное подкрепление весьма эффективно: оно изменяет нежелательное поведение. Существует ряд основополагающих принципов, которые определяют успех применения положительного подкрепления как метода дрессировки. Но прежде чем начать применять эти принципы или законы с помощью специальных обучающих упражнений в процессе дрессировки собак, необходимо рассмотреть отдельно каждую стадию обучения, ее цель и желаемый результат.

Как действует положительное подкрепление

Прежде всего мы вообще должны забыть об упражнениях. Все, что нас интересует для начала – это первый шаг в нужном направлении. Представим себе, например, что мы хотим научить касатку выпрыгивать из воды. Мы даем свисток (команду) и ждем. Затем ждем еще немного, а зачастую бывает, что ждем еще и еще. Очевидно, сначала касатка не имеет представления о том, что от нее требуется, когда звучит свисток. Поэтому нам приходится ждать, чтобы она зачем-нибудь высунула нос из воды. Точно в этот миг мы снова свистим в свисток и даем ей рыбу. Когда она проплывает внизу, мы снова свистим и ждем. Процедура повторяется до тех пор, пока касатка не выйдет на уровень «ага!»: «Ага! Когда я слышу звук свистка, я получаю рыбу». Этот уровень понимания – уровень «ага!» – не может считаться закрепленным, до тех пор вы не добьетесь, чтобы происходило десять из десяти возможных немедленных реакций на свисток. Пока это не достигнуто, не следует переходить к следующему этапу дрессировки.

На первом ее этапе кажется, что прогресс не очень заметен, однако для успеха обучения крайне важно, чтобы каждый этап заканчивался достижением уровня полного понимания. Если вы этого добьетесь, то обнаружите, что, по мере перехода к каждому следующему этапу превращение первоначальной реакции в распознаваемую цепочку движений идет очень быстро. Теперь мы подходим к этапу дрессировки, который называется «формирование». Нам нужно заменить уже сложившуюся цепочку: «свисток – появление носа – обязательная рыбка», новой цепочкой: «свисток – касатка выпрыгивает из воды – рыбка дается иногда». Достигается это следующим образом. Формирование поведения означает, что мы делаем один маленький шаг в нужном направлении и продвигаемся к конечной цели, подкрепляя каждый сделанный шаг. Так мы обеспечиваем безусловное выполнение этой части цепочки, прежде чем двигаться дальше.

Здесь наблюдается интересное явление: выполнение определенных действий, надежно затренированное с помощью вознаграждения, можно сделать еще более четким, если вознаграждение задерживать. Предположим, затренирована такая реакция касатки: на десять свистков она десять раз немедленно высовывает нос из воды. На одиннадцатый раз говорим: «Недостаточно хорошо, рыбы ты не получишь». Можно предположить, что теперь касатка подумает: «Но я всегда получаю рыбку. Наверное, кто-то ее стащил раньше меня. В следующий раз надо живее пошевеливаться». И на двенадцатый раз вы получите более быструю и энергичную реакцию касатки: она высунет из воды всю голову целиком. За это безусловно полагается рыбка, но теперь и в дальнейшем – только за это.

Дальше будем формировать цепочку: «свисток -появление из воды всей головы целиком – при немедленной реакции рыбка в награду в десяти случаях из десяти». Лишь затем можно будет перейти к следующему этапу. Кажется, что обучаемый с каждым этапом все скорее понимает, что от него требуется и возникает эффект снежного кома.

Я намеренно воспользовался примером касатки чтобы подчеркнуть главное: весь процесс обучения может осуществляться без какого-либо физического воздействия. Сначала мы ждем верного шага в нужном направлении и вознаграждаем его, затем закрепляем и придаем законченную форму.

Хозяин: «Какая разница между всем этим и подкупом?» Я: «Подкуп – это использование награды в качестве соблазна, для того чтобы стимулировать движение. Подкрепление – это вознаграждение, получаемое за добровольное движение». Хозяин: «Всегда ли давать награду?» Я: «Прием действует лучше, если вы даете награду не всегда. Когда модель поведения сформирована, только самая быстрая, ярко выраженная и сильная реакция вознаграждается. Иногда ученику придется выполнить отработанную цепочку шесть или семь раз, прежде чем последует вознаграждение». Хозяин: «Обязательно ли давать в награду что-то съедобное?» Я: «Наградой может быть что-то другое, ради чего, с точки зрения ученика, стоит выполнять определенные действия. Было бы бессмысленно пытаться сформировать мое поведение с помощью тарелки капусты, если я терпеть не могу капусту!

Как применять положительное подкрепление

В главе «Как учатся собаки» я рассказал о том, как научил свою первую собаку искать и приносить вещь (соответствует команде «Аппорт!»). Теперь я расскажу вам, как я научил выполнять это задание свою нынешнюю собаку. На обучение моей первой собаки ушло несколько недель, и она так и не научилась выполнять команду по-настоящему хорошо. Это была немецкая овчарка – порода славится хорошей обучаемостью. Моя теперешняя собака выполняет то же задание с огоньком в глазах и невероятной для собаки ее размеров быстротой. Это – японская акита, порода, известная своим упрямством.

Я провел много времени на дрессировочной площадке, в течение ряда недель обучая мою немецкую овчарку. В течение нескольких дней, затрачивая по несколько минут в день, я обучил акита, ни разу даже не встав с кресла. Используя этот метод, я недавно помог проводнику полицейской собаки достичь того же результата при дрессировке немецкой овчарки. Фактически нам потребовалось меньше обычного времени, чтобы довести совершенно необученную собаку до стандарта министерства внутренних дел, причем достигнутые результаты были гораздо выше тех, которых добиваются, применяя обычные методы дрессировки.

Кличка моей собаки – Йоко. Поняли? Джон Йоко. Ей было пятнадцать месяцев, когда я реши научить ее искать и приносить брошенный предмет. Сейчас у меня не остается времени, чтобы самому участвовать с моими собаками в соревнованиях, где собаки демонстрируют свои умения, но я все еще сужу такие состязания. И вот однажды один хозяин-участник обронил мимоходом замечание, которое побудило меня учить мою собаку искать и приносить брошенный предмет. Парень сказал: «Вы никогда не научите акита выполнять эту команду как следует». Когда мне бросают вызов, я загораюсь.

Я сидел за письменным столом в своей приемной, рядом на столе я поставил коробочку с лакомством. Протягивая собаке гантель, я говорил: «Возьми!» Йоко нюхала перекладину, а я говорил: «Хорошая девочка!» – и давал ей угощение. Первое занятие продолжалось около пяти минут, и она получила вознаграждение сразу после быстрой реакции примерно в 60% случаев. В остальных случаях за правильные реакции иногда тоже давалось вознаграждение, но только после того, как собака нюхала стол, карабкалась на меня, лаяла или делала еще что-нибудь, стараясь получить вознаграждение. На следующем занятии в тот же день был достигнут уровень понимания (уровень «ага!»). Йоко тыкалась носом в гантель всякий раз, когда я давал команду. На формирование действия и переход к следующей стадии потребовалось несколько больше времени. В течение четырех занятий по пять минут каждое она пробовала делать самые разные вещи чтобы получить награду. Отношение было: 15%; 25%; 70%; 100%. Теперь я уже требовал, чтобы она не тыкалась в гантель носом, а лизала ее. Не дав ей угощения, когда она в очередной раз лизнула гантель, я попал в точку, что вызвало эффект снежного кома гораздо раньше, чем я сам того ожидал. Она решительно выхватила гантель у меня из рук смотрела на меня, как будто говоря: «Смотри, глупыш, я ее взяла... Давай еду!»

Никто не может заранее определить модель формирования поведения при выполнении задания. Мы можем запланировать известную структурированную последовательность, но при обучении нам придется руководствоваться темпом, который установит само животное. После того как вы вознаградили собаку за определенное движение, оно должно стать единственным движением, за которое дается награда, пока оно не будет затренировано. Йоко сделала больший шаг вперед, чем я ожидал, и, поскольку я ее с энтузиазмом наградил, мне пришлось ждать, чтобы она его повторила. Это отняло меньше времени, чем я ожидал, но надо учесть, что Йоко очень прожорливая собака.

После такого огромного рывка вперед вся цепочка действий формировалась очень легко. Прошло совсем немного времени, и я уже бросал гантель на кушетку в дальнем конце приемной, а Йоко приносила ее по команде и садилась передо мной, держа ее в зубах, гордая. В первый же раз, когда на свежем воздухе я опробовал дать одно из тех упражнений, что предлагаются на состязаниях, она получила бы у меня за их выполнение все десять баллов из десяти. Но кажется, я несколько пристрастен.

Возьмем теперь два простых действия: выполнение команд «Сидеть!» и «Лежать!». Попытаемся, используя наш метод и не применяя силу, научить собаку четко реагировать на данные команды. Чтобы ускорить процесс, необходимо прибегнуть к подкупу. Иными словами, мы показываем награду, чтобы стимулировать движение. Как только достигается этот уровень понимания, мы обращаемся к команде и подаем ее только голосом, затем ждем, чтобы было сделано верное движение. Тогда мы придаем этому движению законченный вид. Для отработки команды «Сидеть!» покажите собаке лакомство, даже дотроньтесь им до кончика ее носа. Скажите: «Сидеть!» – и медленно переместите лакомство вверх и назад, чуть дальше линии глаз собаки. Сложение у собак такое, что если голова поднимается вверх и назад, то задняя часть туловища непременно опускается.

Для отработки команды «Лежать!» выберите такое препятствие, чтобы для его преодоления собаке нужно было лечь на брюхо. Это будет зависеть от размера собаки. Например, для немецкой овчарки подошел бы кофейный столик. Подведите к нему собаку и предложите ей лакомство, держа его в руке под столиком, то есть под препятствием. Когда собака потянется за лакомством, медленно отодвигайте его под препятствием, побуждая собаку двигаться следом и командуя при этом: «Лежать!» В тот момент, когда ее брюхо коснется пола, дайте вознаграждение.

Теперь, когда мы научили свою собаку делать то, чего мы от нее добиваемся, остается отучить ее делать то, что нам не нравится. Для достижения этой цели используем систему отрицательного подкрепления.