Принципы научения: подкрепление и наказание. Негативное подкрепление

Команда "Сидеть!" Всегда, прежде чем поздороваться с собакой, нужно сначала дать ей команду "Сидеть!". Этот метод выработки противоположного условного рефлекса наиболее эффективен, если собака видит в руках приближающегося человека лакомство или игрушку, которые она получает сразу, как только примет положение сидя. При выработке этого условного рефлекса можно использовать недоуздок.

Положительное наказание. Многие распространенные, но зачастую неэффективные, стратегии борьбы с напрыгиванием на людей и покусыванием предусматривают использование положительного наказания, в частности окрика и отталкивания собаки рукой или коленом в грудь. Подвижная собака, игриво прыгающая на людей, скорее всего, примет толчок коленом за игровую реакцию. Возможно, главной причиной неудачи этих стратегий является то, что применение их представляет для клиентов слишком большие трудности. Необходимо очень точно выбрать момент: наказание должно последовать сразу, как только собака начинает проявлять данное поведение, или в пределах доли секунды после этого. Затем необходимо очень точно соразмерить интенсивность наказания. Слишком резкое наказание испугает собаку (особенно - робкую), а слишком мягкое будет неэффективным.

Проведение манипуляций по уходу за собакой. Некоторые собаки кусаются, когда к ним пытаются прикоснуться, выполняя какую-либо физическую манипуляцию, например во время расчесывания шерсти или пристегивания на поводок. Нужно тщательно расспросить клиента об особенностях поведения собаки во время покусывания. Если она при этом глухо рычит, клацает зубами или рычит, оскалив зубы, необходимо еще раз просмотреть анамнез и пересмотреть диагноз: подобные ответные реакции характерны для агрессивного поведения, и с ними нужно работать соответствующим образом.

Если свидетельств агрессии не имеется, тогда покусывание во время рутинных процедур следует устранять с помощью метода десенситизации и выработки противоположных условных рефлексов. Одним из способов применения этого метода является обучение собаки по команде сидеть, оставаться на месте и расслабиться. Когда собака научится спокойно оставаться на месте, приступают к выполнению десенситизации, как это показано на примере приучения собаки к спокойному реагированию на чистку щеткой.

Собаке дают команду "Сидеть, место!". Тренер проводит один-два раза щеткой по шерсти и затем дает лакомство за то, что она оставалась спокойной. Если собака сопротивляется, тренер убирает лакомство, делает очень короткий перерыв и затем возобновляет попытки, стараясь меньше раздражать животное прикосновением, например проводя по нему гладкой стороной щетки. Максимальных успехов можно добиться, если применение этого метода начать с коротких сеансов и заканчивать каждый сеанс на положительной ноте, не доводя дело до сопротивления собаки или укуса.

Эффективность лечения. Такие формы поведения, как прыжки на людей и покусывание, очень хорошо поддаются коррекции; у большинства собак заметное улучшение наблюдается уже на протяжении первых 2 недель выполнения правильно построенной программы. Неудача в лечении чаще всего объясняется прерывистым подкреплением неприемлемого поведения собаки. Такое подкрепление осуществляют члены семьи, если, к примеру, терпеливо переносят прыжки своего питомца, когда на них повседневная одежда. Прерывистый режим вознаграждения - идеальный способ поддерживать нежелательное поведение.

Недопустимое игровое поведение. Большинству людей нравится играть со своими собаками. Однако иногда владельцы жалуются на недопустимое поведение собаки во время игры. Дальнейший опрос нередко показывает, что собака играет бурно, прыгает на людей и хватает их зубами. Хотя игра - это забава, необходимо принимать меры, обеспечивающие безопасность и контроль. Как правило, собаки очень любят играть со своими хозяевами, и с ними нетрудно установить надлежащий режим игры.

Приглашение к игре. Приглашение к игре должно исходить от владельца; не следует начинать игру в ответ на требования собаки. О намерении владельца может сообщать вспомогательный вербальный сигнал типа "Пора нам поиграть!". Его можно комбинировать со вторичным сигналом, которым служит, например, переход на обычное место для игр или протягивание специальной игрушки или поводка.

Правила контакта. Необходимо установить правила физического контакта. Многим нравится бороться со своими собаками, но если собаке разрешить бороться с какими-то одними людьми, она, вполне вероятно, попытается делать это и с другими, включая маленьких детей и стариков. Поэтому не следует поощрять подобных игр. Если питомец настаивает, хозяину следует оставить его и прекратить игру. Нельзя также позволять собакам преследовать людей во время игры. Это может оказаться опасным, поскольку акт преследования может пробудить в животном хищное поведение. При этом жертвами часто становятся маленькие дети.

Наказание — это такие наши неприятные для собаки или болевые воздействия, которые мы совершаем уже после ненужного нам или неправильного с нашей точки зрения поведения собаки. То есть между проступком нашего пса и нашими воздействиями проходит какое-то время. Это главное отличие наказания. А если неприятное воздействие с нашей стороны совершается сразу по окончании нежелательного поведения или во время его, то это уже называется отрицательным подкреплением.

Вторым отличием наказания является его неизбежность. Как бы себя ни вела провинившаяся собака после проступка, мы считаем, что ее следует наказать. И наказываем.

Например, мы приходим вечером домой, и обнаруживаем в квартире Содом и Гоморру, и радостно встречающего нас щенка. С точки зрения среднестатистического хозяина собаки, мы должны его наказать, что мы и делаем. Это на самом деле наказание, ибо отдалено от проступка немалым количеством времени и оказалось неизбежным. Как, впрочем, и бесполезным, в чем вы убедитесь со временем сами. Но это одновременно и отрицательное подкрепление ритуалу встречи вашего щенка. И вы заметите, как щенок перестает радоваться вашему приходу и все чаще принимает позу подчинения (стыдится наделанного им беспорядка, но продолжает делать его!).

Или ваша собака что-то подобрала на улице и, тщательно пережевывая это что-то, подходит к вам, выполняя команду «Ко мне!». Вы, естественно, ее дерете аки сидорову козу, и это является наказанием для подбора пищи (и бесполезно, вы сами знаете), но и отрицательным подкреплением подхода к дрессировщику. Ваши действия приводят к тому, что собака перестает в такие моменты подходить к вам, а спокойно доедает подобранное в стороне.

И еще одна ситуация. Вам не нравится, что собака забирается на диван, и вы бы хотели исправить данное поведение. Вы входите в комнату и застаете на диване спящую собаку со счастливым выражением морды. Желая дать понять собаке, что она не права, и что вам не нравится такое поведение, вы ее шлепаете. Со временем собака начинает понимать вот что: когда она лежит на диване, ваше появление и угрожающие слова служат сигналом к быстрому спрыгиванию с дивана, чтобы избежать шлепка. То есть вы учите собаку быстро спрыгивать с дивана при помощи отрицательного подкрепления. Но шлепки ваши являются наказанием к тому самому залезанию на диван, с которым вы собрались бороться. Со временем вы сами убедитесь, что воспитательное значение этого наказания ничтожно. Об этом же говорит и вся история человечества в части борьбы с преступлениями при помощи наказания.

Почему наказание чаще всего бездейственно? Потому, что как следствие, очень отдалено от причины (проступка). Представьте себе — вы наказываете собаку через час после того, как она съела ваши тапочки. В течение этого часа собака совершила еще с десяток безобидных поступков. Как же ей понять, какое именно действие привело к неблагоприятным последствиям? Природа заставляет ее связывать последствия с последним по времени действием, что собака и делает.

Американский ученый Б. Скиннер, один из основоположников «Оперантного научения», показал, что результат, для того, чтобы стать подкреплением какому-либо действию, должен следовать за ним не позднее десяти секунд. Подчеркиваем, что это правило работает в естественной среде, когда животное может совершать в секунду массу самых разнообразных нужных и ненужных действий. И.П. Павлову в его знаменитой «Башне молчания» удавалось вырабатывать условные рефлексы при отставлении подкрепления до 30 минут и более от условного раздражителя. Такие рефлексы были названы отставленными условными рефлексами; оказалось, что они вырабатываются с трудом или не вырабатываются вовсе. И с точки зрения отечественной физиологии высшей нервной деятельности наказание можно определить как далеко отставленное отрицательное подкрепление.

Наказание не учит, не дает информацию животному о том, какое же поведение правильное. Собака, которую вы наказываете за съеденные тапочки, ничего не может понять, потому что в течение последнего часа она больше не ела никакой обуви. И вам бы порадоваться этому. И еще, наказание чаще всего учит тому, как не попадаться, а не тому, как правильное себя вести. Очень трудно для человека, а для животного практически невозможно изменить будущее поведение, чтобы в дальнейшем избежать его последствий.

Присмотритесь к себе — чаще всего, наказывая собаку, вы просто даете выход своим эмоциям и своим обидам на нее.

Опасно же наказание тем, что, как замечает К. Прайор, оно служит мощным подкреплением наказывающему. Если при помощи наказания нам удалось исправить (а это случается) поведение, то бессознательно мы все чаще и чаще начинаем прибегать к нему. А избыток отрицательных воздействий на молодое животное приводит к тому, что у него пропадает всякое желание воспитываться и дрессироваться, оно вырастает зашуганным и робким.

Наказание может помочь, когда оно не очень далеко отставлено и очень сильное, или неожиданное и непривычное, когда поведение, с которым вы боретесь, не очень закрепилось у собаки. То есть если бы за первое преступление отрубали руку, вряд ли бы возникло желание совершить второе.

Отрицательное подкрепление, по мнению Карен Прайор, это любое неприятное событие или ощущение, действие которого можно прекратить или избежать, изменив поведение. Отличие отрицательного подкрепления от наказания в том, что отрицательное подкрепление, как и положительное, происходит во время поведения, а не после него, и на него можно повлиять изменением поведения.

Для того чтобы понять отличия отрицательного подкрепления от наказания, давайте разберем следующий пример. Ваша собака лазает на диван. Вам это не нравится, и вы отучаете ее следующим образом — как только застаете на диване собаку, тут же кричите в ее адрес ругательные слова и задаете трепку. Как правило, наше агрессивное поведение прекращается сразу же, как только собака спрыгивает с дивана.

Если следовать вашей логике, то, благодаря вашим воздействиям, собака должна понять, что лазать на диван ей нельзя. Сначала собака понимает, что в случае ее локализации на диване грубый, резкий окрик хозяина означает: скорее слезай, чтобы избежать трепки.

Многие собаки достаточно быстро понимают, что появление хозяина, когда она лежит на диване, приводит к резкому окрику, а если с дивана не слезть, то схлопочешь. В результате ретируются с дивана сразу, как только на пороге комнаты появляется хозяин. Третьи идут еще дальше, они связывают наличие хозяина в квартире с ее агрессивным поведением во время диванного положения и в присутствии хозяина ведут себя, как паиньки. Когда же хозяина нет, все категории собак ведут себя одинаково — диванолюбиво. Почему? Да потому, что ваше неприятное воздействие на собаку выступает подкреплением (отрицательным или положительным — это еще вопрос) спрыгивания с дивана и является наказанием по отношению к залезанию на диван. То есть таким педагогическим воздействием вы обучаете собаку быстро спрыгивать с дивана по команде (в данном случае это сложная команда или комплексный раздражитель: ваш вид и осуждающий крик).

Таким образом, хотелось бы показать, что отрицательное подкрепление (как, впрочем, и положительное) какому-то действию или поведению происходит во время этого действия или в конце его, и на его появление, интенсивность и знак можно повлиять, изменив или прекратив именно это поведение. Тогда как наказание, о котором мы говорили ранее, происходит через некоторое время после совершения проступка.

А как же отучить собаку залезать на диван? Нужно придумать нечто такое, что делало бы неприятным именно это действие. Например, можно поставить на диване заряженные мышеловки. А одного добермана, который со всего размаха шлепался на диван, отучили так: разложили на диване остриями вверх шиферные кнопки и прикрыли их покрывалом. Для отучения оказалось достаточным одного доберманьего прыжка. Более того, бедняга начинал активно сопротивляться при попытке затащить его на диван.

Отрицательное подкрепление очень эффективный способ формирования поведения. Но это не делает его лучшим. Последите за собой: в общении с людьми и собаками мы в основном пользуемся именно им. Нам почему-то кажется, что правильное хорошее поведение — это норма. Так и должно быть, и чего тут радоваться и хвалить? Поэтому и не замечаем, а что самое плохое — и не подкрепляем положительно нужное нам поведение. Мы его как будто не замечаем, а обращаем внимание только на огрехи.

Но слишком частое применение отрицательного подкрепления приводит, особенно у щенков, к появлению робости, неуверенности и себе, тревожности и отбивает охоту от самого процесса дрессировки. Потому, что собака в первую очередь начинает понимать — появление нового навыка увеличивает возможность дополнительного получения отрицательного подкрепления. А его она, естественно, стремится избежать. Кстати, классическая дрессировка оттого и является классической, что строится в основном на отрицательном подкреплении.

Применяя отрицательное подкрепление, вы должны научиться прекращать его сразу же, как только поведение собаки улучшилось (изменилось) хоть немножечко, и обязательно давать возможность животному компенсировать наличие отрицательных эмоций получением положительного подкрепления.

Вы заметили, что я сказала «положительное наказание», а не просто наказание. В повседневной речи мы часто говорим о наказании, когда то, что мы технически под этим подразумеваем, является положительным наказанием. У нас также может быть отрицательное наказание, но это будет тема другого поста.

«Наказание» означает что-то, что уменьшает вероятность повторения поведения, т.е. снижается частота проявления подобного поведения. А «положительное» означает, что что-то добавлено.

Таким образом, положительное наказание означает добавление чего-то после того, как собака совершила поведение, что снижает частоту проявления этого поведения.

Например, если собака прыгает на вас, вы можете ударить ее коленом в грудь, и в следующий раз, когда вы увидитесь собака не будет прыгать, т.е. вы положительно наказали прыгающую собаку. Вы добавили что-то (неприятное ощущение толчка от колена в грудь) и снизили частоту проявления поведения.

Пожалуйста, обратите внимание: я не рекомендую этот способ обучения собаки, и мы доберемся до причин почему чуть позже. И он также может не сработать (например, если собака воспринимает это как игру и продолжает прыгать, и в этом случае это не работает как наказание).

Примеры положительного наказания

Существует множество примеров положительного наказания: , отшлепать с помощью газеты, использовать ошейник с аэрозолем цитронеллы, чтобы прекратить лай (когда собака залает — выплескивается струя с запахом цитронеллы), альфа-переворот или «доминирование», когда собаку укладывают на бок или переворачивают на спину и удерживают в таком положении после того, как она сделала что-то, что не понравилось владельцу; применение строгого ошейника, который врезается в шею собаки, когда она тянет на поводке, удары собаки поводком или резкие рывки, когда она делает то, что не нравится владельцу, использование электрошокового ошейника, чтобы прекратить то, что собака делает и т.д.

Это не исчерпывающий список, и вы, возможно, видели и другие виды положительного наказания.

В повседневном языке некоторые из них называются «коррекцией». Например, рывок поводком, чтобы собака села, когда ее попросили, часто называется «коррекцией поводком».

Но важно понимать, что это все то же положительное наказание. Другими словами, вы все равно добавили что-то (рывок поводком, который собака чувствует на шее), что должно уменьшить вероятность возникновения поведения.

Одна из причин, по которой важно помнить об этом, заключается в том, что дрессировка собак никак не регулируется, и иногда тренеры собак не очень разбираются в методах, которые они используют. К сожалению, люди иногда говорят, что это не наказание. Даже в некоторых популярных книгах объяснения могут быть весьма запутанными и не ясными (Browne et al., 2017). Это затрудняет для обычных людей понимание того, что тренер на самом деле собирается делать с их собакой.

Но я попробовал на себе и это мне не повредило!

Иногда люди говорят, что они повесили строгий ошейник на свою руку и потянули, и это им не повредило. Иногда люди повторяют этот опыт с электрошоковым ошейником. Поэтому они считают, что это нормально использовать их на своей собаке.

Проблема состоит в том, что обычно они контролируют натяжение строгого ошейника и силу удара током, потому что они сами делают это (или это делает кто-то другой, но они знают, когда это произойдет).

Это может звучать как незначительная деталь, но это имеет большое значение. Одно дело иметь контроль над ним, и совершенно другое — если это случается с вами совершенно неожиданно, и если подобное повторяется и продолжается.

Отсутствие контроля над чем-то само по себе может стать источником стресса.

Другой момент, о котором следует помнить, — это то, как это работает. Чтобы оно сработало, чтобы остановить поведение, животное должно посчитать его неприятным (если ему понравилось или оно даже не заметило, это не уменьшит частоту проявления поведения).

И, наконец, кожа на шее вашей собаки на самом деле очень тонкая. San Francisco SPCA сообщает , что «кожа на шее человека на самом деле толще (10-15 слоев клеток), чем кожа на шее собаки (3-5 слоев)». У них много полезных ресурсов , если вы хотите узнать больше о строгих ошейниках (англ.).

Мы склонны думать, что поскольку у собак есть шерсть, они должны быть более защищены от подобных вещей, чем мы с нашей голой кожей. Но шея собаки — очень чувствительная область. Если вы вспомните анатомию шеи, то она содержит важные органы, например, трахею. Приложение давление к трахее не проходит даром для любой собаки, но может быть особенно опасным для брахиоцефалических пород, которым и так сложно дышать.

Так что приложить что-то к руке — это не самый надежный способ испытать, что почувствует ваша собака (существует, конечно, более философский вопрос о том, что чувствует собака, но в этом случае я предлагаю вам прочитать ).

Но разве моя собака не пытается доминировать?

На самом деле ученые согласны с тем, что доминирование — это не способ обучения собак. Теория доминирования раньше была очень распространена (вы и сейчас все равно можете встретить ее в некоторых книгах, телепередачах и услышать от тренеров), но это устаревший подход к обучению собак.

Одна из проблем с подходом с точки зрения доминирования заключается в том, что он предполагает, что собака всегда пытается доминировать над вами. Прежде всего это не так, и во-вторых, он описывает ваши отношения с собакой как состязание. И это может убедить людей использовать положительное наказание (например, альфа-переворот), потому что они думают, что это рекомендует наука, но это не так.

Некоторые из вещей, которые люди относят к доминированию, включают движение впереди вас, когда собака на поводке, проход первым в дверь, прием пищи первым, залезание на диван или кровать. Люди говорили мне, что они беспокоятся, что их собака станет непослушной, потому что им нравится позволять ей сидеть на кушетке с ними.

Позвольте мне успокоить вас, что вполне нормально позволять вашей собаке сидеть на кушетке, если вы этого хотите. Это одинаково хорошо, если вы предпочитаете, чтобы она не делала этого; просто предоставьте собаке хорошую лежанку и вознаградите ее за ее использование (вы даже можете спрятать там кусочек корма, чтобы сделать собаке приятный сюрприз, когда она ляжет спать). Таким образом она полюбит свой лежак больше, чем кушетку. И вы даже можете научить ее идти туда по команде, если это требуется.

Точно также нормально, если собака идет впереди вас, первой выходит в дверь и первой получает свою порцию еды. Просто решите, что удобно для вас и придерживайтесь этого.

С другой стороны, если собака идет впереди вас, потому что она идет на натянутом поводке, то это не ваша собака доминирует, это просто собака, которая хочет идти быстрее, потому что где-то там есть что-то очень интересное, и она хочет получить это побыстрее. Вы можете использовать специальную корректирующую шлейку наподобие Easy Walk, чтобы облегчить свое передвижение с собакой, которая к тому же не вызывает стресс (Grainger, Mills and Montrose 2016).

Существуют ли риски при использовании положительного наказания?

К сожалению, научные исследования различных методов обучения собак показывают, что существуют потенциальные риски при использовании положительного наказания, который является аверсивным методом.

В своем обзоре научной литературы по обучению собак Ziv (2017) сообщает:

«Не смотря на методологические проблемы, похоже, что аверсивные методы дрессировки имеют нежелательные непреднамеренные результаты, и что их использование ставит под угрозу благополучие собак. Кроме того, не существует никаких доказательств того, что аверсивные методы более эффективны, чем методы обучения, основанные на поощрении. По крайней мере 3 исследования в этом обзоре демонстрируют, что противоположное может быть правдой в отношении как домашних, так и рабочих собак. Поэтому рекомендуется, чтобы сообщество использовало в основе обучения собак поощрение и избегало, насколько это возможно, аверсивных методов обучения».

Некоторые из проблем, которые, как сообщается, являются следствием применения положительного наказания в обучении собак, это увеличение страха, агрессии и стресса.

В одном исследовании был обнаружен агрессивный отклик у собак при применении положительного наказания (Herron, Reisner и Shofer, 2009). Например, 11% собак были агрессивны в ответ на использование строгого ошейника или удавки, 15% когда собаке кричали «нет», и 43%, когда собаку били или пинали.

Чем чаще люди используют положительное наказание, тем больше вероятность того, что они сообщают, что их собака агрессивна и / или возбудима (Arhant et al., 2010). Использование аверсивных методов обучения является фактором риска для агрессии по отношению к незнакомым людям и членам семьи (Casey и соавт 2010). И то, что удивляет некоторых людей, заключается в том, что люди, которые говорят об использовании положительного наказания при обучении собак, с большей вероятностью сообщают о проблемах поведения (Hiby, Rooney and Bradshaw, 2004). Подобное также имеет место быть, когда мы сравним тех, кто использует электрошоковый ошейник, с теми, кто использует положительное подкрепление при обучении подзыву (подходу по команде). Люди, которые используют ЭШО были менее успешны в обучении, чем они ожидали (Blackwell et al 2012).

Иногда люди говорят, что они используют ЭШО, потому что считают, что его более эффективным. Фактически в экспериментальном исследовании, в котором участвовали профессиональные тренеры собак, не были никакой разницы в эффективности применения электрошокового ошейника по сравнению с положительным подкреплением для обучения подзыву в присутствии скота (овцы) (Cooper et al., 2014). Но были проблемы с благополучием собаки при использовании ЭШО.

«Похоже, что рутинное использование электрошоковых ошейников даже при наличии опыта (как утверждают производители ЭШО) представляет риск для здоровья собак. Ожидается, что масштабы этого риска возрастут, когда его будет использовать не профессионал.»

Что говорят профессиональные организации об использовании положительного наказания в обучении собак?

«Исследования показывают, что собак не нужно физически наказывать, чтобы обучить правильно вести себя, и существуют значительные риски, связанные с использованием наказания (например, торможение обучения, увеличение страха и / или провоцирование агрессии).

Поэтому следует избегать тренеров, которые обычно используют строгие ошейники, удавки, электрошоковые ошейниники и другие методы физического наказания в качестве основного метода обучения».

А как насчет трусливых, тревожных или агрессивных собак?

Иногда люди думают, что положительное наказание — единственное, что будет работать на агрессивной собаке. К сожалению, использование аверсивных техник может привести к тому, что собака станет более агрессивной. Причиной агрессии часто является страх и беспокойство, и использование положительного наказания не делает ничего, чтобы устранить их.

Один из рискованных сценариев — когда собака наказывается за рычание, потому что владелец не любит, когда на него рычат. Но он ничего не делает, чтобы разобраться с причиной, по которой собака рычит (например, может быть собака боится и хочет, чтобы кто-то держался от нее подальше, или она рычит, когда у нее отбирают миску с кормом).

Что происходит в этом случае? Собака учится не рычать, но проблема, которая вызывала такое поведение, все еще существует. Наказание не делает ничего, чтобы помочь собаке полюбить людей или довериться им. Вполне возможно, что в следующий раз вместо рычания, она просто укусит.

Если собака рычит на вас, вы должны прекратить делать то, что делаете. Спросите себя, почему она рычит. Затем найдите другое решение, даже если это долгосрочный подход, который требует помощи тренера для собак.

Если ваша собака боится или беспокоится, тогда особенно важно не использовать положительное наказание, поскольку это только усугубит страх или тревогу. Это может также заставить собаку бояться вас, если они свяжут вас с источником наказания. Опять же, вам может потребоваться найти хорошего тренера собак, чтобы помочь решить вашу проблему.

Разве мы не должны использовать все доступные инструменты?

Некоторым людям нравится использовать сочетание положительного подкрепления и положительного наказания для обучения своей собаки. Обычно это называется «сбалансированным» обучением собак.

Однако с этим «сбалансированным» обучением собак есть ряд проблем. Риски применения наказания не исчезают только потому, что иногда вы предлагаете собаке лакомства или игру. Это очевидно из некоторых упомянутых выше исследований, где многие участники использовали как положительное подкрепление, так и положительное наказание.

Просто потому, что доступен целый ряд методов, это не означает, что вы должны использовать их все.

К счастью, в наши дни доступны инструменты, такие как корректирующие шлейки (например, Easy Walk) и автоматические дозаторы корма, поэтому сейчас есть гораздо больше вариантов, чем раньше, для людей, которые хотят альтернативы наказанию. И есть гораздо больше информации в книгах, на телевидении и в Интернете, чем раньше, поэтому, если вы ищете информацию, там она есть (но вы все равно должны быть очень осторожны с вашими источниками, так как также есть много ошибочной информации о дрессировке собак).

Это зависит от вас, как владельца собаки, использовать методы, которые, по вашему мнению, безопасны для вашей собаки и будут работать. Если тренер по собакам предлагает метод, который вас не устраивает, ищите другого тренера.

Как я должен тренировать свою собаку?

Если вы привыкли думать о дрессировке, как о способе отучить собаку от какого-то занятия, тогда вам следует подумать, чему бы вы хотели бы научить свою собаку делать вместо этого.

Например, вы не хотите, чтобы ваша собака прыгала на людей, которые приходят к вам или прохожих на улице. У вас есть несколько вариантов того, чему можно обучить собаку в таком случае. Может быть, вы захотите, чтобы собака садилась, чтобы ее погладили. Возможно, вы хотели бы научить собаку касаться носом руки человека, поэтому собака получит возможность понюхать человека, но все ее четыре лапы останутся на земле. Может быть, вы действительно не возражаете, если не все эти лапы остаются на земле. Или, может быть, вам просто хотелось бы, чтобы собака могла ходить рядом, а не бегать ко всем встречным людям в мире.

Все это возможно, и что вы выбирете, зависит от вас. Ваша собака демонстрирует очень распространенное, доброжелательное поведение, когда прыгает на людей, чтобы приветствовать их, но вы можете обучить ее, чтобы она приветствовала их так, как вам хотелось бы.

Вместо того, чтобы использовать положительное наказание за неправильное поведение, попробуйте подумать об использовании положительного подкрепления, чтобы обучить вашу собаку тому, что нужно делать. Это лучше для вашей собаки, потому что это позволяет избежать рисков, связанных с положительным наказанием. И есть и другие преимущества использования положительного подкрепления в обучении собак, которые здесь не рассматриваются.

И если вам нужна помощь, вы всегда можете нанять тренера для собаки. Просто помните, что дрессировка собак никак не регулируется, поэтому будьте осторожны в выборе хорошего тренера для своей собаки.

Заключение

Когда люди говорят о наказании в обучении собак, часто они подразумевают то, что технически известно как положительное наказание.

Положительное наказание означает добавление чего-то, чтобы снизить вероятность поведения, например, использовать рывок, альфа-переворот или ударить собаку. Хотя многие люди по-прежнему используют положительное наказание для обучения своей собаки хотя бы иногда, есть риски, связанные с ее применением, в том числе риски страха, тревожности, стресса и агрессии. Также возможно, что собака свяжет наказание с владельцем, и поэтому станет бояться его. Метод положительного подкрепления лучше для благополучия животных, и есть даже несколько исследований, которые предполагают, что они работают лучше.

Я закончу цитатой из Hiby, Rooney и Bradshaw (2004).

«Поскольку методы, основанные на поощрении, связаны с более высоким уровнем послушания и меньшим количеством проблемного поведения, мы предлагаем их использование в качестве более эффективной и положительно влияющей на благополучие альтернативы наказанию для обычного владельца собаки».

Мы должны решить, как обучать наших собак, но имеет смысл использовать методы, которые хороши для благополучия собак.

Ссылки

Arhant, C., Bubna-Littitz, H., Bartels, A., Futschik, A., & Troxler, J. (2010). Behaviour of smaller and larger dogs: effects of training methods, inconsistency of owner behaviour and level of engagement in activities with the dog. Applied Animal Behaviour Science, 123(3), 131-142. https://doi.org/10.1016/j.applanim.2010.01.003
Blackwell, E. J., Bolster, C., Richards, G., Loftus, B. A., & Casey, R. A. (2012). The use of electronic collars for training domestic dogs: estimated prevalence, reasons and risk factors for use, and owner perceived success as compared to other training methods. BMC Veterinary Research, 8(1), 93. https://doi.org/10.1186/1746-6148-8-93
Cooper, J. J., Cracknell, N., Hardiman, J., Wright, H., & Mills, D. (2014). The welfare consequences and efficacy of training pet dogs with remote electronic training collars in comparison to reward based training. PloS one, 9(9), e102722 .
Grainger, J., Wills, A. P., & Montrose, V. T. (2016). The behavioral effects of walking on a collar and harness in domestic dogs (Canis familiaris). Journal of Veterinary Behavior: Clinical Applications and Research, 14, 60-64. https://doi.org/10.1016/j.jveb.2016.06.002
Herron, M. E., Shofer, F. S., & Reisner, I. R. (2009). Survey of the use and outcome of confrontational and non-confrontational training methods in client-owned dogs showing undesired behaviors. Applied Animal Behaviour Science, 117(1), 47-54. https://doi.org/10.1016/j.applanim.2008.12.011
Hiby, E. F., Rooney, N. J., & Bradshaw, J. W. S. (2004). Dog training methods: their use, effectiveness and interaction with behaviour and welfare . Animal Welfare-Potters Bar then Wheathamstead, 13(1), 63-70.
Ziv, G. (2017). The Effects of Using Aversive Training Methods in Dogs–A Review. Journal of Veterinary Behavior: Clinical Applications and Research.

Подрастающие бордер-колли — великолепные дрессировщики.

Блинк, мой третий пёс, был первым, кто выдрессировал меня давать ему воду по требованию. Однажды, когда мы вместе были в кухне, он умышленно ударил лапой пустую миску для воды. «Дзынь!» — раздался звук от удара когтей по керамике. Затем Блинк посмотрел мне прямо в глаза. Я сделала то, что сделало бы любое хорошо обученное животное: отреагировала на сигнал и наполнила миску водой. По прошествии нескольких недель сцена в кухне повторилась. «Дзынь!» — я снова налила в миску воды. Прошло ещё немного времени, и в следующий раз я была в гостиной, а Блинк в кухне. «Дзынь!» — и я снова налила воду в миску.

Это я учила Блинка, что звяканье миски означало, что сейчас в неё нальют воду, или он учил меня выполнять команду «Дзынь!»? И то, и другое.

Каждый раз наливая воду миску, я подкрепляла звуки, которые вызывал Блинк. Он же вилял хвостом, радостно пил и выглядел благодарным (да, знаю, антропоморфизм) — и этим подкреплял наполнение миски водой.

Как и наши собаки, на ранней стадии дрессировки я не знала, что меня также дрессировали. В какой-то момент процесса обучения (надо признать, быстрого), я сообразила, что должна бы дать собаке воду. Затем в другой раз я ясно поняла, что у меня есть различительный стимул (сигнал), который означал одну и только одну вещь: сейчас же дай мне воды.

Попутно Блинк сделал несколько осознанных решений. Он выбрал сигнал, а не я. Он мог бы скулить, лаять, ставить лапы на меня и т.д., но выбрал сигнал, который включал объект (миску), в котором обычно находилась вода. Его сигнал также является звуком, который не входит в типичный звуковой репертуар собак (типа лая или скуления). Чтобы издать его, псу надо было задействовать лапу и определённым образом ударить ей по предмету.

Поскольку я хорошо справлялась с доставкой воды, Блинк закрепил сигнал, проверяя качество стимульного контроля. Он попробовал «Дзынь!» на другом домочадце. Потом распространил сигнал на миску в моём рабочем кабинете. И даже стал звинеть миской в чужом доме — чужой миской и перед чужим человеком. Однажды, когда моя коллега осталась с Блинком за няньку, собака дала ей понять, что вода закончилась, дзынькнув миской. Когда коллега с готовностью выполнила команду, бьюсь об заклад, Блинк был очень доволен и собой, и человеком!

Четыре квадранта

Хотя я считаю Блинка довольно умным малым, ему не надо быть необычайно одарённым представителем своего вида, чтобы вычислить, как научить меня наливать ему воду. Собаки дрессируют людей делать разные вещи, которые им нравятся: покорми меня, выпусти на улицу, почеши животик, возьми на ручки, погладь меня, брось мне вон то и т.д. А мы дрессируем их делать то, что выгодно нам: спокойно сидеть, идти рядом, искать того плохого парня или потерявшегося ребёнка, подносить предметы и др.

Собаки никогда не слышали о Павлове и Скиннере. Никто не усаживал их за парту и не рассказывал о четырёх квадрантах оперантного обучения и законах научения. Да, они опытные дрессировщики. Однако пользуются не только положительным подкреплением! Дрессируя нас, животные эффективно используют все четыре квадранта. Вот несколько примеров (могу поспорить, вы сами можете привести десяток своих).

Положительное наказание:

Человек: (обычно думает: «Все собаки ЛЮБЯТ меня!») навязчиво хочет подойти к пугливой собаке.

Собака: облизывает губы, отворачивается, прячется за хозяина и в конце концов бросается и лает.

Результат: человек отступает. Попытка приблизиться к той собаке положительно наказана .

Отрицательное наказание:

Человек: похлопывает собаку по макушке (бам-бам-бам).

Собака: моментально отодвигается и собирается лечь.

Результат: человек понимает, что собаке не нравится, когда её трогают за голову, и прекращает делать это. Похлопывание по макушке было отрицательно наказано.

Отрицательное подкрепление:

Человек: сидит за столом, игнорируя собаку.

Собака: скребёт хозяина лапой.

Результат: человек смягчается и уделяет собаке немного внимания, чтобы прекратить домогательства собаки. Привлечение внимания было отрицательно подкреплено.

Положительное подкрепление:

Человек: смотрит на собаку и улыбается.

Собака: подходит ближе и предлагает мягкий длительный визуальный контакт.

Результат: улыбка в адрес собаки была положительно подкреплена .

В то время как у людей часты проблемы с таймингом (особенно при наказании), у собак он безупречен — и безо всякого обучения! Люди орут на собак за изжёванные подушки часы спустя «преступления». Единственная вещь, за которую мы «наказываем» собаку — это то, что она вышла поздороваться, когда мы вернулись домой после целого дня отсутствия. С одной стороны, когда собаки наказывают, это наказание с идеальным таймингом и потрясающей точностью. Собака клацает зубами так близко от вас — и так точно, что не причиняет вреда, но этого достаточно, чтобы напугать вас одним-единственным выпадом. Покажите мне человека, который способен проделать это без тренировки.

Вы почти наверняка слышали фразу: «Собаки всегда учатся». Это совершенная правда. И я думаю, что мы можем добавить к этому: «Собаки всегда учат». Хорошее занятие — это разговор между учителем и учеником. Я думаю, чем больше мы понимаем, что роль учителя изменчива и что иногда мы становимся учениками, тем лучше это сказывается на наших с животными взаимоотношениях.

Перевод: «Плохие собаки»

Подкрепление и наказание играют ключевую роль в процессе научения. Большинство экспертов согласны в том, что подкрепление важнее наказания. Первым теоретическим обоснованием принципа подкрепления при научении, который и поныне является ведущим, стал классический закон американского психолога Торндайка - закон эффекта.

Закон эффекта

По словам самого Торндайка, закон эффекта (lawofeffect ) гласит: «Из нескольких реакций индивидуума на одну и ту же ситуацию с большей вероятностью будут повторены те из них, которые сопровождаются или за которыми близко следует удовлетворение (подкрепление)... те же, которые сопровождаются дискомфортом (наказанием) ... будут повторены с меньшей вероятностью». С точки зрения практики большинство ученых-бихевиористов, даже имеющих когнитивную ориентацию, в целом признают обоснованность этого закона. Он неод-

нократно проявлялся в строго контролируемых экспериментах по научению, и его действие можно непосредственно наблюдать в повседневной учебной практике.

Хотя закон эффекта широко признан, бывают случаи, когда когнитивная рационализация со стороны личности может его нейтрализовать. Так, например, на лиц с неадекватной самоэффективностью могут не влиять последствия их действий. На рабочем месте это обстоятельство оказывается серьезной проблемой для менеджеров. Лица с неадекватной самоэффективностью, у которых раз за разом случаются неудачи в работе, не учатся на своих ошибках и не реагируют на рекомендации менеджера. Эти люди обладают высокой самоэффективностью (считают, что формы их поведения способствуют успешному выполнению задачи), но они ошибаются.

Несмотря на теоретические дискуссии, немногие могут оспорить важность подкрепления в процессе научения. Теоретические усилия, предпринятые вне закона эффекта, потерпели неудачу в попытке всесторонне объяснить феномен подкрепления.

Определение подкрепления

Часто цитируемое определение подкрепления, не выходящее, правда, из порочного логического круга, характеризует его как все то, что человек воспринимает в качестве поощрения. Это определение не очень ценно, ибо использует слова «подкрепление» и «поощрение» как взаимозаменяемые при том, что ни одно из них не имеет собственного операционального определения. Более операциональное определение: подкрепление (reinforcement ) может быть определено как то, что повышает интенсивность ответной реакции и стимулирует к повторению ведения, которое предшествовало подкреплению.

Вознаграждение - это всего лишь то, что считает желаемым лицо, предоставляющее вознаграждение. Подкрепление определено функционально. Нечто является подкреплением лишь в случае, если оно усиливает реакцию, ему предшествующую, и стимулирует повторение этой реакции. Например, менеджер, казалось бы, вознаграждает работника, который обнаружил ошибку в отчете, похвалив его публично. Однако при ближайшем рассмотрении выясняется, что коллеги раздражены поведением этого работника и осуждают его, поэтому в будущем частота обнаружения ошибок может уменьшиться. В этом примере «вознаграждение» не является подкреплением. И все же, несмотря на формальную разницу между подкреплением и вознаграждением, оба термина нередко используются как взаимозаменяемые.

Чтобы лучше понять сущность подкрепления, следует разграничить подкрепление позитивное и негативное.

Позитивное и негативное подкрепление

Существует большая путаница в терминах «позитивное подкрепление», «негативное подкрепление» и «наказание». Прежде всего, необходимо понять, что подкрепление, позитивное или негативное, усиливает ответную реакцию и повышает вероятность ее повторения, однако позитивное и негативное подкрепление оказывает воздействие на поведение совершено разными путями. Позитивное подкрепление усиливает и повышает вероятность поведения тем, что демонстрирует его желаемые последствия. Негативное подкрепление усиливает и повышает вероятность поведения тем, что прекращает или устраняет его нежелательные последствия.

		Последствие
		Вознаграждение (нечто желаемое)	Пагубные стимулы (нечто неприятное, нежелательное)
Обстоятельство	Применение	ПОЗИТИВНОЕ ПОДКРЕПЛЕНИЕ	НАКАЗАНИЕ
Обстоятельство	Устранение	НАКАЗАНИЕ (поведенческая реакция ослабевает)	НЕГАТИВНОЕ ПОДКРЕПЛЕНИЕ (поведенческая реакция нарастает)

Рис. 7.1. Сводная таблица операциональных определений позитивного и негативного подкрепления и наказания

Негативное подкрепление - явление более сложное, чем подкрепление позитивное, однако не следует приравнивать его к наказанию. По существу, они оказывают на поведение противоположные воздействия. Негативное подкрепление усиливает желательное поведение и делает его более вероятным, в то время как наказание ослабляет его и делает менее вероятным. На самом деле негативное подкрепление - это своего рода социальный шантаж, поскольку побуждает личность поступать определенным образом, чтобы избежать наказания.

Значение и использование наказания

Наказание Является одним из наиболее применяемых, хотя и наименее понятых и плохо управляемых аспектов научения. Для изменения поведения или контроля за ним - будь то воспитание детей или руководство подчиненными в сложной организации - родители и менеджеры, вместо того чтобы использовать позитивное подкрепление, часто обращаются к наказанию. Обычно считается, что наказание противоположно подкреплению, но столь же эффективно для изменения поведения. Однако эта простая аналогия с подкреплением может и не иметь достаточных оснований. Дело в том, что наказание - явление весьма сложное и его следует тщательно изучить и использовать с осторожностью.

Наказание - это все, что ослабляет поведение и уменьшает вероятность его повторения. Наказание обычно заключается в применении нежелательных действий и появлении пагубных последствий, однако, как показано на рис. 7.1, его также можно определить как устранение желательных последствий. Например, лишение менеджера с плохими показателями деятельности некоторых организационных привилегий можно рассматривать как наказание.

Независимо от различий между наказанием в форме получения нежелательных последствий и в форме устранения желательных последствий можно сказать, что наказание подействовало, если имеет место ослабление и снижение интенсивности поведения, которое ему предшествовало. До тех пор пока поведение работника, которому начальник сделал словесное замечание, не изменится в лучшую сторону, нельзя утверждать, что это замечание было наказанием. Во многих случаях, когда руководители считают, что наказывают работников, на самом деле они закрепляют их поведение, поскольку оказывают работникам внимание, а внимание является важным фактором подкрепления.

- Приведите примеры

Мнения относительно применения наказаний широко разнятся - от заклинаний никогда их не использовать до утверждения, что наказание является единственным эффективным методом изменить поведение. Пока исследования не дают оснований полностью поддержать ни ту, ни другую точку зрения. Однако мало сомнений в том, что наказание может вызвать много нежелательных побочных эффектов. Поведение наказуемого скорее всего будет лишь временно подавлено, но не полностью изменено, и он будет чувствовать напряжение, озлобление и обиду на того, кто его наказал. Таким образом, применение наказания в качестве стратегии контроля за поведением является подходом, в результате которого обе стороны проигрывают. Если наказание не является очень суровым, нежелательное поведение проявится очень скоро вновь. Однако чем более сурово наказание, тем сильнее его побочные эффекты.

Для минимизации проблем тот, кто использует наказание, должен всегда предоставлять приемлемую альтернативу наказуемому поведению. Наказание всегда должно следовать за нежелательным поведением как можно ближе по времени. Неэффективно вызывать подчиненных «на ковер» и делать выговор за нарушение какого-то правила, происшедшее неделю назад. Такого рода выговор является всего лишь наказанием за то, что их поймали на нарушении. Наказание за поведение, связанное с нарушением правил, малоэффективно. При осуществлении наказания необходимо помнить, что оно оказывает воздействие также на тех, кто его наблюдает и имеет отношение к происшедшим событиям.

На практике менеджеры по персоналу должны реализовать следующий принцип: чтобы изменить поведение, всегда стремитесь использовать подкрепление вместо наказания. Более того, стратегия подкрепления обычно более эффективна для повышения частоты возникнове-

ния желаемого поведения, нежели наказание - для торможения нежелательного поведения, поскольку подкрепление не сопровождается какими-либо побочными эффектами.

Пожалуй, лучшим практическим советом может быть старое дисциплинарное правило: наказанию должно предшествовать предупреждение, и оно должно быть немедленным, последовательным и не задевать достоинства личности. Кроме того, наказание должно соответствовать ситуации и усиливаться постепенно.