В случае же целенаправленного обучения (дрессировки) преграды на пути достижения животным конечного приспособительного результата ставит человек. Так, в естественной среде обитания голодный волк, прежде чем удовлетворит свою естественную работу: выследить зверя, догнать его, тем или иным путём умертвить, разделать тушу, отогнать конкурентов и т.д. Волк в цирке или эксперименте, чтобы удовлетворить свою потребность в пище, вынужден также выполнять определённую работу (преодолевать преграду), по совершении которой он, как и его дикий собрат, получит пищу и сможет утолить голод. В том и другом случае результатом поведения остаётся получение подкрепления за проделанную работу.
Используя методологические принципы теории функциональных систем, существующие методы обучения и дрессировки можно представить следующим образом.
III.3. Классификация методов дрессировки
Существующие методы дрессировки можно классифицировать как те или иные способы воздействий дрессировщика на потребностно-мотивационную сферу деятельности животных:
а) механический метод дрессировки, или формирование у собаки поведения активного избегания неприятных воздействий;
б) пищевой метод дрессировки, или метод формирования ук животных истиной пищевой мотивации. Высокоэффективный метод дрессировки, который позволяет включить собаку в процесс дрессировки в качестве активного участника. Активное участие собаки в процессе дрессировки объясняется тем, что всегда активно стремится заработать кусочек пищи. После того как собака начинает понимать, что, выполнив определённую работу (заработав). Она получит кусочек пищи, а потом ещё и ещё кусочки, её желание выполнить какую-либо работу резко возрастает;
в) вкусопоощрительный метод дрессировки, или метод формирования у собаки мотивации избирательного аппетита. В отличие от «пищевого» метода дрессировки, собака в условиях этого метода дрессировки, собака в условиях этого метода не испытывает реальной потребности в пище (питательных веществах), поэтому нет мощной мотивации, постоянно побуждающей собаку к выполнению той или иной работы. Однако и этим методом собаку можно дрессировать эффективно, так как, несмотря на то что собака сыта, у неё сохраняется потребность в каком-нибудь лакомстве (например, копчёной колбасе, сыре, печенье и т.д.). Однако использование этого метода дрессировки ограничено и может быть эффективным, когда собака видит, обоняет или каким-либо другим способом непосредственно ощущает лакомство;
г) подражательный метод дрессировки, или формирование подражательного поведения у одной особи по отношению к поведению, демонстрируемой другой особью (другими особями, группой особей);
д) игровой метод дрессировки, или формирование того или иного игрового поведения собаки с целью использования его при обучении желательному навыку;
е) методы развития злобы, или формирование у собаки оборонительного поведения, в той или иной форме агрессии (либо базирующейся на самообороне собаки, либо агрессии, сопровождающейся активным нападением, сформированной на базе различных конфликтных ситуаций);
ж) контрастный метод дрессировки, или последовательное применение отрицательных подкрепляющих воздействий (вызывающих мотивацию пассивного избегания) вплоть до выполнения навыка, а в момент его выполнения или сразу после выполнения — положительных подкреплений воздействия (пища, лакомство, игра и т.д.).
III.4. Ещё раз о подкреплении
Так как в процессе обучения собаки, при формировании того или иного навыка животное достигает не только результата, удовлетворяющего его метаболическую или социальную потребность, но и эмоционально-подкрепляющего результата, перечисленные воздействия на потребностно-мотивационную сферу деятельности собак необходимо также рассматривать как положительные или отрицательные подкрепляющие воздействия. Описание основных правил применения положительных и отрицательных подкрепляющих воздействий при обучении и дрессировке собак и дальнейшем значительно упростит понимание закономерностей, лежащих в их основе.
Положительные подкрепляющие воздействия — это воздействия на собаку, совпадение по времени с каким-либо её действием и вызывающие у неё при этом положительные эмоции. То есть такие воздействия, которые увеличивают вероятность появления того или иного поведения и являются теми самыми результатами, которых достигает собака в процессе реализации поведенческого навыка. В качестве положительных подкрепляющих воздействий можно использовать пищу, лакомство, ласку, игру и другие формы позитивных воздействий.
Отрицательные подкрепляющие воздействия — это воздействия на собаку, совпадающие по времени с каким-либо её действием и вызывающие у неё отрицательные эмоции. Отрицательные воздействия призваны сформировать у собаки желание избежать повторного совершения этого действия (мотивацию активного избегания или агрессии). В качестве отрицательных воздействий можно использовать рывки поводком (различной степени силы) и любые другие неприятные для собаки воздействия, например голос в угрожающих интонациях.
Наказание, в отличие от отрицательных подкрепляющих воздействий, производится уже после совершения нежелательного поведения (то есть когда собака уже достигла какого-то результата, нежелательного для дрессировщика, например, подобрала и съела лежащий на земле корм или подралась с другой собакой и поэтому воздействует на собаку менее эффективно.
Основные правила применения положительных и отрицательных подкрепляющих воздействий.
1. Воздействия должны производится в момент совершения действия или сразу после него, иначе их применение малоэффективно. Это объясняется тем, что помимо приятных или неприятных ощущений положительные или отрицательные подкрепляющие воздействия несут собаке ещё и информацию о том, что именно в её поведении нравится дрессировщику, а что нет. Поэтому запаздывающие подкрепляющие воздействия — наигрубейшая ошибка дрессировщика.
2. Отрицательные подкрепления воздействия должны сразу же прекращаться, как только прекратилось нежелательное действие собаки, чтобы собака могла активно избежать неприятного для неё воздействия и достигнуть при этом приспособительного результата. Отрицательные воздействия нужно строго дозировать (силу и длительность); при отработке приёмов общего послушания они не должны вызывать у собаки ни страха, ни агрессии.
3. Размеры кусочков пищи, используемых в качестве положительных подкрепляющих воздействий, варьируют в зависимости от размеров собаки, но общим правилом при этом является максимально возможное уменьшение разовой порции. За особо трудную для собаки работу размеры подкрепления значительно увеличивают (под трудной работой понимается навык, выполнение которого для собаки представляет значительную трудность, например прыжки через «глухой» барьер).
4. Режим применения подкрепляющих воздействий в процессе обучения должен изменяться. В начале формирования навыка — стопроцентный режим воздействий, а затем вероятностный (то есть когда на собаку воздействуют не каждый раз, а в случайном порядке). Например, когда собака начинает получать пищу или игру во время дрессировки в случайном порядке, её заинтересованность в выполнении навыка резко возрастает, а у дрессировщика при этом появляется возможность отбирать желаемые формы поведения.
5. При работе с собакой не всегда целесообразно или возможно в нужный момент воздействовать на собаку (например, при отработке «выдержки» у собаки, при выполнении навыка «охрана вещи» или «задержание преступника»), однако делать это очень важно, чтобы объяснить собаке, что она делает правильно, а что нет. В таких случаях применяют «условные» подкрепляющие воздействия: положительные или отрицательные. Положительные «условные» подкрепляющие воздействия не всегда означают дачу корма, лакомства, хотя зачастую им сопутствуют, а являются сигналом для собаки: «Делаешь правильно, делаешь верно, делаешь то, что нужно». Обычно для этих целей используют слова: «Хорошо», «Браво», «Умница» и т.д. Отрицательные «условные» подкрепляющие воздействия используют при невозможности применить непосредственно отрицательные воздействия — это команды: «Нельзя», «Тубо», «Фу» и т.д.
В процессе реальной дрессировки собаки обычно используются все вышеописанные методы обучения и дрессировки (в зависимости от поставленной задачи) с учётом правил применения положительных и отрицательных подкрепляющих воздействий. Однако для более полного понимания закономерностей, лежащих в основе дрессировочного процесса, необходимо детально рассмотреть основные принципы и этапы формирования поведенческого навыка.
III.5. Общие принципы и этапы формирования навыков
Несмотря на бытующее мнение, что формирование навыка представляет собой простой, «одноступенчатый» процесс, практика дрессировки подсказывает нам, что это далеко не так. На самом деле процесс формирования любого, даже самого элементарного навыка представляет собой совокупность сменяющих друг друга этапов. Игнорирование в процессе дрессировки этого положения в целом, так же как и пропуск одного из этапов, ведёт к грубым ошибкам. Нам кажется целесообразным выделить следующие этапы (каждый из которых в свою очередь делиться на более мелкие подэтапы):
первый этап — взаимные объяснения;
второй — автоматизация навыка;
третий — полная автоматизация.
Ниже, описывая принципы формирования навыка, мы попытаемся обосновать целесообразность такого подразделения.
Первый этап включает следующие подэтапы.
1. Направленно обеднение дрессировочной обстановки.
Занятия следует проводить дома или в безлюдных местах, с тем чтобы ограничить вероятность появления конкурирующих с базой мотивации: игровой, половой, оборонительной и т.д. Если не соблюдать это правило, то процесс обучения сильно затрудняется — собака теряет интерес к работе, возможны и нервно-психологические перегрузки.
2. Выбор и формирование базовой доминирующей мотивации.
Выбор мотивации, на базе которой будет строиться обучение собаки, зависит от характера и сложности формируемого навыка, а также от стиля работы и опыта дрессировщика. Мы рекомендуем на этом этапе обучения использовать в качестве основных пищевую мотивацию и мотивацию избирательного аппетита, а также различные формы игровой мотивации (имеется в виду общий курс дрессировки). Данные рекомендации обусловлены тем, что именно в рамках реализации указанных мотиваций мы наблюдаем со стороны собаки максимальную заинтересованность в выполнении приёма, что в свою очередь повышает устойчивость диады «собака-дрессировщик» и улучшает положительный эмоциональный контакт между её членами. Другими словами, чтобы достигнуть желаемого подкрепления, собака очень старается понять дрессировщика и выполнить те требования, которые он к ней предъявляет. Таким образом, выбор адекватно поставленной задаче мотивации и создание у собаки устойчивого мотивационного состояния, на основе которого будет формироваться навык, является на первом этапе обучения первоначальной задачей дрессировщика.
3. Собственно взаимные объяснения.
Взаимные объяснения между дрессировщиком и собакой будут эффективны лишь в том случае, если дрессировщик чётко формирует перед собакой поставленную задачу и ясно представляет себе тот результат, которого добивается. Любые воздействия на собаку с помощью поводка, рук, лакомства, интонаций, слов, команд и т.д. должны производится осмысленно и целенаправленно. Перечисленные воздействия на собаку со стороны дрессировщика и ответные действия собаки и её поведение в целом выполняют функцию передачи необходимой информации. Совокупность этих взаимодействий обеспечивает, таким образом, создание между ними своеобразного, но вполне определённого «языка». «Язык» между членами диады «человек-собака» создаётся в результате их «общения» ещё на стадии знакомства (контакта). В дальнейшем, в процессе дрессировки, он обогащается, так как при формировании практически любого нового навыка вводятся новые элементы «языка». В конечном итоге, «язык», существующий между дрессировщиком и собакой, позволяет им хорошо, часто с полуслова, понимать друг друга, сохранять взаимопонимание и взаимный интерес, что в свою очередь обусловливается тем, что каждая из сторон имеет возможность достигать своего программируемого результата.
4. Определение границ формирования навыка.
Дрессировщик должен иметь чёткое представление о том, что он подкрепляет, а собака — не менее чёткое представление о том, какое её поведение желательно для дрессировщика. В процессе взаимодействия двух функциональных систем дрессировщика и собаки должен всегда достигаться общий результат их деятельности, то есть поддерживаться взаимная заинтересованность на максимально высоком уровне. Иными словами, дрессировщика очень важно точно представить границы формируемого навыка и объяснить их собаке. Собака должна знать — её правильные действия подкрепляются положительными воздействия, неправильные — не подкрепляются вообще или подкрепляются отрицательными воздействиями, то есть усвоить границы между «черным» (ошибочным) и «белым» (правильным).
5. Введение санкционирующей команды, разрешающей выполнение навыка.
Для того чтобы собака выполняла навыки, которым её обучили своевременно, используются санкционирующие команды: «Сидеть», «Лежать», «Ко мне», «Стоять», «Рядом» и т.д. Санкционирующая команда подаётся всегда перед началом воздействий дрессировщика, направляющих собаку на выполнение навыка. В дальнейшем, на стадии автоматизации навыка, санкционирующая команда приобретает значение стимула, запускающего поведение.
6. Введение санкционирующей команды, отменяющей выполняемый навык.
На всех этапах дрессировки выполнение навыка должно всегда отменяться дрессировщиком либо командой «Гуляй» (в это время собака не выполняет никакой команды, а просто отдыхает на поводке или без поводка), либо другой командой. Например: команду «Сидеть» можно отменить либо командой «Гуляй». Либо командами: «Стоять», «Лежать», «Рядом», «Фас» и т.д. Произвольного «ухода» собаки с выполнения навыка без команды дрессировщика допускать нельзя.
7. Дрессировочный контроль.
Дрессировка собаки на всех этапах формирования навыка, вплоть до полной его автоматизации, должна осуществляться под постоянным контролем технических средств (поводка, длинной верёвки, радиоуправляемого электроошейника и т.п.), с помощью которых дрессировщик может всегда осуществлять коррекцию поведения, и именно в тот момент, когда в этом есть необходимость.
8. Условные подкрепляющие воздействия: «Хорошо» и «Фу».
В зависимости от характера формируемого навыка применяют положительные или отрицательные условные подкрепляющие воздействия или же те и другие. Условные воздействия служат для того, чтобы своевременно и быстро объяснить собаке, что она делает правильно, а что неверно, то есть что в её действиях является желательным, для дрессировщика, а что нет. Условные подкрепляющие воздействия применяются практически на всех стадиях формирования навыка.
9. Режим подкреплений.
На первом этапе формирования навыка применяют стопроцентный режим подкреплений. То есть каждое правильное действие собаки всегда подкрепляется кусочком пищи (или игрой).
10. Введение элементов контрастного метода дрессировки.
На первом этапе наряду с мотивацией (пищевой или игровой), в случае нежелательных действий со стороны собаки, следует формировать слабую форму мотивации активного избегания неприятных воздействий со стороны дрессировщика. С этой целью вводятся направляющие и объясняющие, сравнительно слабые отрицательные воздействия: рывки поводком, нажатия и подталкивания руками, угрожающие интонации и др. При этом обязательным является соблюдение следующего правила: сразу после применения отрицательного воздействия (в том случае, если животное исправило свою ошибку) должно следовать положительное как в виде пищи, так и виде ласки. Это необходимо для снятия у собаки отрицательного эмоционального состояния. Применение контрастного метода дрессировки на этом этапе позволяет дрессировщику более чётко очертить границы формируемого навыка, оттенить контраст между «черным» и «белым».
11. Режим формирования навыка.
Короткие периоды интенсивной работы с собакой обязательно должны чередоваться с не менее интенсивными короткими периодами отдыха, что позволяет сохранить у собаки длительную заинтересованность в работе, постоянную готовность к выполнению навыка, а также предотвратит нервно-психические нагрузки.
Второй этап состоит из следующих подэтапов.
1. Автоматизация навыка.
а) Направленное обеднение дрессировочной обстановки.
Как и на первом этапе («взаимные объяснения»), обучение собаки должно проходить в безлюдных местах, в отсутствии других собак. Автоматизация навыка достигается многократным повторением навыка под «жёстким» контролем технических средств с использованием вероятностной системы подкрепления. Необходимым условием достижения автоматизации навыка является применение «контрастного» метода дрессировки (чередование положительных и отрицательных подкрепляющих воздействий). Данный метод, на наш взгляд, противопоказан при обучении собаки навыкам апортировки, выборке вещей и др. и, наоборот, рекомендуется при отработке команд общего послушания: «Сидеть», «Лежать», «Стоять», «Рядом», «Ко мне» и т.д.
По мере автоматизации частота и вероятность положительных подкрепляющих воздействий (например, дача пищи) за выполнение навыка снижается, а степень отрицательных (в случае нечёткого выполнения навыка) возрастает. Все воздействия направлены на то, чтобы добиться чёткого и быстрого выполнения навыка. Воздействия как направляющие, так и корректирующие производятся очень быстро и стереотипно.
б) Повышение требований к точности выполнения навыка.
На втором этапе обучения повышается требовательность со стороны дрессировщика к чистоте и точности выполнения навыка. Так, например, если на первом этапе обучения собака после команды «Ко мне» может подходить к дрессировщику с разной скоростью, порой отвлекаясь на обстановочные стимулы (собак, людей, различные шумы), то на втором этапе обучения от собаки нужно добиться, чтобы подходы совершались только бегом и без отвлечений на посторонние раздражители.
в) Усиление степени отрицательных подкрепляющих воздействий.
В качестве отрицательных подкрепляющих воздействий в основном используют рывки поводком различной степени силы.
Постепенно увеличение степени отрицательных воздействий в случае нежелательных действий собаки позволяет усилить мотивацию активного избегания воздействий дрессировщика, то есть создать мотивацию более конкурентоспособную, по сравнению с пищевой или игровой. То есть на этом этапе начинается постепенная замена исходной базовой мотивации (пищевой или игровой) на оборонительную (мотивацию активного избегания). При использовании отрицательных воздействий (особенно при их усилении) обязательным является соблюдение следующего правила: сразу после применения к собаке отрицательных воздействий (в том случае, если животное исправило свою ошибку) должно следовать положительное воздействие как в виде пищи (игры), так и в виде ласки. Это снимет у животного отрицательное эмоциональное состояние и оттенит контраст между «черным» и «белым» (то есть правильным и ошибочным).
г) Увеличение интенсивности работы дрессировщика.
Все воздействия на собаку — направляющие, корректирующие, положительные и отрицательные, а также условные — производятся дрессировщиком сразу после поданной команды, очень быстро и максимально стереотипно. Производя указанные воздействия, дрессировщик добивается выполнения навыка сразу после первой команды.
д) Режим положительных подкрепляющих воздействий.
На этом этапе постепенно вводится вероятностный режим подкрепления (75-80 процентов). Применение такой схемы, в условиях которой собака не знает точно, когда она получит подкрепление (но знает точно, что получит), позволяет повысить её заинтересованность в работе (например, сформировать желание заработать кусочек корма), уточнять и видоизменять границы формируемого навыка, поскольку появляется возможность направленно отбирать и подкреплять желаемые элементы поведения собаки.
2. Автоматизация навыка в условиях обогащения дрессировочной обстановки.
а) На этом этапе окончательно определяются границы формируемого навыка.
б) Повышается требовательность к выполнению навыка скорости и точности его исполнения (в зависимости от обстоятельств, в том случае, если собака с большими нервно-психическими затратами справляется с работой в этих условиях, то дрессировщик должен сделать как бы шаг назад, снизив при этом предъявляемые к собаке требования).
в) Режим отрицательных подкрепляющих воздействий. Постепенное усиление степени отрицательных подкрепляющих воздействий приводит к усилению мотивации избегания неприятных воздействий со стороны дрессировщика. Суммарное количество отрицательных воздействий одновременно с их усилением снижается. То есть на этой стадии контраст между отрицательными и положительными воздействиями достигает максимума. Однако, несмотря на это, дрессировщик, умело чередуя положительные и отрицательные воздействия, должен добиться, чтобы общий эмоциональный фон у собаки в процессе работы оставался положительным.
г) Режим положительных подкрепляющих воздействий.
Применяется 50-60 процентный вероятностный режим подкреплений (обязательным является применение положительных воздействий сразу после отрицательных). Такая схема приводит к усилению пищевой мотивации и желанию заработать вознаграждение.
д) Сохранение интенсивности работы дрессировщика.
Дрессировщик должен поддерживать высокую интенсивность работы во время дрессировки и при этом добиваться выполнения собакой навыка сразу после первой команды.
3. Заключительный этап автоматизации навыка.
Занятия проводятся в местах, где много отвлекающих факторов.
а) Режим положительных подкрепляющих воздействий.
На этом этапе производят постепенное уменьшение вероятности получения подкреплений от 50 процентов до нуля.
б) Режим отрицательных подкрепляющих воздействий.
Отрицательные воздействия в случае отказа собаки от выполнения навыка применяются в 100 процентах случаев невыполнения и при этом достигают значительной силы. Постепенное усиление степени отрицательных воздействий позволяет осуществить плавный перевод сформированного навыка на базу мотиваций активного избегания неприятных воздействий со стороны дрессировщика и при этом сохранить общий положительный эмоциональный фон у собаки.
в) Постепенное уменьшение количества применения условных положительных подкрепляющих воздействий.
г) Постепенное увеличение количества и длительности выполнений навыков, с обязательным чередованием периодов работы и отдыха.
Третий этап — полная автоматизация навыка.
Критерием автоматизации навыка является быстрое, точное и стереотипное выполнение его сразу после первой команды дрессировщика (независимо от окружающей обстановки).
На этапе окончательной автоматизации навыка значение команды (санкционирующего стимула) резко возрастает и начинает играть решающую роль в управлении поведением собаки. Это, по-видимому, происходит за счёт обеднений функциональной системы, обеспечивающей навык. Обеднение функциональной системы связано с окончательным выбором собакой наиболее эффективной программы поведения, что обусловлено правильными, последовательными, стереотипными и прежде всего целенаправленными воздействиями на собаку со стороны дрессировщика.