Поэтому-то профессиональные дрессировщики не могут понять, что многие условные стимулы выбраны произвольно. Однажды в платной конюшне я работала с молодой лошадью на корде, обучая ее команде «Вперед!». Тренер конюшни смотрел на это с отвращением и наконец сказал: «Так ничего не выйдет – лошади не понимают „Вперед!“, надо цокать». Потом взял веревку у меня из рук, сказал: «Тцо-тцо» и стеганул жеребенка по крупу свободным концов веревки, что естественно тотчас же вызвало движение вперед.
«Понятно?» – сказал он, считая свои слова доказанными.
Я поняла. С тех пор, воспитывая моих пони, я обучала их слушаться не только моих команд, но и любой возможной системы понуканий, окриков, применяемой другими дрессировщиками. Это избавило меня от неприятностей и заставило говорить обо мне как о подающем надежды дрессировщике-любителе. По крайней мере мне не приходилось переделывать моих сигналов!
Обучить пони двум системам команд не только возможно, но и легко. В то время, как на каждый отдельный сигнал вам надо получать только какое-либо одно поведение, вполне достижимо получение одного и того же поведения на несколько условных сигналов. Например, в переполненном людьми помещении оратор может потребовать тишины, воскликнув: «Тихо!», или встать и, подняв руку, жестом призвать к молчанию.
А если присутствующие шумят и при этом находятся в некотором подпитии и, следовательно, отличаются рассеянным вниманием, поможет позвякивание ложкой по стакану. Мы все обучены осуществлять данное поведение в ответ на любой из, по крайней мере, трех этих стимулов.
Введение второго условного стимула для выученного поведения называется переносом стимулов. Чтобы добиться переноса, вы предъявляете старый стимул – допустим, команду, поданную голосом, – как всегда, и новую команду – скажем, сигнал, поданный рукой, – и подкрепляете ответ; затем постепенно делаете старый стимул все менее и менее заметным и одновременно привлекаете внимание к новому, делая его очень выраженным, пока на новый стимул не будете получать столь же хороший ответ, даже тогда, когда старый стимул не предъявляется вовсе. Обычно этот процесс идет несколько быстрее, чем выработка ответа на первоначальный стимул; когда уже выработано «Выполняй это действие» и «Выполняй это действие по команде», то легче выработать «Выполняй это действие также по другой команде».
Интенсивность сигнала и стирание стимулов
Не существует определенных требований к интенсивности и величине условного сигнала, вызывающего ответ. Первичные, или безусловные, стимулы, дают градуальный ответ в зависимости от интенсивности: реакция на резкий, колющий удар сильнее, чем на булавочный укол, и чем громче внезапный шум, тем сильнее мы вздрогнем. Однако условному стимулу достаточно быть узнану, чтобы вызвать полный ответ. Вы видите красный свет и останавливаете машину; быстрее или медленнее вы это делаете не зависит от размера светофора. До тех пор, пока вы распознаете сигнал, вы знаете, что делать. Поэтому, как только стимул заучен, возможно не только получить его перенос, но также постепенно его уменьшать, пока он не станет едва различим, но попрежнему будет давать те же результаты. Возможен случай, когда вы можете получать результаты при таких слабых сигналах, которые не видны постороннему глазу. Это называется «стирание» стимулов.
Мы пользуемся стиранием постоянно: то, что поначалу должно быть очень массированным стимулом («Дик, нельзя сыпать песок на головы другим детям», – говорим мы, вытаскивая Дика из песочниц), со временем превращается в чуть заметный сигнал (просто поднять брови иди погрозить пальцем). Дрессировщики животных иногда добиваются поразительных, просто волшебных результатов с помощью стертых стимулов. Один из самых забавных номеров, которые я видела, проделывал попугай в Парке диких животных в Сан-Диего. Он разражался истерическим хохотом в ответ на чуть заметное движение руки дрессировщика. Представьте себе возможности этого трюка: «Педро, что ты думаешь о шляпе этого человека?» – «Ха-ха-ха!». Поскольку публика не замечает сигнал, единственное выученное попугаем поведение кажется результатом разумного сардонически-язвительного ответа на вопрос; а на самом деле это был четкий ответ на очень ослабленный стимул, а сардонический ум, если и присутствовал, то принадлежал дрессировщику, а может быть, сценаристу.
Однако лучшие примеры обусловливания, стирания и переноса стимулов мне приходилось наблюдать не в мире дрессированных животных, а на репетициях симфонических оркестров. Будучи певцом-любителем, я занималась в нескольких оперных и симфонических хорах, которые часто управлялись заезжими дирижерами. В то время как многие из сигналов, которые подают дирижеры музыкантам, являются более или менее стандартизованными, у каждого из дирижеров есть свои собственные сигналы, и их значение должно быть усвоено в очень короткое время – время на репетицию часто лишь немногим превосходит время на выступление. Однажды на репетиции симфонии Малера «Воскрешение», как раз в тот момент, когда басы собирались вступить с обычной оглушительной силой, я увидела, как дирижер предъявил безусловный сигнал, предупреждавший: «Вступайте мягче», изобразив на лице страшную тревогу, пригнувшись к земле и заслонив лицо рукой, как бы защищаясь от удара. Все поняли смысл переданного сообщения, и в следующие несколько минут дирижер смог ослабить сигнал и уменьшить интенсивность звучания всех частей хора с помощью предостерегающего взгляда, легкого движения спины, имитирующего припадание к земле, или чуть заметного отголоска от прежнего жеста, и наконец, только вздрагивание плеч. Столь же часто дирижеры осуществляют перенос стимулов, сочетая какой-либо известный или самоочевидный жест – скажем, – поднятие ладони кверху для обозначения «Громче» – с незнакомым жестом, таким, как присущий только ему наклон головы или поворот тела – однажды, сидя слева от дирижера среди альтов, я наблюдала дирижерский жест, управляющий громкостью звучания альтов с помощью левой брови.
Одним из результатов введения управления с помощью стимулов является усиление внимания субъекта, необходимое, если он хочет получить подкрепление за правильный ответ, особенно, если стимулы подвергаются стиранию. Бывает, что субъект способен воспринять столь слабые сигналы, в которых не отдает себе отчета сам дрессировщик, подающий их. Классический пример этого – Умный Ганс, лошадь, живущая в Германии. Это было в начале века; ее считали гениальной. Ударами копыт она могла считать, производить арифметические действия, складывать из букв слова и даже извлекать квадратные корни; правильные ответы, конечно, подкреплялись лакомством. Хозяин, в прошлом школьный учитель, был совершенно уверен, что обучил лошадь читать, думать, заниматься математикой и вступать в общение. И действительно лошадь «отвечала» на вопросы даже в отсутствие хозяина. Многие ученые мужи приезжали в Берлин изучать Умного Ганса и убеждались в его гениальности. И лишь одному из психологов удалось показать, что лошадь ориентируется на какой-то сигнал, и, если никто из присутствующих не знает ответа, удары копыта носят неопределенный характер. Потребовалось длительное время и дальнейшее исследование, против которого восставали те, кто был убежден в гениальности лошади; чтобы показать, что сигналом к прекращению ударов копыта был легкий подъем головы хозяина или любого другого человека, задающего вопрос, когда достигалось правильное число, это движение, первоначально усиливаемое широкополой шляпой, которую носил учитель, теперь было столь малым, что его почти не было видно (никому, кроме Умного Ганса), но оно почти не поддавалось подавлению произвольным усилием. Вот поэтому лошадь могла ориентироваться, когда прекращать удары копытом, наблюдая за любым человеком, а не только за хозяином. Феномен Умного Ганса стал нарицательным для любого случая, когда внешне поразительное поведение, начиная от разума животного, кончая психическими явлениями, на самом деле управляется какими-либо мельчайшими или стертыми проявлениями поведения экспериментатора, ставшими условными стимулами для субъекта.
Условные стимулы, вызывающие отвращение
Единственным случаем, где сила условного стимула, по-видимому, имеет значение, является обычно дрессировка домашних животных – рывок за поводья или привязь, легкий удар по бокам лошади – все это размытый вариант первоначального безусловного стимула, резкого рывка или толчка, сильного удара рукой, которые вызывают ответ, не требующий обучения. Поэтому, если слабый стимул не действует, создается впечатление, что ответ возрастает, если вы усилите стимул. Однако попытки осуществить это на практике встречают большие затруднения.
Выученные сигналы и первоначальные стимулы совершенно различны по своей природе, а новички обычно это не учитывают. Если они не получают ответа, скажем, на легкий рывок, они дергают чуть сильнее, затем еще немного сильнее, и все совершенно без пользы, так как лошадь или собака с той же возрастающей силой тянут в другую сторону.
Профессиональные дрессировщики имеют обыкновение работать над сигналом и применять силу раздельно; они дают условный стимул, и если животное ему не повинуется, они, минуя все градации, немедленно вызывают нужное поведение чрезвычайно сильным неприятным стимулом, способным «освежить память», как выражается один дрессировщик лошадей. Такую же функцию выполняет парфорс в дрессировке собак. При умении даже небольшой человек, используя такой ошейник, может добиться такого рывка, который будет достаточен, чтобы свалить с ног датского дога.
Имея в запасе эти первичные стимулы, можно быстро получить хороший ответ на очень слабые рывки, и, как замечает английская дрессировщица Барбара Вудхаус, это в конечном счете гораздо лучше, чем постоянно дергать и тянуть за шею бедное животное к каким-то промежуточным и бессмысленным целям.
Время отставления
Чтобы добиться точности ответа на условный стимул, полезно применять прием ограничения времени отставления.
Допустим, ваш подопечный обучился совершать какое-либо действие в ответ на условный сигнал, но обычно имеется некоторый интервал времени между предъявлением стимула и ответом субъекта. Вы пригласили людей на ужин, и они немного запоздали, или ваш слон после сигнала к остановке постепенно замедляет ход и наконец останавливается.
Если вы хотите, то, используя ограничение времени отставания, можете в процессе тренировки так сократить этот интервал, что поведение будет возникать так быстро, как это только физически возможно.
Вы начинаете с того, что устанавливаете нормативный интервал, с которым обычно наблюдается поведение; затем вы подкрепляете только то поведение, которое совершается в течение этого интервала. Поскольку живые существа характеризуются вариабельностью, некоторые ответы будут выходить за пределы интервала и за них не будет даваться подкрепление. Например, если вы подаете ужин точно в назначенное в приглашении время, а не ждете опоздавших, то они рискуют получить все холодное или застать меньший выбор.
Когда вы подобным образом установите временной интервал и будете давать подкрепление только на его протяжении, то скоро вы обнаружите, что постепенно все ответы начинают наблюдаться в его пределах и ни один не выходит за него. Теперь вы снова можете подтянуть гайки. Достаточно ли пятнадцати минут, чтобы семья собралась? Начните подавать на стол через двенадцать минут после того, как всех позвали, или через десять. Как быстро вы будете закручивать гайки, должно быть точно определено; как и при каждом процессе выработки желательно находиться в тех пределах, в которых наиболее часто наблюдается данное поведение.
Животные и люди имеют очень развитое чувство времени и чрезвычайно четко реагируют на выработку времени отставания, но дрессировщик не должен полагаться на авось.
Пользуясь часами или даже секундомером, если хотите, чтобы выработка отставления работала на вас. Для поведения ближайших окружающих, включая себя, сократите время ответа, скажем, с пяти тактов до двух. И конечно, если вы работаете с людьми, не обсуждайте ваши действия; вы не получите ничего, кроме возражений. Просто делайте и смотрите, что получается.
В 1960 г. в океанариуме «Жизнь моря» одним из наиболее эффектных номеров, всегда привлекавших внимание, была группа из шести небольших дельфинов, выполнявших различные акробатические трюки в воздухе синхронно. Они совершали различные прыжки и повороты в ответ на подводные звуковые сигналы. Первоначально, когда сигналы только вводились, прыжки, вращения и все остальные действия, которые от них требовались, возникали спорадически с интервалами пятнадцать-двадцать секунд. Но использовав секундомер и установив фиксированное отставание, мы смогли снизить время реакции до двух с половиной секунд. Каждое животное знало, что получить рыбу можно только выскочив в воздух и совершив нужный прыжок или вращение в течение двух с половиной секунд после начала сигнала.
В результате дельфины располагались вокруг подводного источника звука навострив уши, и когда включался сигнал, поверхность бассейна просто взрывалась их телами, извергающимися в воздух; это было действительно зрелище. Однажды, сидя среди зрителей, я была поражена, услыхав, как какой-то человек профессорского вида, – по-видимому психолог, безапелляционно объяснял своим спутникам, что единственный способ, который мы могли применить, чтобы добиться такой реакции, является удар электрического тока.
В реальной жизни ограничение времени отставания является попросту тем временем, которое вы считаете нужным ждать, пока просьба или инструкция будут выполнены. Родителей, начальников, и учителей, которые проявляют последовательность в выработке определенного временного интервала реакции, обычно считают хорошими, заслуживающими того, чтобы с ними иметь дело, даже если отставание – временное «окно», в течение которого должно осуществляться поведение, которое будет подкреплено, – очень короткое.
Предвосхищение
Наиболее частым недостатком в управляемом сигналами поведении является предвосхищение: как только сигнал усвоен, субъект так стремится продемонстрировать требуемое поведение, что совершает его раньше, чем подается сигнал.
Термин, описывающий это проявление, заимствован из опережающего поведения у людей при состязаниях в беге – опережая выстрел, фальстарт, ложная тревога. Люди, которые опережают указания и просьбы других, обычно считаются нетерпеливыми, выскочками или подобострастными; это очень раздражающая привычка, а вовсе не добродетель.
На соревнованиях по выучке с доберман-пинчерами часто бывают неприятности. Хотя эти собаки прекрасно поддаются дрессировке, они столь возбудимы, что предвосхищают команды по малейшим намекам и начинают работать прежде, чем им в действительности приказывают, теряя при этом баллы. Предвосхищение является обычной ошибкой лошадей, с которых бросают лассо на родео. Предполагается, что ковбой и лошадь должны ждать за барьером, пока не пустят бычка, но возбужденная лошадь перескакивает барьер раньше сигнала.
Ковбой иногда думает, что у него лошадь с высокими ходовыми качествами, но на самом деле это просто недостаточно выработанное управление с помощью сигналов.
Другой чрезвычайно распространенный случай предвосхищения – офсайт в американском футболе. Один из игроков так нетерпелив, что продвигается на территорию другой команды до того, как подан сигнал игры, за что команду наказывают.
С практической точки зрения ликвидировать предвосхищение можно, вводя тайм-ауты. Если субъект предвосхищает сигнал, и если это нежелательно, прекратите, всякую работу. Не давайте сигналов и ничего не делайте целую минутy. Каждый раз как субъект опередит выстрел, останавливайте часы. За нетерпение вы наказываете отставлением возможности работать. Это вызывает очень эффективное подавление опережения команды, в то время как выговоры, наказание или повторение могут оказаться вовсе недейственными.
Стимулы в качестве подкрепления: поведенческие цепи
Как только стимул становится условным сигналом, происходит интересная вещь: он превращается в подкрепление. Вспомните звонок на перемену в школе. Звонок на перемену является сигналом, условным сигналом, означающим: «Вы свободны, идите и играйте». А кроме того, он воспринимается как подкрепление – дети рады, когда слышат его, и если бы они смогли сделать что-либо, чтоб заставить его прозвенеть скорее, они бы это сделали. Теперь представьте себе звонок на перемену, который не звонит, если в классе нет тишины. Ко времени перемены у вас будет очень тихий класс.
Условный стимул – предвестник подкрепления, и поэтому он становится желаемым событием. Желаемое событие – это само по себе уже подкрепление, а потому вы с успехом можете подкреплять поведение, давая условный стимул другого поведения. Например, я вознаграждаю кошку лакомством, когда она подходит ко мне по команде – она этому научается и выполняет это. Теперь, если я буду говорить: «Ко мне» и вознаграждать ее за реакцию всякий раз как увижу ее – на камине, то скоро окажется, что кошка, стремясь получить лакомство, будет забираться на камин. Как вы помните, с точки зрения кошки, она обучает меня давать ей лакомство. Для этого она нашла способ заставлять меня произносить: «Ко мне». Теперь допустим, что я обучаю ее вспрыгивать на камин, когда я жестом показываю на него, подкрепляя правильные ответы либо пищей, либо командой «Ко мне». Затем я буду жестом указывать на камин всякий раз, когда: а) я знаю, что кошка голодна и б) когда она случайно перевернется через спину…
Я выработала цепное поведение.
Поведенческие цепи – очень распространенное явление.
В реальной жизни мы часто производим серии связанных действий, состоящих из многих отдельных поведенческих актов. Не надо далеко ходить за примерами – работа плотника или уборка квартиры – неплохая иллюстрация. Мы ожидаем, что и наши питомцы будут вести себя так же: «Подойди», «Сядь», «Ляг», «Следуй за мной» и так далее без перерыва и без видимого подкрепления. Эти длительные рады действий являются цепным поведением. В противоположность другим длительным действиям эти могут выполняться часами, сотни раз без напряжения, без сбоев, без задержек, поскольку каждый акт в действительности подкрепляется возможностью выполнить следующее, действие цепочки, и так до заключительного подкрепления выполнением всего дела, всей цепи.
Однако поведенческие цепи рвутся и поведение рассыпается на элементы, если в цепочку вклинивается невыученный поведенческий акт, или действие, не находящееся под контролем стимулов. Вы не можете подкрепить субъекта сигналом, если он этот сигнал не распознает или не может выполнить то, что этот сигнал требует. Отсюда следует, что цепное поведение следует всегда вырабатывать с конца. Начинайте с последнего действия в цепи, удостоверьтесь, что оно усвоено и сигнал к его выполнению хорошо узнается, лишь потом переходите к разучиванию предпоследнего действия и т. д. Например, если при заучивании стихотворения, мелодии, текста речи, роли в пьесе вы разделите задания, скажем, на пять частей и начнете запоминать их в обратном порядке, с конца – вы всегда будете двигаться от того, что вы знаете слабее, к тому, что знаете более прочно, от материала, в котором вы не совсем уверены, к материалу, хорошо уже усвоенному, имеющему подкрепляющее действие. Запоминание материала в том порядке как он написан и должен воспроизводиться приводит к необходимости постоянно продираться от знакомой тропы в сторону более трудного и неизвестного, что – является неподкреплением. Подход к запоминанию материала как к цепному поведению не только убыстряет процесс запоминания, но и делает его более приятным.
Поведенческие цепи – это особое понятие. Я часто сама спотыкалась на них, чувствуя, что надо вернуться к концу ряда, так как я не могу заставить животное, ребенка или себя выполнить кажущуюся простой последовательность действий, пока я не понимала, что пыталась выработать цепное поведение не с того конца. Когда делают пирог, – то глазурью его украшают в последнюю очередь, но если вы хотите обучить ребенка получать удовольствие от приготовления пирога, начните с того, что попросите «помочь» украсить его глазурью.
Пример цепного поведения: обучение собаки игре в фризби (пчелку)
Один мой нью-йоркский знакомый каждый выходной ходил со своим золотистым спаниелем в Центральный парк, чтобы играть в «пчелку». Он рассказывает мне, что сплошь и рядом встречает людей, безуспешно пытающихся обучить своих собак этой игре. Это досадно, потому что игра в «пчелку» прекрасный способ тренировки собаки в городе. По сравнению с простым мячом «пчелка» летит медленнее и по неопределенной траектории, возможно, больше напоминает реальную дичь, заставляет собаку совершать прыжки в попытках поймать ее, что доставляет удовольствие и хозяину. И, наконец, игра в «пчелку» позволяет хозяину, оставаясь на одном месте, заставлять собаку бегать.
Люди жалуются, что, когда они бросают «пчелку», собака наблюдает за ее полетом, продолжая оставаться на месте, хотя если ее раззадорить, то она будет прыгать, пытаясь схватить «пчелку», когда та пролетает мимо. В этой игре два дрессировочных момента: первый состоит в том, чтобы обучить собаку, на какое расстояние она должна отбегать за «пчелкой». Второй состоит в том, что данная игра – цепное поведение: сначала собака гонится за «пчелкой», затем ловит «пчелку», наконец, несет ее назад хозяину, чтобы он снова кинул ее. Поэтому каждому элементу этого сложного поведения следует обучать отдельно, и последнее действие в цепи, принос, должно быть выработано первым.
Вы можете обучить приносу с очень маленьких расстояний даже в доме, используя предмет, который легко носить, скажем, старый носок. Большинство охотничьих собак приносят предметы сами, без обучения, собак некоторых пород, таких, как бульдоги, боксеры, необходимо обучать класть апорт около хозяина или отдавать его в руки, поскольку они предпочитают игры, в которых бы вещи у них отбирали.
Когда по команде собака будет приносить предметы, обучите ее ловить «пчелку». Сначала заставьте собаку как можно сильнее заинтересоваться «пчелкой», двигая ее у самой морды. Позвольте ей несколько раз взять игрушку в рот и добейтесь, чтобы она отдала вам ее обратно, при этом, конечно, бурно поощряйте ее за возврат. Затем подбросьте игрушку в воздух, позвольте собаке завладеть ею в прыжке и заставьте отдать обратно. Затем вы тут же снова подбрасываете игрушку в воздух и бурно радуетесь, когда собака ее поймает. И теперь вы на прямой дороге к получению великолепного игрока в «пчелку».
Расстояние бросков постепенно увеличивается, и собаке необходимо научиться следить за «пчелкой» и перемещаться так, чтобы поймать ее. Это требует тренировки, поэтому может понадобиться пара выходных, чтобы заставить собаку отходить на семь-восемь метров. Некоторым очень быстрым собакам удается оказываться точно на месте и ловить «пчелку» на таком большом расстоянии, на какое вы сможете ее забросить. Мне приходилось встречать необыкновенных собак, которые могли поймать «пчелку» на другом конце футбольного поля. Создавалось впечатление, что собаки получают удовольствие от точности своей оценки места падения.
Блестящий бег или фантастические захваты в прыжках с переворотом, которые вызывают восторг зрителей, – тоже доставляют собаке радость. Тем не менее, поймав «пчелку», собака несет ее вам, поскольку последнее звено цепи разучено первым и поскольку именно это действие приводит к подкреплению, будь то ваша похвала или другой бросок. Разумеется, если вы будете невнимательны и собака будет систематически не получать похвалы или следующего броска не будет, принос подвергнется затуханию. И еще, когда собака слишком устает и не хочет больше играть, она начинает все хуже и хуже приносить «пчелку», медлит с возвращением и бросает ее на полпути. Это означает, что пора остановиться – вы оба уже взяли от игры все.
Генерализованное управление с помощью стимулов.
С большинством животных приходится сначала немного повозиться, чтобы установить управление их поведением с помощью стимулов, но часто к тому времени, как берете под контроль сигналов третий или четвертый тип поведения, оказывается, что животное как бы обобщает, у него появляется нечто вроде понимания идеи. Выучив три-четыре условных поведенческих акта, большинство субъектов, по-видимому, начинают распознавать определенные события в качестве сигналов, каждый из которых означает свой тип поведения, и что получение подкрепления зависит от правильного распознавания и ответа на сигналы. С этого момента введение условных сигналов становится простым. У субъекта уже имеется общая картина, и все что ему надлежит сделать – это научиться классифицировать новые сигналы и ассоциировать их с правильным поведением. Если вы, как дрессировщик, поможете питомцу, сделав это понятным, последующее обучение может идти само собой много быстрее, чем трудные начальные шаги.
У людей обобщение происходит еще быстрее. Если вы вознаградили за ответ только на одну выученную команду, люди очень скоро начинают давать ответы и на другие команды, чтобы заслужить подкрепление. Мой друг Ли, учитель математики шестого класса школы в одном из непривилегированных районов Нью-Йорка, каждый учебный год начинает с того, что обучает школьников выбрасывать жевательную резинку, как только он попросит их об этом. Никакого принуждения. Просто: «Все, внимание, жевательную резинку изо рта. Хорошо! Стоп! Подождем, у Дорин она еще есть… великолепно! Она ее вынула. Молодец, Дорин!». Он говорит детям, что после урока они могут снова взять жевательную резинку (используя в качестве подкрепления слова «Класс свободен!»). Это может показаться фривольным и даже глупым (поскольку это стоит Ли вида жующих челюстей, чего он терпеть не может), но Ли установил, что этот первый опыт подготавливает его класс к тому, что выполнение его просьб создает возможность подкрепления. Конечно, подобно хорошему дрессировщику китов, он использует разнообразные подкрепления, помимо хороших отметок и собственной похвалы, включая игры, одобрение сверстников, более ранее окончание урока, даже раздачу жевательной резинки. И конечно, сначала он уделяет много времени жевательной резинке, вместо того, чтобы уделять его десятичным дробям, дети думают, что он помешан на резинке. Но дети так же придают значение его словам и считают, что имеет смысл делать то, что хочет Ли.
Другие учителя думают, что у Ли врожденное умение поддерживать тишину в классе, а директор считает его хорошим «дисциплинщиком». Что же касается Ли, то он считает детей достаточно сообразительными, чтобы обобщить свои реакции, и любит их за это. А жевательная резинка тут ни при чем.
Провалы преднаучения и вспышки раздражения
Установление контроля над поведением с помощью стимулов часто порождает интересный феномен, который один из тренеров назвал «провалом преднаучения». Вы сформировали поведение и теперь пытаетесь сделать его управляемым с помощью стимулов. Но когда вам кажется, что субъект уже проявляет способность отвечать на стимулы, он внезапно перестает отвечать не только на стимулы, но и вообще давать нужные реакции. Он ведет себя так, будто никогда и не слышал о действиях, которые вы сформировали.
Этот момент полностью обескураживает тренера. Вот вы очень изобретательно научили цыпленка танцевать, а теперь хотите, чтобы он танцевал только, когда вы поднимаете правую руку. Цыпленок смотрит на вашу руку, но не танцует.
Или же он может стоять на месте, когда вы подаете сигналы, и начинать интенсивно отплясывать, когда никакого сигнала не было.
Если вы построите график этой последовательности, то увидите постоянно идущую кверху линию, отражающую увеличение процента правильных ответов (т. е. ответов на сигналы), которая затем резко снижается, ибо соответственно правильность ответов падет до нуля (когда вы имеете букет отсутствия ответов и неправильных ответов). Однако если вы продолжаете упорно работать, затем внезапно наступает озарение: вдруг, совершенно случайно, субъект скачком начинает отвечать на команды действительно идеально – вы поднимаете руку, цыпленок танцует. Поведение управляется стимулами.
На мой взгляд, происходит вот что: сначала субъект выучивает сигнал, не осознавая этого, дрессировщик видит только обнадеживающую тенденцию медленного нарастания правильного выполнения команд. Но затем субъект замечает (!) сигнал и осознает, что на него надо как-то отвечать, чтобы получить подкрепление. В этот период он уделяет большее внимание сигналу, чем проявляемому поведению. Конечно, при этом ответ отсутствует, так же как и подкрепление. Когда же, по случайному стечению обстоятельств, или в результате упорства тренера, субъект однажды осуществит реакцию при наличии сигнала и получит подкрепление, у него «возникнет картина». С этого момента он «знает», что означает сигнал, и отвечает на него правильно и уверенно.
Я понимаю, что говорю по этому поводу много таких слов, как «отдает себе отчет», «знает» в отношении того, что происходит в голове субъекта, которые большинство психологов считают неприменимыми к животным. Однако при дрессировке животных иногда так оно и есть, что уровень правильных ответов постепенно нарастает, хотя внешне ничего существенного не происходит; трудно сказать, с какого момента, если таковой вообще существует, животное начинает осмысленно отдавать себе отчет в том, что делает. Но наличие провала преднаучения, по моему мнению, является отражением осознания, вне зависимости от того, какие процессы в это вовлекаются. Я могла обнаружить ярко выраженное проявление провала преднаучения (а следовательно, и своего рода сдвиг осознания) в данных Мишеля Уолкера, исследователя из Гавайского университета, ставившего эксперименты по сенсорному различению у тунца, одного из наиболее разумного вида рыб, но в конце концов только рыбы.
Для субъекта провал преднаучения – время наибольших огорчений. Мы все знаем, как расстраивает борьба с тем, что понимаем только наполовину (общеизвестный пример – математические понятия), зная только то, что по-настоящему их не понимаем.