Стратегия 39: когда люди привыкают что-то делать, вы можете добавить пару новых стимулов к нужному вам поведению и заставить людей реагировать на них автоматически.
Что хорошо известно казино
Что объединяет следующие категории людей?
— Школьников, получающих деньги за каждую принесенную домой «пятерку».
— Сотрудников, получающих ежегодную прибавку к зарплате.
— Посетителей кофе, получающих каждую десятую чашку кофе бесплатно.
— Игроков, бросающих жетон за жетоном в игровые автоматы в Лас-Вегасе.
Ответ таков: их поведение формируется согласно принципам, сформулированным Б. Ф. Скиннером.
Каждый раз, когда я вижу людей, которые, сидя в казино, жмут на кнопки игровых автоматов, я вспоминаю об экспериментах Скиннера. Наверняка некоторые из вас уже возмутились: «Лас-Вегас — это не только игровые автоматы». Постараюсь не обидеть защитников казино.
Я хочу поговорить о теориях поведенческого анализа, получивших широкое признание начиная с 1950-х годов. А также пояснить, почему вы должны понимать, как они работают.
В 1950-х годах Скиннер развил теорию Павлова о классических условных рефлексах. Скиннер начал экспериментировать с крысами и голубями, изучая, как на их поведение влияет получение вознаграждения. Он назвал это выработкой «оперантных» условных рефлексов (по аналогии с «классическими» условными рефлексами, описанными Павловым).
При этом сам Скиннер предпочитал термин «подкрепление», и чуть позже я поясню почему.
Идея заключалась в следующем: если вы хотите усилить проявления определенного поведения, вам следует его подкрепить (вознаграждением). Если вы хотите ослабить проявления определенного поведения, вы подкрепляете желательное поведение и игнорируете нежелательное. Звучит вполне здраво, однако Скиннер решил выйти за пределы здравого смысла, чтобы подвести под свои наблюдения научную основу. Вот как выглядела базисная идея Скиннера:
Поведение → Подкрепление → Усиление поведения
Например:
Получение «пятерки» в школе → Получение пяти долларов → Получение большего количества «пятерок»
Или:
Нажатие на кнопку → Получение денег в игровом автомате → Многочисленные нажатия на кнопку
Или:
Своевременное предоставление отчета → Получение похвалы за отличную работу, сделанную в срок → Подготовка последующих отчетов к установленному сроку.
Скиннер пошел дальше, пытаясь выяснить, какими должны быть подкрепления, когда их следует делать, как часто и в каком объеме. Если вы хотите, чтобы люди делали то, что вам нужно, вам следует быть в курсе некоторых тонких, но важных нюансов человеческого поведения.
Задумайтесь: вы пытаетесь заставить кого-то, например, регулярно выносить мусор, вовремя сдавать отчеты или голосовать на выборах. Вы напрягаете свой мозг, пытаясь придумать, как это сделать. «Может быть, мне нужно его (или ее) как-то простимулировать? — думаете вы. — Деньгами или чем-то еще?»
В то же самое время тысячи людей сидят в казино и раз за разом жмут на кнопку, хотя им за нажатие кнопки никто не платит. Напротив, это они платят кому-то за право нажать на кнопку (и в большинстве случаев потерять при этом собственные деньги). Не хочется ли вам узнать «секрет казино», который, вполне возможно, пригодится и вам? Но сначала давайте поговорим о крысах.
Пять базовых режимов подкрепления
Допустим, вы поместили крыс в клетку с кнопкой. Каждый раз, когда крыса нажимает на эту кнопку, она получает порцию пищи. Еда служит подкреплением определенного поведения:
Поведение → Подкрепление → Усиление поведения
В нашем случае эта схема выглядит следующим образом:
Нажать кнопку → Получить порцию пищи → Чаще нажимать на кнопку
Но что будет, если вы сделаете так, что крыса перестанет получать еду каждый раз, когда она нажимает на кнопку?
Скиннер проверял различные сценарии и обнаружил, что может предсказывать и контролировать, как часто и как быстро крысы будут нажимать на кнопку, чтобы получить еду. В ходе эксперимента он менял необходимое для получения пищи условия (количество и частоту нажатий на кнопку) и наблюдал происходящие изменения.
Были использованы пять базовых режимов подкрепления:
— Непрерывное подкрепление. Вы выдаете порцию пищи каждый раз, когда крыса нажимает на кнопку.
— Фиксированный интервал. Вы выдаете порцию пищи в ответ на нажатие кнопки лишь в том случае, если после предыдущего нажатия прошло определенное количество времени, например пять минут. Крыса получает еду при первом нажатии, которое состоится после истечения пятиминутного перерыва.
— Переменный интервал. Вы также выдаете порции пищи с временными интервалами, но при этом продолжительность каждого интервала постоянно меняется. Иногда он составляет одну минуту, иногда пять, иногда три и т. д.
— Фиксированное количество нажатий. Выдача пищи зависит не от частоты, а от количества нажатий на кнопку. Например, крыса получала еду после каждого десятого нажатия. Необходимое количество нажатий оставалось постоянным.
— Переменное количество нажатий. В этом случае подкрепление также основано на количестве нажатий, но при этом необходимое количество постоянно меняется. Иногда требуется нажать на кнопку пять раз, в другой раз — десять, затем три и т. д.
Выяснилось, что в каждом из пяти случаев крысы (и люди) ведут себя предсказуемо. В следующих разделах вы узнаете, как использовать эти режимы для того, чтобы влиять на поведение людей.
Стратегии
Стратегия 40: недостаточно просто дать человеку вознаграждение. Нужно правильно выбрать режим подкрепления, чтобы использование вознаграждения действительно помогло заставить человека делать то, что вам нужно.
Непрерывное подкрепление: как заставить людей сделать что-то новое
Если вы даете своей дочери деньги (подкрепление) каждый раз, когда она получает отличную оценку (желаемое поведение), вы тем самым используете режим непрерывного подкрепления. Если вы хвалите своих сотрудников (подкрепление) каждый раз, когда они своевременно предоставляют вам отчет (желаемое поведение), вы используете тот же режим. Непрерывное подкрепление лучше всего подходит для тех случаев, когда вы пытаетесь сформировать новое поведение. Когда оно уже сформировано, вы должны переключиться на один из других режимов.
Вначале использования режима непрерывного подкрепления вы получаете заметный результат обучения человека (или крысы, или собаки) новому поведению. Но с течением времени желаемое поведение станет неустойчивым. Кроме того, у этого режима есть и обратная сторона. Если вы исключите подкрепление (то есть прекратите платить деньги за каждую «пятерку» или не будете хвалить сотрудников за каждый своевременно предоставленный отчет), желаемое поведение, скорее всего, тоже прекратится.