Когда люди отвечали на телефонные звонки и пускали в дом проводящих соцопросы, можно было достичь практически идеальной случайной выборки. В наши дни точность опроса зависит частично от данных, имеющихся у лиц, проводящих опросы, и интуиции, подсказывающей, какой лучше сделать выборку — подмешать ли в колдовское зелье из чисел вероятность, с какой респонденты пойдут голосовать, их симпатии той или иной партии, пол, возраст, статистику о том, как это сообщество или регион голосовали на прошлых выборах, глаз тритона или лягушачью лапку...
В поисках точного значения
Рассмотрим следующие две задачи.
Университет А известен постановками мюзиклов в студенческом театре. Талантливые выпускники школ, от которых ждут больших успехов в будущем, могут получить стипендию на обучение в этом университете. Директор университетской театральной программы Джейн знакома с преподавателями актерского мастерства в окрестных школах. Однажды она отправляется посмотреть выступление ученицы, которую все преподаватели в один голос называют замечательной юной актрисой. Но на репетиции эта девушка несколько раз путает текст роли и, кажется, вообще неверно понимает характер своего персонажа. Да и особого сценического обаяния она не демонстрирует. Посмотрев репетицию, директор говорит своим знакомым, что теперь будет сомневаться в их оценках таланта их учеников. Верный это вывод или нет?
Джо подбирает игроков в футбольную команду университета Б. Он всегда ездит на тренировки школьных команд, если тренеры сообщают ему, что появился кандидат в университетскую сборную. Однажды он отправляется в школу, чтобы понаблюдать за нападающим, которого расхваливают его тренеры. Но на тренировке юноша промахивается, не может прорваться сквозь защитников и в целом не слишком результативен. В своем отчете начальству Джо пишет, что игрока переоценили, и рекомендует университету больше не рассматривать его в качестве кандидата в команду. Верное это решение или нет?
Если вы ответили, что Джейн приняла верное решение, а Джо нет, готов поспорить, что вы разбираетесь в спорте, но не в актерском мастерстве. Если же вы сказали, что Джо прав, а Джейн нет, вы, вероятно, разбираетесь в актерском мастерстве, но не в спорте.
Я обнаружил, что люди, которые мало понимают в спорте, чаще говорят, что Джо прав, заключив, что футболист не так уж талантлив, а люди, которые разбираются в спорте, считают, что Джон поторопился с выводом. Они допускают возможность, что выборка, представляющая собой единственную игру нападающего, была слишком мала и, возможно, это была худшая тренировка этого игрока. Таким образом, остается возможность, что способности этого спортсмена на самом деле гораздо больше соответствуют отзывам о нем, чем тому, что увидел Джо.
Люди, которые мало понимают в актерском мастерстве, скорее всего согласятся, что юная актриса не очень талантлива, но те, кто в этом разбирается, скажут, что Джейн пренебрежительно относится к суждениям своих друзей, преподающих в школе. При прочих равных условиях чем больше вы понимаете в каком-то вопросе, тем чаще можете применять статистические закономерности в своей работе. В данном случае важно помнить о законе больших чисел.
И вот почему здесь этот закон здесь необходим. Надежным показателем качества игры и уровня способностей футболиста можно считать то, как он играл на протяжении всего сезона или даже нескольких сезонов. Если его тренеры подтверждают эту информацию, настаивая на том, что он отличный игрок, это уже база доказательств — множество исходных данных, указывающих на то, что игрок, за которым наблюдал Джо, действительно талантлив. Результаты наблюдений Джо ничтожны по сравнению с наблюдениями тренеров, которые каждый день видят игрока на тренировках и в играх.
Конечно, уровень игры футболиста и даже целой команды может меняться от матча к матчу. Как гласит популярная присказка, в любое воскресенье любая команда Национальной футбольной лиги может победить любую другую команду Национальной футбольной лиги. Это не означает, что все команды одинаково сильны, просто нужно помнить: для того, чтобы с уверенностью судить об уровне команды, нужно увидеть много примеров ее игры.
Та же логика определяет мнение директора театральной программы о юной актрисе, выступление которой она смотрит. Если несколько человек, хорошо знающих эту девушку, говорят, что она талантлива, имеет смысл больше довериться их мнению, чем своему, основанному на недостаточном числе примеров. Однако мало кто признает это, за исключением тех, кто сам имеет за плечами сценический опыт и понимает, насколько разными могут быть выступления. Известный актер Стив Мартин писал в автобиографии, что почти любой комедийный актер может иногда сыграть великолепно. Но успех приходит к тем, кто умеет играть по меньшей мере неплохо — раз за разом.
Говоря языком статистики, тренер и директор театральной программы пытаются определить истинное значение кандидата, которого они наблюдают. Наблюдение = истинное значение + ошибка. Это верно для любых расчетов и исследований, даже если речь идет о росте людей или температуре воздуха. Повысить точность полученного значения можно двумя способами. Первый — усовершенствовать средства наблюдения, то есть найти линейки и термометры поточнее. Второй способ — «исключить» ошибки наблюдений, сколько бы их ни было, расширив выборку. Увеличьте количество наблюдений и найдите среднее значение на основе всех наблюдений в сумме. И не забывайте о законе больших чисел: чем больше сделано наблюдений, тем вы ближе к истине.
Иллюзия собеседования
Даже когда мы высококомпетентны в какой-либо сфере и отлично разбираемся в статистике, мы можем забыть о концепции изменчивости и применении закона больших чисел. На факультете психологии Мичиганского университета для того, чтобы принять решение о приеме выпускника в аспирантуру, с ним проводят собеседование. Мои коллеги обычно придавали огромное значение итогам этой 20-30-минутной беседы с выпускником. «Не думаю, что она подойдет нам. По-моему, она не очень разбирается в вопросах, которое мы обсуждали». «Он выглядит очень уверенным в себе. Он рассказал о своей блестящей дипломной работе и сумел показать, что понимает, как проводятся исследования».
Проблема здесь в том, что суждения о человеке, основанные на малой выборке примеров поведения, могут «перевешивать» куда большее количество куда более важных свидетельств, включая средний балл аттестата колледжа, который отражает, как человек учился в течение четырех лет по тридцати с лишним академическим предметам; баллы за выпускной тест (GRE), который отражает знания, полученные за 12 лет обучения, и общие интеллектуальные способности; а также рекомендательные письма, которые обычно составляются на основе многих часов работы со студентом. На самом деле средний балл аттестата колледжа дает весьма приблизительное представление о том, как покажет себя этот студент в ходе последипломного обучения[104](корреляция здесь обычно будет примерно 0,3, что, как вы увидите из следующей главы, очень мало). Примерно такой же точности прогноз дают баллы, полученные за тест GRE. Два этих показателя в общем-то не зависят друг от друга, поэтому уровень точности совокупного прогноза по ним будет выше, чем по каждому из них по отдельности. Рекомендательные письма также повышают точность прогнозирования.