Основная идея заключается в том, что хотя редкие события крайне маловероятны для любого отдельно взятого человека, они почти наверняка произойдут с некоторыми людьми в большой популяции — чем больше популяция, тем больше вероятность, что это случится с кем-то. Такому человеку будет очень трудно избежать поиска причин и даже веры в высшую силу, которая подстроила столь невероятное событие. На самом деле поиск объяснения — это адаптивное поведение, поскольку выявление причин или модификаторов потенциально может дать человеку преимущество в достижении замечательно хороших (или избегании исключительно плохих) результатов. Более того, в некоторых случаях чрезвычайно редкие события действительно происходят по какой-то причине, и исследования редких событий могут многому нас научить. С другой стороны, придумывая и принимая на веру несуществующие причины случайных событий, мы рискуем причинить себе большой вред.
Это возвращает нас к важному вопросу о том, как выбрать финансового консультанта. Как выбрать лучшую из всех возможных инвестиционных стратегий? Как упоминалось ранее, некоторые эксперты постоянно опережают рынок, год за годом добиваясь успеха. Однако теперь должно быть ясно, что количество успешных управляющих напрямую зависит от общего числа управляющих активами, делающих прогнозы (статистическая база). В своей книге «Блуждание пьяницы: как случайность правит нашей жизнью» Леонард Млодинов использует именно этот пример, чтобы проиллюстрировать проблемы статистической базы. Учитывая, сколько существует различных менеджеров по управлению активами, Млодинов прогнозирует, что за последние 45 лет вероятность того, что хотя бы один управляющий будет правильно предсказывать рынок 15 лет подряд, составляет 75 %. Таким образом, даже если ни один человек не обладает способностью «обыграть рынок», все равно найдется достаточно много тех, у кого это получится чисто случайно. Эта статистика не означает, что не может быть талантливых экономистов, способных превзойти рынки, однако она изрядно обесценивает советы и методики из книг. Скорее всего, в этой области единственной хорошо объяснимой способностью разбогатеть останется продажа большого количества книг про то, как разбогатеть.
Статистическая база в медицинской диагностике
Вы беспокоитесь, что у вас может быть ужасная болезнь, но не хотите, чтобы появилась запись в вашей медицинской карте, поэтому обращаетесь в анонимную лабораторию, которая выполняет анализ крови. В словаре медицинских лабораторных исследований «чувствительность» — это функция от того, сколько истинно положительных случаев заболевания будет обнаружено тестом, тогда как «специфичность» — это функция от того, сколько будет выявлено истинно отрицательных результатов. Согласно описанию, заказанный вами тест имеет 100%-ную чувствительность и 95%-ную специфичность, так что он кажется довольно точным[160].
Вы очень расстроились, получив из лаборатории письмо с положительным результатом теста. Что вы действительно хотите знать и что вам нужно знать, так это то, насколько вероятно, что у вас действительно есть болезнь. Учитывая специфичность теста (95 % тех, кто не болеет, будут иметь отрицательный результат, и только 5 % тех, у кого нет заболевания, будут иметь положительный результат — другими словами, 5168 % ложноположительных результатов), большинству покажется очевидным, что вероятность того, что вы действительно болеете, составляет 95 %. Однако это определение зависит не только от специфичности теста, но и от статистической базы (то есть от распространенности заболевания).
Допустим, что рассматриваемое заболевание встречается только у 1 человека из 100 000, то есть довольно редко. В этом случае у всех, кто действительно болен, будет положительный результат теста (из-за 100%-ной чувствительности). Однако поскольку специфичность составляет 95 %, то 95 % людей, не болеющих этим заболеванием, будут иметь отрицательный результат, а 5 % — ложноположительный результат. Таким образом, из 100 000 человек, прошедших случайное тестирование, один будет иметь положительный результат (и действительно болен), а 5 % людей, не болеющих этим заболеванием, будут иметь положительный результат, или 0,05 × 99 999 ≈ 5000 человек. Другими словами, для этих параметров теста и этой распространенности заболевания положительный тест означает только 1 шанс из 5000, что вы действительно больны.
Напротив, если болезнь распространена и, допустим, присутствует у 1 из 20 человек, то 1 из 20 человек будет иметь положительный результат теста (и действительно болен), тогда как 5 % из 19 человек (или один человек) будут иметь ложноположительный результат. Другими словами, при высокой распространенности болезни (1 из 20) пациент с положительным результатом теста действительно болен с вероятностью 50/50. Таким образом, чем реже встречается заболевание, тем менее значимым является положительный результат теста, даже если его специфичность не изменилась. Этот пример показывает, как статистическая база существенно меняет смысл наблюдения[161].
А еще этот пример иллюстрирует, почему опасно использовать массовое скрининговое тестирование для широких слоев населения, когда заболевание встречается очень редко. Врач обычно не назначает диагностический тест, если нет веских оснований подозревать у пациента заболевание; например, пациент сообщил о симптомах, соответствующих заболеванию, или у пациента есть факторы риска, такие как вредное воздействие или генетическая предрасположенность. Более того, во многих случаях тщательный медицинский осмотр выявляет основные признаки заболевания, а наличие факторов риска их только подтверждает. Таким образом, к моменту проведения теста пациент уже отнесен к группе с высокой вероятностью заболевания, и поэтому положительный тест будет иметь лучшую прогностическую ценность. Это резко контрастирует с ситуацией, когда тест используется для массового обследования на наличие редкого заболевания.
Недавно рекомендации ВОЗ по скринингу на рак груди (с использованием маммографии) и рак простаты (с использованием ПСА) были изменены, чтобы исключить проведение теста в группах низкого риска. Причина этого ясна из предыдущего примера: чем ниже частота заболевания, тем большее количество пациентов с положительным результатом теста на самом деле не больны. Проблема в том, что ложноположительный результат скринингового теста может привести к инвазивным процедурам (включая биопсию и удаление органа), которые могут иметь серьезные побочные эффекты. Сами процедуры болезненные и оставляют рубцы. В результате процедур могут возникнуть инфекции (с небольшой, но заметной частотой), что в крайних случаях приводит к длительной болезни и даже к смерти. Удаление органа может вызвать у пациента недостатки как функциональные и косметические, так и психологические. С другой стороны, если болезнь будет обнаружена и вылечена до того, как она распространилась, это может спасти жизнь пациента. Однако в контексте принятия решения, которое с наибольшей вероятностью принесет пользу отдельному человеку, необходимо оценить показатели популяции и сопоставить риск пропуска реального случая (если не проводится скрининг) с риском напрасного травмирования, функциональных нарушений и потенциальной гибели пациентов, которые никогда не болели этим заболеванием, но у которых оказался положительный результат теста. Этот расчет плохо поддается анализу, и нет объективного ответа о том, какой риск приемлем для конкретного человека, поскольку это вопрос личных предпочтений. Однако до тех пор, пока не будут известны хотя бы границы рисков, невозможно принять обоснованное решение, и в этом случае пренебрежение статистической базой является серьезной ошибкой, которая постоянно совершается и которую следует избегать.