Когда мы используем одни только цифры для оценки туманных будущих результатов… мы обычно не просто неправы, а последовательно неправы.
Из предисловия Гарри Марковица к книге Сэма Сэвиджа «Изъян средних чисел: Почему мы недооцениваем риск перед лицом неопределенности» (The Flaw of Averages: Why We Underestimate Risk In The Face of Uncertainty)[97] Вот какая проблема возникает у хорошего доктора со статистикой. Статистическая значимость — фактически универсальный критерий, которым пользуются врачи и ученые для определения истины. Но хороший врач знает, что статистика вполне может лгать. Даже сами статистики не отрицают этого. Американский писатель Даррелл Хафф в 1954 г. написал на эту тему книгу под названием «Как лгать при помощи статистики», на протяжении следующих 50 лет неизменно остававшуюся бестселлером.
Статистика имеет дело с вероятностью (насколько велика возможность, что нечто является правдой), и волшебное число здесь — 0,05 (или 5 %). Если шансы на то, что результаты неверные, меньше 5 % (p < 0,05, где p — уровень статистической значимости), они считаются скорее реальными. Но столь малая вероятность означает, что есть только один из двадцати шансов, что результат совершенно случайный, то есть абсолютно не правдивый. Ну и как врач определит, что вы тот самый уникум, один из двадцати, для которых общие правила не работают? Конечно же, он этого не узнает, пока не изучит все данные о вашем образе жизни и состоянии здоровья или, не дай бог, пока после проведенной диагностики и пробного лечения не поймет свою ошибку. Беда в том, что статистика бессмысленна в применении к конкретному пациенту, то есть и к вам, и к каждому из семи или около того миллиардов людей.
Один из нас (Майкл Джонс) много лет проработал практикующим хирургом-онкологом. Его разговор с человеком, у которого только что диагностировали злокачественную опухоль, мог бы звучать так.
Пациент. Что ж, доктор, каковы мои шансы победить болезнь?
Доктор Джонс. Ваши шансы на выживание составляют или 0, или 100 %.
Пациент. Что вы имеете в виду? Не могли бы вы привести мне цифры, оценить вероятность?
Доктор Джонс. Если вы хотите знать, какой процент из большой группы людей с этим заболеванием выживает, я, конечно, могу назвать цифры. Но в вашем конкретном случае мы имеем вариант «или пан, или пропал». Вы либо переживете это, либо нет. Так что давайте будем оптимистами и надеяться, что все закончится благополучно.
Пациент. Даже не знаю, плакать мне или радоваться.
Доктор Джонс. Учитывая единственную альтернативу, не лучше ли рассчитывать на то, что вы поправитесь?
Пациент. Может быть, доктор, может быть.
Все это, безусловно, справедливо, но ведь, с другой стороны, мало просто рассчитывать на лучший исход: наш воображаемый пациент и его врач должны определить максимально эффективную стратегию лечения. Ни один из трех основных способов борьбы с раком — операция, лучевая терапия или химиотерапия — ни порознь, ни в комплексе не лишены серьезных побочных эффектов. Ну и как в данном случае выбрать лечение, которое с наибольшей вероятностью увенчается успехом и при этом нанесет наименьший вред?
Несмотря на здравый аргумент, что выводы статистических исследований могут не подходить конкретному пациенту, от чего-то все же надо отталкиваться, и потому мы начинаем с костюма усредненного размера — статистических данных тщательно проведенных и проанализированных испытаний на группах пациентов с таким же заболеванием. В конце концов лучше уж такой костюм, чем вообще никакого.
Итак, это исходная точка. И куда мы из нее направимся? Простите, но необходимо сказать еще несколько слов о статистике, поскольку именно так большинство людей измеряет ценность научных данных.
В исследованиях на группах пациентов эффекты вмешательства анализируются на основе частотности — среднее значение, медиана, доверительный интервал и проч.; все показатели отдельных больных вливаются в сверхчисла, описывающие целую популяцию и считающиеся статистически значимыми; p < 0,05 = вероятно, p > 0,05 = возможно, нет. Но эти числа не относятся напрямую к отдельному человеку даже в группе испытуемых, не говоря уже о пациенте, который сидит сейчас в кабинете врача, с тревогой ожидая рекомендаций по лечению. Некоторые статистики занимаются этой проблемой и пытаются расширить свои умения, чтобы разобраться с тем, как использовать информацию, полученную от группы, в конкретных условиях. Такие попытки предпринимались еще в середине XVIII века.
На пути осмысления упомянутых выше сомнений относительно статистики хороший доктор также обязательно познакомится с преподобным Томасом Байесом[98], пресвитерианским священником из города Танбридж-Уэллса, что в английском графстве Кент. Байес, человек грузный и мрачный, если судить по предполагаемому портрету, был не только богословом, но и математиком и внес существенный вклад в статистику, поскольку изучал теорию вероятностей. Он родился около 1701 г. и умер в возрасте 59 лет, так и не опубликовав главную работу своей жизни. Его записки о том, что впоследствии получило название «теорема Байеса», выпустил через два года после смерти священника его друг Ричард Прайс. Статья в Philosophical Transactions of the Royal Society of London была озаглавлена «Очерки к решению проблемы доктрины шансов»[99], и описанные в ней идеи положили начало целой области — применяемой до сих пор байесовской статистики.