Ознакомительная версия. Доступно 28 страниц из 137
Гальтон составил таблицу соотношения роста родителей и их детей. Вот как она выглядела. Цифры в таблице указывают, сколько людей в исследуемой Гальтоном группе из 928 человек имели указанный в верхней строке рост при указанном в левой колонке усредненном росте родителей.
Распределение роста участников исследования Гальтона, как и вообще всех взрослых людей, населяющих Землю, было близко к нормальному. Как уже говорилось выше, нормальное распределение характерно для параметров, являющихся суммой большого числа независимых воздействий. Рост – типичный пример, поскольку формируется под разнонаправленным влиянием многих генов, эпигенетических факторов[97], факторов среды, перенесенных травм и болезней.
Интересно, что, если мы построим графики, используя цифры внутри каждой строки, мы тоже увидим колоколообразные кривые: рост детей, родившихся у родителей определенного роста, тоже распределен нормально. Но вершины этих колоколов находятся в разных местах: наиболее вероятный рост ребенка тем выше, чем выше средний рост его родителей. Если связать эти вершины, мы получим близкую к прямой линию.
Получается, что хотя точное вычисление роста человека по росту его родителей невозможно, связь между этими значениями существует. И ее можно описать достаточно простым уравнением, применяемым для линейных графиков. А затем использовать это уравнение для того, чтобы на основе одного из параметров предсказать наиболее вероятное значение второго. Гальтон назвал такую статистическую взаимосвязь корреляцией (от англ. co-relation, “взаимосвязь”).
Сейчас статистическую связь вычисляют, например, в эпидемиологии. Если заболевание и определенные факторы риска[98] коррелируют, то мы можем предположить, что этот фактор и является причиной болезни.
Но важно помнить, что статистическая связь не обязательно равна причинно-следственной. Оба коррелирующих параметра могут меняться под воздействием третьего фактора, называемого спутывающей переменной. Если мы исследуем два параметра – заболеваемость раком легких и наличие зажигалки в кармане – то наверняка обнаружим, что они взаимосвязаны: окажется, что люди с зажигалкой чаще болеют раком легких. Но это не значит, что рак легких вызывают зажигалки в кармане. Оба параметра будут зависеть от третьего – курения, который и является в этом примере спутывающей переменной[99].
А что насчет контролируемых клинических экспериментов? В них мы тоже имеем дело со сложными биологическими системами, а значит, исходы в каждой из групп не детерминированы и носят вероятностный характер. Значит, состояние пациентов в сравниваемых группах может меняться по-разному исключительно в силу случая. Как же тогда определить, случайна разница или вызвана действием лекарства?
Леди, пьющая чайПрекрасным летним вечером 1919 года сотрудники Ротамстедской экспериментальной станции[100] собрались в комнате отдыха. Было время традиционного для Англии вечернего чая – время отдохнуть и поговорить с коллегами о не связанных с работой пустяках. Новичок в компании, недавно принятый на работу молодой математик, вежливо наполнил чашку чаем, добавил в него молоко и протянул сидевшей рядом леди.
– Спасибо, Рональд, но я предпочитаю сначала наливать молоко и лишь потом добавлять чай, – сказала та.
– Вот ерунда, – удивился математик, которого звали Рональд Фишер, – уверен, что разницу почувствовать невозможно, что бы я ни налил первым, чай или молоко.
Но дама настаивала на своем. Конечно же, Рональд говорит глупости и она без труда определяет разницу на вкус. Спор быстро собрал вокруг пререкавшейся пары скучающих коллег, кто-то предложил поставить эксперимент, кто-то уже заключал пари.
Фишер задумался. Очевидно, что предстоит провести слепую дегустацию. Но перед началом эксперимента нужно решить несколько важных вопросов.
Во-первых, важно избежать ложноположительного результата – ситуации, когда правильные ответы дамы, вызванные простой случайностью, будут приняты за подтверждение ее способностей. Если мы совершим одну попытку и получим правильный ответ, это, конечно, не может служить доказательством: даже если она не различает последовательность приготовления чая на вкус, шансы на случайное угадывание достаточно велики, они равны ½. Пожалуй, мало будет и двух удачных попыток: хотя шансы уменьшатся вдвое и составят ¼, они по-прежнему значительны. Какое же минимальное количество попыток нужно для того, чтобы правильные ответы подтверждали способность леди? Три? Четыре? Пять? Еще больше?
Во-вторых, не менее важно избежать ложноотрицательного результата, то есть ситуации, когда вывод об отсутствии способности будет ошибочным. Угадывание не обязательно должно быть стопроцентным: одна ошибка не исключает того, что леди все равно справляется с задачей лучше, чем если бы давала случайные ответы. Какие же выводы делать, если неверным будет лишь один ответ из восьми? А если один из двенадцати?
И в-третьих, как и в любом контролируемом эксперименте, чашки должны отличаться только изучаемым параметром, и больше ничем. Значит, разной может быть только последовательность, в которой чай и молоко наливают в чашку. Любые различия в температуре, количестве молока, сахара, крепости чая, способные повлиять на результат, нужно исключить. Но ведь приготовить две абсолютно идентичные чашки чая все равно невозможно, и небольшие отличия неизбежны.
После некоторого размышления Фишер велел приготовить восемь чашек. В четыре из них налили сначала чай, а затем молоко. В остальные – наоборот. Это делалось в стороне, чтобы испытуемая не знала, что пробует. Чашки подносили одну за другой, в случайном порядке, и, после того как дама давала ответ, Фишер молча записывал результат. По свидетельствам очевидцев, дама дала правильный ответ в каждой из восьми попыток.
В 1935 году Рональд Фишер издал книгу “Дизайн эксперимента”[101], где привел в качестве примера эту давнюю историю. Фишера абсолютно не интересовала природа удивительной способности дамы. Он не назвал ни имен, ни места, где проводился эксперимент, – об этом мы знаем только со слов других участников. Все, что имело для него значение, – ответы на вопросы, которые он задавал себе перед чайным экспериментом.
Ознакомительная версия. Доступно 28 страниц из 137