Ознакомительная версия. Доступно 32 страниц из 160
Теперь с помощью этой таблицы нужно посчитать данные во всех остальных ячейках, как в основных четырех внутри, так и снаружи. Мы знаем: один человек из этих 10 000 болеет блуритом. Пока не видим результатов анализов, поэтому пишем цифру 1 справа в поле «Болезнь: есть», показывая наличие болезни.
То, каким образом организована таблица, когда значения идут сверху вниз и слева направо, предполагает, что сумма этих значений заполняется на полях за ее пределами. Это логично: если количество заболевших равно единице, а общее число – 10 000, мы знаем, сколько людей не болеют: 10 000 – 1 = 9999. Впишем.
От врача мы знаем (об этом я писал выше), что в 2 % случаев анализы дают неправильные результаты. Из 9999 незаболевших 2 % получили неверные анализы, предполагающие диагноз, в том смысле, что они не болеют, но результаты анализов положительные (ложноположительные, нижнее левое поле). Считаем 2 % × 9999 = 199,98, округляем до 200.
Теперь, ввиду того, что нам нужно заполнить данные и по горизонтали, и по вертикали, можно посчитать здоровых людей, результаты анализов у которых были отрицательные, то есть правильное отклонение. Это 9999 – 200 = 9799.
Теперь заполним данные о другой ошибке в постановке диагноза: 2 % ложноотрицательных. Эти результаты означают, что человек на самом деле болен, а по результатам анализов – нет. Это количество представлено в верхнем правом поле. Болен (как мы видим в таблице, посмотрев на правое поле за пределами основных ячеек) один человек. Тогда считаем 2 % × 1 = 0,2, округляем до 0.
И конечно, давайте теперь заполним оставшееся пустое поле – вписываем туда 1 (это значение получилось так: от 1 в боковом поле, которую мы вписали вначале, вычитаем 0, записанный в верхнее правое поле, поскольку у нас должны быть заполнены все ячейки).
Теперь, чтобы действительно заполнить всю таблицу, выпишем значения в нижние поля за пределами основных ячеек. Чтобы узнать общее количество человек с положительными результатами анализов, просто сложим значения в колонке: 1 + 200 = 201. Общее количество человек с отрицательными результатами анализов: 0 + 9799 = 9799.
Уже отсюда мы можем решить задачу так, как показано в главе 6.
1. Какова вероятность того, что вы больны, учитывая, что результаты анализов положительные? Традиционно мы заменяем слово «учитывая» специальным символом – |, а слово «вероятность» – буквой «р», чтобы написать уравнение примерно в таком виде:
1.1. p (Есть заболевание | анализы положительные)
Это удобный формат записи, потому что так мы видим: первая часть предложения, то есть все, что до знака |, – это числитель (верхняя часть уравнения), а все, что после – знаменатель.
Чтобы ответить на вопрос 1, мы смотрим только на левую колонку, где записаны результаты людей с положительными анализами. Есть один человек из 201, у кого на самом деле есть заболевание и при этом анализы получились положительными. Ответ на вопрос 1: 1/201, или 0,49 %.
2. Какова вероятность того, что анализы окажутся положительными, учитывая, что у вас есть заболевание?
2.1. p (Анализы положительные | есть заболевание).
Здесь мы смотрим только на верхний ряд, и дробь получается 1/1. Это говорит о том, что вероятность получить положительные анализы при наличии заболевания равна 100 %.
Не забывайте, что хлорогидроксилен, гипотетическое лекарство, о котором я говорил, в 20 % случаев дает побочные эффекты. Если бы лечили всех, то есть 201 человека с положительными анализами на блурит, то 20 % из них – 40 человек – получили бы побочные эффекты. Помните, что на самом деле болеет только один человек, а лечение в 40 раз чаще приводит к побочным эффектам, нежели выздоровление.
В обоих описанных в шестой главе случаях, как с блуритом, так и с «синей» болезнью, даже при положительных анализах вряд ли вы оказываетесь больным. Конечно, если вы на самом деле болеете, очень важно подобрать правильное лекарство. Что можно сделать?
Стоит сдать анализы второй раз. Мы применяем закон умножения вероятностей, считая, что результаты анализов независимы. То есть любые ошибки могут случайно привести к тому, что только у вас из всех, кто сдавал анализы, получится неверный результат. Это совсем не значит, что у кого-то в лаборатории на вас зуб, поэтому если вы получили некорректный результат однажды, то шансы получить ошибку второй раз у вас не больше, чем у кого-то другого. Вспомните, я говорил, что существует двухпроцентная вероятность того, что анализы окажутся неверными. Рассчитать вероятность того, что лаборант два раза подряд ошибется, можно 2 % × 2 %, или 0,0004. Если вы предпочитаете дроби, то вероятность 1/50, и 1/50 × 1/50 = 1/2500. Но даже эта статистика не включает основной показатель, то есть то, насколько редко встречается эта болезнь. И основной посыл раздела: это нужно делать.
Безусловно, очень поможет, если вы и в этом случае построите четырехпольную таблицу и ответите на вопрос «Какова вероятность того, что я болею, учитывая, что я два раза подряд получил положительный анализ?»
Когда мы начинали рассматривать блурит, у нас была только гора цифр, и мы расставляли их в таблицу. Так было проще посчитать скорректированную вероятность. Одна из особенностей байесовского вывода в том, что вы можете поместить скорректированные данные в новую четырехпольную таблицу. И каждый раз, обновляя информацию, строить новую таблицу и фокусировать внимание на все более точных оценках.
Вот так выглядит заполненная таблица:
И по ней мы видим:
• Количество человек с положительными результатами анализов: 201
• Количество человек с положительными результатами анализов, имеющие заболевание: 1
• Количество человек с положительными результатами анализов, не имеющие заболевания: 200.
Ознакомительная версия. Доступно 32 страниц из 160