Ознакомительная версия. Доступно 5 страниц из 24
1. Выборка
Понятие выборки – критически важное для понимания статистики вообще. Приведем простой пример: нужно определить, кто будет президентом на следующих выборах. Все мы постоянно узнаем цифры, в которых измеряется популярность тех или иных политиков. Но что за ними стоит?
Вам нужно определить мнение почти ста миллионов взрослого населения. Можете ли вы опросить их всех? Конечно же, нет – такое исследование будет стоить больше, чем просто покупка голосов на выборах. Что же тогда нужно сделать? Опросите часть населения и на основании результата сделайте вывод о мнении всего населения. В статистике это называется очень умным выражением: «экстраполяция результатов выборки на генеральную совокупность». Это звучит почти так же страшно, как название некоторых лекарств, но по сути это приравнивание мнения всего населения к мнению опрошенных людей.
Но у этого метода есть подводный камень, можно даже сказать – целый подводный риф. Он был впервые обнаружен в 1936 году в Америке. Случай, произошедший с журналом Literary Digest, получил большую известность и предопределил современный вид опросов.
Журнал Literary Digest проводил опросы общественного мнения перед выборами президента в 1920, 1924, 1928 и 1932 годах. Всякий раз прогноз, составленный на основе опроса, оказывался верным.
Опрос, проведенный журналом в 1936 году, показал, что кандидат от Республиканской партии, Альфред Лэндом, скорее всего победит в большинстве штатов и станет новым президентом. Однако на выборах Лэндон получил голоса выборщиков лишь от 2 штатов, а 46 штатов предпочли Рузвельта.
Причиной такого различия результатов опроса и голосования стали некорректные методы составления выборки, примененные при проведении опроса. Журнал опросил 10 миллионов человек, но все они (ведь они могли позволить себе подписку на журнал во время Великой депрессии) обладали доходами выше среднего. Такие люди обычно отдавали предпочтение республиканцам.
Этот пример показал всем, что недостаточно просто сделать большую выборку – нужно еще, чтобы ее структура соответствовала структуре целевой аудитории.
Что это означает в применении к детской медицине? То, что утверждения типа «лекарство А полезно, так как помогло всем моим подругам», «моя бабушка дожила до ста лет, ни разу за всю жизнь не побывав у врача» или «не знаю, я лечила ангину чаем, и мне помогло» – априори недостоверны. Конечно, мы верим вашим словам. Но только сами эти факты не говорят о том, что для всех эти утверждения будут справедливы. Нельзя судить по отдельным примерам обо всех людях.
Наш вывод (вернее – вывод всей статистической науки) предельно прост – никогда нельзя судить об общем по частным случаям. К примеру, если в Москве провалился асфальт под припаркованной машиной, то это не означает, что нигде в городе теперь нельзя парковаться. Если на вашего знакомого напали в Мексике с ледорубом, нельзя утверждать, что в Мексику опасно ехать, так как там неизбежно получишь альпинистским инструментом по голове.
Но при обсуждении медицины все сплошь и рядом делают именно так. Более того, это можно назвать типичным методом оценки эффективности чего-либо.
Хрестоматийные примеры:
• У моей дочки была температура и кашель, я ни к каким врачам не ходила, пила бабушкин отвар, и все прошло! Значит, к врачам ходить не нужно!
• Вот мы не делали ни одной прививки и ни разу не болели! Прививки – зло!
• Как-то моя подруга выпила лекарство, прописанное ей врачом, и ее рвало два дня, была аллергическая реакция! После этого мы к врачам вообще не ходим.
Я думаю, вам уже видна опасность подобных утверждений: в них на основании одного (двух, трех, десяти, не важно) примеров делают выводы обо всей медицине в целом. И это ровно так же неверно, как и в примере с ледорубом – один случай, даже если он произошел именно с вами, отнюдь не означает, что так же будет с каждым.
Конечно, следует избегать и обратной крайности – слепой веры в статистику и отбрасывания конкретных примеров. Но еще опаснее – переносить свой личный опыт на ситуацию в целом.
2. Статистика нагло врет
На самом деле, нагло врет не статистика, а люди, которые ее трактуют. Сам процесс сбора данных и их обработки очень прост и поэтому достоверен. Главная проблема кроется в их толковании. Очень часто для выводов используют только часть данных, либо игнорируют дополнительные условия, либо просто делают неверные выводы. Вся суть этого отражена в популярной картинке:
Картинка, конечно, смешная, вот только это и есть способ, которым обычно используется статистика. Поэтому мы рекомендуем всегда по возможности обращаться к первоисточнику.
Первоисточники, в отличие от их истолкований, практически всегда будут удивительно достоверны и нейтральны:
• Научная работа. Любая действительно научная работа, то есть труд, опубликованный в научном журнале (Forbes и МК таковыми не являются), обязательно проверяется минимум тремя людьми – редактором и двумя рецензентами, которые не должны быть знакомы с автором и не имеют никаких оснований поддерживать его. Абсолютное большинство исследований публикуются именно в таком виде, и вероятность существенной ошибки в них очень мала. К тому же любые серьезные исследования – международные, и это исключает даже фактор национальных государственных интересов.
• Государственная статистика. Этот источник более интересен – все, что опубликовано, скорее всего будет достоверным, ибо именно государство обладает самым эффективным и надежным каналом сбора данных через свои учреждения. Вот только оно публикует не все – неприятная информация вроде эпидемий в различных регионах, количества смертей от различных причин и прочие результаты узких исследований могут быть недоступны для широких масс.
Источники, которым вообще нельзя доверять – это, к примеру, отдельная статья отдельного человека (пусть даже сто раз академика) в желтой прессе или в Интернете. Такие публикации никак не проверяются и почти всегда имеют своей целью склонить общественное мнение в ту или иную сторону.
Таким образом, статистика – это очень надежный инструмент (как лом), если уметь им правильно пользоваться – брать достоверные данные и корректно их толковать.
Медицинская статистика
Медицинская же статистика – вообще одна из самых достоверных. Секрет этого прост – в ее формировании участвует очень много людей: доктора, медсестры, государственные служащие, пациенты, проверяющие – количество задействованных сторон велико. Как известно, в большинстве клиник врачи тратят на заполнение бумажек даже больше времени, чем собственно на лечение.
Почему это обеспечивает достоверность? Представьте, что ваш муж после работы отправился в баню – один, на своей машине, и расплатился наличными. В таком случае ничто не помешает ему сказать, что он был, скажем, на переговорах. Но если он поехал с друзьями, на такси, расплачивался кредиткой, рассказал об этом всем коллегам и отметился в соцсетях – то вы легко сможете его вычислить, ведь убедить такое количество вовлеченных людей и сервисов изменить показания очень сложно. Понятно, что мужья так не поступают – именно поэтому. А вот врачи должны делать именно так. Каждый факт проходит через столько рук, фиксируется в таком количестве документов, что изменить его очень сложно. И это только отдельный факт! Изменить такую массу данных, чтобы это оказало влияние на итоговый результат, еще сложнее.
Ознакомительная версия. Доступно 5 страниц из 24