При использовании байесовского метода рекомендуется рисовать табличку[196]. Значения тут приведены такие же, как и в четырехчастной табличке.
СЛОВАРЬ ТЕРМИНОВ
Список терминов, представленный ниже, нельзя назвать исчерпывающим. Скорее это мой личный выбор. Безусловно, вы вправе применить собственное независимое мышление и оспорить какие-то определения.
Cum hoc, ergo propter hoc («Вместе с этим, следовательно, по причине этого») — логическая ошибка, результат следующего рассуждения: если два события происходят в одно время, значит, одно было вызвано другим. Корреляция не подразумевает причинно-следственных связей.
GIGO (Garbage in, garbage out) — «Мусор на входе, мусор на выходе».
Modus ponens — «правило вывода». Вид обоснованного дедуктивного рассуждения, имеющего следующую форму:
Если A, то B
A
Следовательно, B
Post hoc, ergo propter hoc («После этого, следовательно, по причине этого») — логическая ошибка, возникающая в результате такого рассуждения: из того, что одна ситуация (Y) происходит после другой (X), следует, что X стала причиной Y. X и Y могут быть взаимосвязаны, но это не означает, что имеет место причинно-следственная связь.
Абдукция — форма рассуждений, получившая известность благодаря Шерлоку Холмсу, в которой из разумных догадок выводится теория, способная объяснить все имеющиеся факты.
Бимодальное распределение — серия наблюдений, в которых два значения встречаются чаще, чем другие. На графике, отображающем частоты разных значений, видны два пика, или горба.
Верные цифры показывают, насколько близко число к настоящему количеству того, что измеряют. Не путать с точными цифрами.
Гипотетический силлогизм — то же, что и «правило вывода», или modus ponens.
Двойная ось Y — графическая техника для отображения двух серий наблюдений на одном графике, в котором все величины для каждой серии представлены на двух осях (обычно с разными шкалами). Этот метод хорош, только когда с помощью двух серий наблюдений мы измеряем непохожие величины, как было показано в графике в части 1. Графики с двойной осью Y могут только запутать, потому что тот, кто их составляет, может подправить шкалу осей, преследуя корыстные цели. На страницах книги мы приводили пример с компанией Planned Parenthood.
Дедукция — форма рассуждения, в которой мы идем от общего к частному.
Диаграмма рассеяния — тип диаграммы, изображающей значения двух переменных в виде отдельных точек. Например, ниже вы найдете диаграмму рассеяния данных, представленных в части 1.
Индукция — форма умозаключений, в которой серия конкретных наблюдений ведет к общему утверждению.
Интерполяция — отыскание промежуточных значений величины по некоторым известным ее значениям.
Контрапозиция — тип дедукции следующего вида:
Если A, то B
Не B
Следовательно, не A
Корреляция — статистический показатель, характеризующий, насколько близко связаны две переменные. Может принимать любые значения от –1 до 1. Когда одна величина совершенно закономерно увеличивается с увеличением другой, имеет место полная корреляция (корреляция = 1). Если же наоборот, одна величина совершенно закономерно увеличивается с уменьшением другой, то имеет место полная отрицательная корреляция (корреляция = –1). Когда две переменные совершенно друг с другом не взаимосвязаны, корреляция равна 0.
Корреляция показывает только то, что две (или более) переменных как-то связаны, но не то, что одна есть причина другой. Корреляция не подразумевает причинно-следственных связей. Корреляция полезна, потому что отражает оценку того, насколько изменчивость в наблюдениях вызвана двумя переменными, которые мы отслеживаем. Например, корреляция 0,78 между ростом и весом показывает, что в 78 % случаев в изучаемой выборке разница в весе связана с разницей в росте. Статистика умалчивает, какие факторы скрываются за оставшимися 22 %, — тут нужно проводить дополнительные исследования, но можно предположить, что это могут быть диета, генетика, занятия спортом и т. д.
Кумулятивный график — тот, на котором измеряемая величина, например продажи или членство в политической партии, представлена итоговой суммой, а не количеством новых наблюдений за какой-то период времени. Пример мы видели в случае с кумулятивными продажами iPhone.