Как мы видим, цифры увеличиваются, но не сильно. Теперь мы можем составить точечную диаграмму, как показано далее.
Соотношение числа статей в британской прессе с упоминанием «производителей материальных благ» (2000–2012)
Это весьма интересно: теперь стало очевидно, что цифры увеличиваются. При анализе диаграммы слева направо вырисовывается определенная история. Кажется, мы уловили закономерность.
Сейчас впервые в этой книге настало время серьезно задуматься о проблеме интерпретации данных. Точки на диаграмме рассеивания – это статистические данные. Статистика представляет собой информацию, но это не сама информация. В данном случае это измерение количества статей в прессе в базе данных под названием Factiva.com, которая собирает публикации газет и журналов со всего мира. Тем не менее статистика тоже может ошибаться (база данных может быть неполной), и закономерности в реальной жизни не бывают такими же четкими, как в школьных научных экспериментах. Эти данные подвержены влиянию множества факторов. Так что история, которую я рассказываю, – это всего лишь один из многих возможных вариантов.
В чем заключается моя история? Есть веские основания предполагать наличие закономерности: политики все чаще использовали этот термин на протяжении периода времени, обозначенного на диаграмме. Обратите внимание, если бы я просто отметил первый и последний годы и показатель последнего года был бы выше, речь шла бы о разнице, а не о закономерности.
Тогда, может быть, стоит соединить точки, чтобы сделать закономерность более очевидной, как на следующей диаграмме.
Соотношение числа статей в британской прессе с упоминанием «производителей материальных благ» (2000–2012)
Визуально стало лучше, но можно пойти дальше. Никто не может предполагать, что количество статей было в точности таким. Одна хаотичная линия внесла ясность в диаграмму, но не в историю, которая стоит за ней. Лучше провести прямую линию, чтобы обозначить закономерность.
Чтобы начертить такую линию, прибегнем к методу наименьших квадратов, который активно используется в статистике. Для этого берутся все точки и рассчитывается линия с минимальным квадратом расстояния от каждой точки до линии. Эта черта называется линией наилучшего соответствия. Не переживайте, если до этого вы не имели дела со статистикой, – функция для создания этой линии заложена в программу по работе с таблицами. Однако одна линия может оказаться не слишком информативной. Как видно, точки располагаются не по прямой. Получается, что в начале и конце графика большинство точек находятся выше линии наилучшего соответствия, а в середине большинство точек располагаются под этой линией. Это не очень хорошо.
Взгляните на следующий график. Я разделил данные на две части. В период с 2000 по 2006 год линия наилучшего соответствия была горизонтальной. В период с 2006 по 2012 год она пошла вверх. Из этого можно сделать вывод, что термин «производители материальных благ» начал активно вводиться в употребление после 2006 года.
Соотношение числа статей в британской прессе с упоминанием «производителей материальных благ» (2000–2012)
Насколько это соответствует действительности? Статистика – точная наука, но анализ закономерностей всегда субъективен. Простая столбиковая диаграмма так же показала бы, что частота употребления этого термина повысилась, и, возможно, это все, что нам стоит знать. Можно выдвинуть предположение, что примерно в этот период кто-то принял решение о введении в употребление нового термина, но это так и останется лишь предположением.
Суть в том, что простое составление таблиц или графиков – это еще не способ принимать более эффективные решения. Важно улавливать закономерности. Они либо указывают на необходимость понимания того, что происходит, если мы не знаем причин появления этой закономерности, либо показывают, что какой-то фактор оказывает влияние, если мы понимаем какой. Чем лучше прослеживается закономерность и чем ближе располагаются точки к линии, тем больше это указывает на то, что нужно искать причину.
10. Ищите среднее
Усреднение может сделать информацию яснее. Однако существует больше чем одно среднее значение, и выбор неверного может скрыть от вас то, что вам действительно стоит знать.
В 1918 году Джон Меклин ввел в употребление фразу, которую то и дело применяют специалисты по статистике. Он впервые использовал ее в названии своей научной работы «Тирания обычного человека», опубликованной в журнале International Journal of Ethics.
О какой тирании идет речь? Меклин объясняет. «Очарование острова Капри полностью покоряет путешественников даже без колких фраз Тацита, напоминающих им о…» Постойте, это не тот отрывок. «Наш современный тиран – с головой гидры, с бесчисленным количеством рук…» И это не то! В конце концов автор сообщит нам, что он против «кричащей и банальной сентиментальности дешевого романа, глупого остроумия воскресного приложения к газете, абсолютно пустых песен популярных эстрадных шоу».
Претензия Меклина, высказанная в столь резкой форме, тем не менее обоснованна и заключается в том, что мы уделяем слишком много внимания вкусам большинства и игнорируем тех, кто выделяется из общей массы. Меклин работает в Университете Питтсбурга, издалека наблюдает за процессом зарождения массового социализма и распространением демократических идей, и его одновременно интересуют и пугают привычки обычных людей, от которых, по его словам, будет зависеть процесс принятия решений.
Здесь необходимо сделать пояснение, что это эссе отражает исключительно субъективное мнение автора, который не приводит примеров «обычного» вкуса, не показывает, чем он отличается от вкусов богатых и успешных людей, которыми он так восхищается, и не обосновывает, действительно ли выбор большинства объективно хуже любого другого.