Однако наша выборка, скорее всего, не вполне репрезентативна, прежде всего – из-за ее небольшого размера. Получить экстремальный результат в небольшой выборке гораздо легче, чем в большой. В обычном случае можно было бы рассчитать доверительный интервал для нашей оценки 78 %, но для малых выборок этот метод непригоден. Вместо этого мы намереваемся проверить вероятность того, что наша выборка могла быть получена из распределения, в котором равновероятными являются три возможных результата. Так, если мы предположим, что компания-«чудотворец» с одинаковой вероятностью может иметь неценовую, ценовую и такую же относительную конкурентную позицию, как и «середнячок», мы сможем оценить вероятность получения выборки, которую мы фактически получили.
Если использовать аналогию, это можно уподобить оценке вероятности того, что монета действительно симметрична, по результатам определенного числа бросков. Если предполагается, что монета симметрична, и если из 10 бросаний выпадает 6 орлов, то вероятность несимметричности монеты с повышением частоты выпадения орлов равна вероятности выпадения 6 и более орлов из 10 бросаний, то есть 38 %. На этом этапе оценка становится субъективной. Означает ли это, что вероятность того, что монета симметрична, составляет только 38 %? Или это означает, что монета, вероятно, симметрична? Если бы это было возможно, вы собрали бы больше данных. Если вы не можете собрать больше данных, необходимо сделать вывод на основании имеющихся данных или вообще воздержаться от выводов.
При тестировании моделей со множеством ячеек, как в приведенной выше таблице, обычно ищут значимую кластеризацию в таблицах сопряженности признаков с помощью так называемой статистики хи-квадрат. Однако для малых выборок (например, когда N < 30) и для случаев, когда ожидаемое число ячеек меньше 5 более чем для 20 % ячеек, этот метод непригоден. Например, если у нас 9 компаний в столбце или строке, то следует ожидать, что число компаний в каждой ячейке будет равно 9/3, что меньше 5.
С учетом этого мы продолжим аналогию с моделированием. Предположим, что мы бросаем гипотетическую «симметричную» трехстороннюю монету k раз, где k – число компаний в строке или столбце. Затем мы оцениваем вероятность попадания m или более смоделированных компаний в одну и ту же ячейку. Мы повторяем этот процесс 10 миллионов раз, вычисляя процент времени, в течение которого m или более моделируемых компаний из k попадают в одну ячейку.
Таким образом, на самом деле мы проверяем, можно ли ожидать, что не меньше чем m компаний из k могут собраться вместе в любой из трех ячеек в строке (или столбце) случайным образом. Итак, приведенные выше значения в % – это вероятности того, что наблюдаемая кластеризация не является случайной («случайной» означает, что все фирмы имеют одинаковую вероятность [p = ⅓] попадания в каждую ячейку). Однако мы не утверждаем, что вся группа выглядит как наша выборка. Скорее мы утверждаем, что судя по нашей выборке, чтобы сделать выгодное вложение, нужно учитывать наличие систематических связей между относительной конкурентной позицией и результатами попарных сравнений.
Так, если у «чудотворцев» при сравнениях со «стайерами» неценовая конкурентная позиция обнаруживается в 6 раз чаще, чем ценовая, то мы не утверждаем, что так обстоят дела и во всей группе. Но мы утверждаем, что вероятность появления соотношения 6:1 в совокупности с равномерным распределением взаимоисключающих вариантов очень мала, и поэтому «чудотворцы» с большей вероятностью должны иметь неценовые конкурентные позиции, нежели ценовые. Это как если бы мы тестировали монету в предположении, что она симметрична, а у нас в семи бросаниях выпало шесть орлов. Вероятность того, что наша «монета» не смещена в сторону неценовой конкурентной позиции, при этом составляет 1,6 %. Мы не можем с уверенностью сказать, что она не имеет такого смещения, но не стали бы держать пари против этого.
Приложение Н. Изменения конкурентной позиции и изменения рентабельности
При исследованиях регрессии (см. главу 3) использовался обычный метод наименьших квадратов (МНК). Как правило, поскольку наши независимые и зависимые переменные – это трехкатегорийные дискретные переменные, можно было бы использовать упорядоченную пробит-модель, так как мы пытаемся оценить вероятность попадания в одну из трех заданных категорий для зависимой переменной (изменение эффективности: негативное, без изменений, позитивное).
Однако для такого анализа необходимо, чтобы каждая независимая переменная имела дисперсию для каждого состояния зависимой переменной. Здесь, к сожалению, «Изменение позиции» = 0 в каждом из пяти примеров, в которых «Изменение эффективности» = 0. В такой ситуации можно получить весьма неточные оценки коэффициентов регрессии и среднеквадратической ошибки.
Для сравнения – МНК позволяет обрабатывать такие данные. При переходе на МНК мы проигрываем в эффективности, поскольку зависимая переменная (изменение эффективности) не непрерывна, а категоризована. Однако предпочтительнее все же использовать этот более консервативный метод, чем получить смещенные оценки с помощью упорядоченного пробит-метода.
Для каждой из наших 18 выдающихся компаний мы можем охарактеризовать связь между изменением (или его отсутствием) для каждой категории эффективности и стратегической позицией. Здесь рассматриваются три зависимости. Во-первых, «стайеры» с большей вероятностью страдают от спадов, независимо от изменений позиции. Во-вторых, компании с неценовой конкурентной позицией с большей вероятностью работают с большей эффективностью, независимо от категории.
Однако наиболее важным и наиболее статистически значимым является третье эмпирическое заключение: смещение конкурентной позиции в сторону неценовой конкурентной позиции связано с последующим повышением рентабельности, а смещение конкурентной позиции в сторону ценовой конкурентной позиции связано с последующим снижением рентабельности.
Ниже приводятся детали регрессионного анализа, упомянутого в главе 3.
Таблица 52. Сводка данных
Регрессия 1. Stryker и Publix: обработка данных об изменениях рентабельности
Регрессия 2. Stryker и Publix: обработка данных без учета изменений рентабельности
Приложение I. Структура преимущества по рентабельности
Построив регрессии различий в показателях валовой прибыли, «других расходов» и оборачиваемости активов и различий в ФР по данным для каждой компании за каждый год (фирмо-год) по сравнению со среднеотраслевыми значениями, мы можем проверить наличие связи между преимуществом по ФР и влияющими на него факторами вне зависимости от формальных связей между ними.