Таблицы частот и кросстабуляция

Таблицы частот

Цель. Таблицы частот или одновходовые таблицы представляют собой простейший метод анализа категориальных (номинальных) переменных. Часто их используют как одну из процедур разведочного анализа, чтобы просмотреть, каким образом различные группы данных распределены в выборке. Например, изучая зрительский интерес к разным видам спорта (с целью рекламы какого-либо продукта на ТВ), вы могли бы представить ответы респондентов следующей таблицей:

STATISTICA
ОСНОВНЫЕ
СТАТИСТИКИ
ФУТБОЛ: “Просмотр футбола”
Категория
Частота
Кумулят.
частота
Процент
Кумулят.
процент
ВСЕГДА: Всегда интересуюсь
ОБЫЧНО: Обычно интересуюсь
ИНОГДА: Иногда интересуюсь
НИКОГДА: Никогда интересуюсь
Пропущено
39
16
26
19
0
39
55
81
100
100
39.00000
16.00000
26.00000
19.00000
0.00000
39.0000
55.0000
81.0000
100.0000
100.0000

Таблица показывает частоты, кумулятивные (накопленные) частоты, процент, кумулятивный процент респондентов, выразивших свой интерес к просмотру футбольных матчей в следующей шкале: (1) Всегда интересуюсь, (2) Обычно интересуюсь, (3) Иногда интересуюсь или (4) Никогда не интересуюсь.

Практически каждый исследовательский проект начинается с построения таблиц частот. Например, в социологических опросах таблицы частот могут отображать число мужчин и женщин, выразивших симпатию тому или иному политическому деятелю, число респондентов из определенной этнических групп, голосовавших за того или иного кандидата и т.д. Ответы, измеренные в определенной шкале (например, в шкале: интерес к футболу) также можно прекрасно свести в таблицу частот. В медицинских исследованиях табулируют пациентов с определенными симптомами. В маркетинговых исследованиях – покупательский спрос на товары разного типа у разных категорий населения. В промышленности – частоту выхода из строя элементов устройства, приведших к авариям или отказам всего устройства при испытаниях на прочность (например, для определения того, какие детали телевизора действительно надежны после эксплуатации в аварийном режиме при большой температуре, а какие нет). Обычно, если в данных имеются группирующие переменные, то для них всегда вычисляются таблицы частот.

Кросстабуляция (таблицы сопряженности, многовходовые таблицы).

Кросстабуляция – это процесс объединения двух (или нескольких) таблиц частот так, что каждая ячейка (клетка) таблицы представляется единственной комбинацией значений или уровней табулированных переменных. Таким образом, кросстабуляция позволяет совместить частоты появления наблюдений на разных уровнях рассматриваемых факторов. Следующая таблица отчетливо показывает сильную связь между двумя переменными:  Возрастом (Взрослый или Ребенок) и любимым сортом Печенья (сорт A или сорт B).

 
ПЕЧЕНЬЕ: A
ПЕЧЕНЬЕ: B
 
ВОЗРАСТ: ВЗРОСЛЫЙ
50
  0
50
ВОЗРАСТ: РЕБЕНОК
  0
50
50
 
50
50
100

Из таблицы видно, что все взрослые выбирают печенье A, а все дети – печенье B. Исследуя эти частоты, можно определить связи между табулированными переменными. Обычно кросстабулируются только группирующие (номинальные) переменные или переменные с относительно небольшим числом значений. Если вы хотите кросстабулировать непрерывную переменную (например, доход), то вначале ее следует перекодировать , разбив диапазон изменения на небольшое число интервалов (например, доход низкий, средний, высокий).

Запись опубликована в рубрике Статистика, Точные науки. Добавьте в закладки постоянную ссылку.