Таблицы частот
Цель. Таблицы частот или одновходовые таблицы представляют собой простейший метод анализа категориальных (номинальных) переменных. Часто их используют как одну из процедур разведочного анализа, чтобы просмотреть, каким образом различные группы данных распределены в выборке. Например, изучая зрительский интерес к разным видам спорта (с целью рекламы какого-либо продукта на ТВ), вы могли бы представить ответы респондентов следующей таблицей:
STATISTICA ОСНОВНЫЕ СТАТИСТИКИ |
ФУТБОЛ: «Просмотр футбола» | |||
Категория | Частота |
Кумулят. частота |
Процент |
Кумулят. процент |
ВСЕГДА: Всегда интересуюсь ОБЫЧНО: Обычно интересуюсь ИНОГДА: Иногда интересуюсь НИКОГДА: Никогда интересуюсь Пропущено |
39 16 26 19 0 |
39 55 81 100 100 |
39.00000 16.00000 26.00000 19.00000 0.00000 |
39.0000 55.0000 81.0000 100.0000 100.0000 |
Таблица показывает частоты, кумулятивные (накопленные) частоты, процент, кумулятивный процент респондентов, выразивших свой интерес к просмотру футбольных матчей в следующей шкале: (1) Всегда интересуюсь, (2) Обычно интересуюсь, (3) Иногда интересуюсь или (4) Никогда не интересуюсь.
Практически каждый исследовательский проект начинается с построения таблиц частот. Например, в социологических опросах таблицы частот могут отображать число мужчин и женщин, выразивших симпатию тому или иному политическому деятелю, число респондентов из определенной этнических групп, голосовавших за того или иного кандидата и т.д. Ответы, измеренные в определенной шкале (например, в шкале: интерес к футболу) также можно прекрасно свести в таблицу частот. В медицинских исследованиях табулируют пациентов с определенными симптомами. В маркетинговых исследованиях — покупательский спрос на товары разного типа у разных категорий населения. В промышленности — частоту выхода из строя элементов устройства, приведших к авариям или отказам всего устройства при испытаниях на прочность (например, для определения того, какие детали телевизора действительно надежны после эксплуатации в аварийном режиме при большой температуре, а какие нет). Обычно, если в данных имеются группирующие переменные, то для них всегда вычисляются таблицы частот.
Кросстабуляция (таблицы сопряженности, многовходовые таблицы).
Кросстабуляция — это процесс объединения двух (или нескольких) таблиц частот так, что каждая ячейка (клетка) таблицы представляется единственной комбинацией значений или уровней табулированных переменных. Таким образом, кросстабуляция позволяет совместить частоты появления наблюдений на разных уровнях рассматриваемых факторов. Следующая таблица отчетливо показывает сильную связь между двумя переменными: Возрастом (Взрослый или Ребенок) и любимым сортом Печенья (сорт A или сорт B).
ПЕЧЕНЬЕ: A | ПЕЧЕНЬЕ: B | ||
ВОЗРАСТ: ВЗРОСЛЫЙ | 50 | 0 | 50 |
ВОЗРАСТ: РЕБЕНОК | 0 | 50 | 50 |
50 | 50 | 100 |
Из таблицы видно, что все взрослые выбирают печенье A, а все дети — печенье B. Исследуя эти частоты, можно определить связи между табулированными переменными. Обычно кросстабулируются только группирующие (номинальные) переменные или переменные с относительно небольшим числом значений. Если вы хотите кросстабулировать непрерывную переменную (например, доход), то вначале ее следует перекодировать , разбив диапазон изменения на небольшое число интервалов (например, доход низкий, средний, высокий).