Суть: 2 переменных, 1 из которых – время => график и таблицы – временные ряды. По ОХ всегда время.
Цели:
- найти модель, которая объяснит, как меняются данные
- на основе модели построить прогноз
Правила:
- длина временного ряда должна быть больше длины прогноза (90\10)
- временной ряд должен быть эмпирическим
- временной ряд должен охватывать равные промежутки времени
График: двухмерный, линейный.
Традиционные подходы:
- математическое нахождение модели временного ряда;
- прогнозирование.
Базовая линия – линия эмпирических данных; должна удовлетворять следующим условиям:
- построена на результате наблюдений;
- нежелателен пропуск данных;
- интервалы, в которых находятся значения, должны быть одинаковы;
- измерения должны проводиться в одно и то же время (ex: по вторникам, если интервал неделя).
Методы:
- модель регрессии (простейший случай анализа временного ряда). В Exell’е: функция множественной регрессии и экспоненциального роста.
- метод скользящего среднего
- Экспоненциальное сглаживание (делается прогноз и сравнивается с результатом).
Статистические методы
y=T+S+C+E, где
Т – тренд (тенденция)
S – сезонная составляющая (цены имеют сезонный характер в большинстве случаев)
С – циклическая составляющая
Е – случайная флуктуация.
Аддитивная и мультипликативная модели:
Используются математические методы:
- Метод экспоненциального сглаживания (богатые графические возможности: визуализация данных, можно увидеть тренд, характер зависимости (линейный/ нелинейный), разброс). +возможность прогноза на основании эмпирических данных;
- АРПСС (метод авторегрессии проинтегрированного скользящего среднего).
Авторегрессия – во временных рядах значение в последующем интервале зависит от значения в предыдущем (Ex: идущий человек – положение человека в каждый последующий момент времени зависит от его положения в предыдущий момент времени).
Лаг – разность отрезков времени.
Задача этих методов – выделить тренд, цикличность и останется “белый шум” (математическое ожидание и дисперсия).
Методы используются, когда есть все составляющие (T,S,C) и зависимость.
Этапы анализа данных в SPSS:
- Преобразование базового ряда, модель;
- взятие разности с тем или иным лагом;
- логарифмирование;
- идентификация модели (какие параметры и в каком количестве входят в модель).
p – параметр авторегрессии
P – сезонный параметр авторегрессии
q — параметр скользящего среднего
Q — сезонный параметр скользящего среднего
- оценивание параметров через функцию потерь;
- прогноз (обычно на 10% временного ряда);
- метод сезонной декомпозиции;
- анализ прерванных временных рядов (временные ряды с интервенцией) – какой-то фактор очень сильно вмешался во временной ряд, но одноразово;
- анализ распределенных лагов (регрессионный анализ 2-ух временных рядов);
- спектральный анализ (плохая визуализация)
Ex: циклы солнечной активности.