Способы преобразования данных
- логарифмирование — используется , когда отсутствует нормальное распределение данных, существует большая асимметрия, выбросы, как следствие нельзя использовать метод вычисления среднего и линейную корреляцию Пирсона. Вот эта стандартизация и используется для симметризации данных;
- стандратизация в кластерном анализе нужна в силу того, что изначально данные находятся в разных единицах измерения, а после стандартизации размерность становится неважна и можно легко начать объединение в кластеры и получить достоверные результаты;
- во временных рядах используется сглаживание, которое всегда включает способ локального усреднения данных, при котором несистематические компоненты погашают друг друга (скользящее среднее, медианное сглаживание). Цель: фильтрация шума и преобразование данных в относительно гладкую кривую.
Запись опубликована в рубрике
Статистика,
Точные науки. Добавьте в закладки
постоянную ссылку.