Способы преобразования данных

  1. логарифмирование — используется , когда отсутствует нормальное распределение данных, существует большая асимметрия, выбросы, как следствие нельзя использовать метод вычисления среднего и линейную корреляцию Пирсона. Вот эта стандартизация и используется для симметризации данных;
  2. стандратизация в кластерном анализе нужна в силу того, что изначально данные находятся в разных единицах измерения, а после стандартизации размерность становится неважна и можно легко начать объединение в кластеры и получить достоверные результаты;
  3. во временных рядах используется сглаживание, которое всегда включает способ локального усреднения данных, при котором несистематические компоненты погашают друг друга (скользящее среднее, медианное сглаживание). Цель: фильтрация шума и преобразование данных в относительно гладкую кривую.
Запись опубликована в рубрике Статистика, Точные науки. Добавьте в закладки постоянную ссылку.