Нормировка значений признака
Методы преобразования данных
Некоторые методы обработки многомерных статистических данных требуют предварительной нормировки данных. Нормировка данных состоит в преобразовании данных к новой форме представления. Такие преобразования позволяют исключить влияние на результаты анализа принятых единиц измерения. Рассмотрим наиболее распространенные способы нормировки:
- центрирование;
- нормировка по максимальному значению;
- нормировка по минимальному значению;
- нормировка по среднему значению.
Приведем формулы для выполнения нормировок (5.1)-(5.4):
(5.1)
(5.2)
(5.3)
(5.4)
Рассмотрим пример выполнения нормировки признаков X и Y. Исходные значения признаков приведены на рис. 5.1.
Рис. 5.1. Исходные значения признаков X и Y
Результаты расчета параметров признаков X и Y приведены на рис. 5.2. Коэффициент корреляции равен -0, 62. Результаты выполнения операции нормировки приведены на рис. 5.3.
Рис. 5.2. Расчет параметров признаков X и Y
Рис. 5.3. Результаты нормировки признаков X и Y
Нормировка центрирование может быть выполнена с помощью функции EXCEL НОРМАЛИЗАЦИЯ (рис. 5.4).
Рис. 5.4. Функция EXCEL НОРМАЛИЗАЦИЯ