Нормировка значений признака

Методы преобразования данных

Некоторые методы обработки многомерных статистических данных требуют предварительной нормировки данных. Нормировка данных состоит в преобразовании данных к новой форме представления. Такие преобразования позволяют исключить влияние на результаты анализа принятых единиц измерения. Рассмотрим наиболее распространенные способы нормировки:

- центрирование;

- нормировка по максимальному значению;

- нормировка по минимальному значению;

- нормировка по среднему значению.

Приведем формулы для выполнения нормировок (5.1)-(5.4):

(5.1)

(5.2)

(5.3)

(5.4)

Рассмотрим пример выполнения нормировки признаков X и Y. Исходные значения признаков приведены на рис. 5.1.

Рис. 5.1. Исходные значения признаков X и Y

Результаты расчета параметров признаков X и Y приведены на рис. 5.2. Коэффициент корреляции равен -0, 62. Результаты выполнения операции нормировки приведены на рис. 5.3.

Рис. 5.2. Расчет параметров признаков X и Y

Рис. 5.3. Результаты нормировки признаков X и Y

Нормировка центрирование может быть выполнена с помощью функции EXCEL НОРМАЛИЗАЦИЯ (рис. 5.4).

Рис. 5.4. Функция EXCEL НОРМАЛИЗАЦИЯ