Элементы статистического анализа эмпирических данных – частотное распределение.

Первым шагом в анализе данных всегда является построение частотных распределений для каждой изучавшейся переменной.

Частотное распределение – это упорядоченный подсчет количества признаков по каждому значению переменной.

Для облегчения работы с частотными распределениями, а также для обобщенного представления их характеристик, обычно используют определенные числовые значения - статистики. Наибольшее практическое значение имеют две группы статистик: меры центральной тенденции и меры изменчивости (разброса).

Меры центральной тенденции указывают на расположение среднего, или типичного, значения признака, вокруг которого сгруппированы остальные наблюдения. Способность среднего значения давать некую обобщенную информацию о распределении вытекает из того соотношения, которое связывает среднее значение с другими «особыми» точками распределения - минимумом и максимумом: зная среднее значение, мы можем утверждать, что наименьшее наблюдаемое значение полученного распределения было не больше среднего, а наибольшее зафиксированное значение - не меньше среднего. В статистике понятие среднего значения может быть строго задано лишь для одномерного распределения переменной-признака.

Самой простой из мер центральной тенденции является мода (Мо). Для номинальных переменных мода - это единственный способ указать наиболее типичное, распространенное значение. Мода - это такое значение в совокупности наблюдений, которое встречается чаще всего. Например, если в выборке содержится 60% православных, 30% мусульман и 10% представителей других конфессий, то модальным значением будет «православный». У моды как меры центральной тенденции есть определенные недостатки, ограничивающие ее интерпретацию: в распределении могут быть две и более моды (соответственно оно является бимодальным или мультимодальным).

Медиана (Md) - это значение, которое делит упорядоченное множество данных пополам, так что одна половина наблюдений оказывается меньше медианы, а другая - больше.

Необходимо знать не только то, что типично для выборки наблюдений, но и установить, насколько выражены отклонения от типичных значений. Чтобы определить, насколько хорошо та или иная мера центральной тенденции описывает распределение, нужно воспользоваться какой-либо мерой изменчивости, разброса.

Дисперсия вариационного ряда – средняя арифметическая квадратов отклонений вариантов от их средней арифметической.

Величина, равная квадратному корню из дисперсии, называется стандартным отклонением (sx):

Очевидной интерпретацией стандартного отклонения является его способность оценивать «типичность» среднего: стандартное отклонение тем меньше, чем лучше среднее суммирует, «представляет» данную совокупность наблюдений.