Диапазон значений признака

Диапазон значений признака это интервал возможных значений всех элементов генеральной совокупности. Поскольку при обработке данных мы имеем дело с выборкой из генеральной совокупности, то интервал значений мы можем определить только с определенной степень точности. Мы не можем быть абсолютно уверены, что при увеличении объема выборки мы не получим значение признака, выходящее за пределы выбранного интервала значений. В то же время нельзя выбирать интервал значений слишком большим.

Существует три способа оценки интервала значений признака.

Первый способ. Оценка интервала значений признака исходя из теоретических соображений. Такой способ используется когда известно, что исследуемый признак описывается одним из теоретических законов распределения (нормальный закон, экспоненциальный и другие). В этом случае можно рассчитать интервал значений в который попадают все значения признака с определенной вероятностью (доверительный интервал).

Второй способ. Оценка интервала значений признака исходя из содержательного смысла признака. Исследователи чаще всего имеют дело не с абстрактными признаками, а с признаками смысл которых им хорошо известен. Например, если мы исследуем рост студентов университета. Для этого совершенно не обязательно измерять рост всех студентов (генеральная совокупность), а достаточно судить о росте студентов на основе выборки. Как в этом случае выбрать интервал значений. Маловероятно, что в выборку нам сразу попадется и самый рослый и самый низкорослый студенты. Но мы, исходя из здравого смысла, можем сказать, что самый низкорослый студент будет не меньше 152 сантиметров, а самый рослый студент будет не больше 210 сантиметров. Но мы, из того же здравого смысла, можем точно утверждать, что не будет среди студентов университета студента с ростом 5 сантиметров или 25 метров.

Третий способ. Оценка интервала значений признака эмпирическим путем, то есть на основе опыта наблюдения признака. Этот способ используется в тех случаях, когда исследователю ничего не известно об исследуемом признаке до совершения выборки. Этот способ оценки интервала значений является универсальным.

Рассмотрим методику оценки интервала значений признака эмпирическим способом в среде EXCEL. Оценку произведем для признака расположенного в восьмом столбце таблицы данных, созданной при моделировании данных. Расчет производится в несколько шагов. Результаты расчетов разместим в таблицу (рис. 3.3).

Рис. 3.3. Расчет диапазона значений признака

Первый шаг. Рассчитаем минимальное и максимальное значение признака:

(3.4)

(3.5)

Для расчета минимального и максимального значения признака используются функции EXCEL. Разница между минимальным значением случайного признака и максимальным значением называется размахом вариации.

Второй шаг. Рассчитывается левая граница (нижняя граница) признака и правая граница (верхняя граница) интервала значений признака:

(3.6)

(3.7)

То есть в качестве границ диапазона значений признака мы выбираем такие границы, которые немного меньше минимального значения и максимального значения выборки. Расширение диапазона регулируется множителем . Множитель целесообразно выбирать равным 0,005.

Третий шаг. Рассчитывается ширина диапазона значений признака:

(3.8)

Диапазон значений признака используется для расчета частотного рада. Расчет частотного ряда рассмотрим в следующем параграфе.