Построение гистограммы частоты признака

 

Прежде чем воспользоваться процедурой Excel построения гистограммы необходимо найти границы интервалов группировки

 

Вычислим интервалы группировки.

В рассматриваемом варианте n = 53.

Число интервалов группировки k в Excel вычисляется по формуле

 

,

где, скобки означают – округление до целой части числа в меньшую сторону, следовательно. = 8.

 

Величина интервала группировки вычисляется по формуле

 

 

Тогда, так как , то

 

.

 

Строгого научного обоснования для определения числа интервалов группировки и их величины нет. Существует много эмпирических формул для определения числа k.

Разброс значений числа k (числа интервалов группировки), который дают эти формулы, позволяет исследователю выбрать удобные для вычисления границы частичных интервалов группировки. Так в рассматриваемом варианте исходных данных 99,5, а максимальное значение 117,88. Дробные величины неудобны для восприятия.

Тогда, пусть левая (нижняя) граница всего интервала будет равной = 98 (меньше 99,5), а величина интервала группировки ,

следовательно, = 98+3 = 101,

= 101+3 = 104,

=107,

= 110

= 113

= 116

= 119

 

Пусть верхняя граница последнего частичных интервалов группировки будет = 119, так как 117,88 входит в этот последний интервал.

 

Получили границы интервалов группировки (карманы, как их называют в Excel) красивыми целыми числами. Занесите полученные результаты в столбец Excel, рис.7.

 

 

Рис. 7. Массив границ (карманов) группировки A57:A64

Теперь можно приступить к построению гистограммы.

 

В главном меню Excel выбрать Данные → Анализ данных → Гистограмма → ОК.

Далее необходимо заполнить поля ввода в диалоговом окне Гистограмма.

Входной интервал: 53 случайных чисел (вариант, значений признака) в ячейках $B$2: $B$54;

Интервал карманов: ввести массив границ интервалов группировки (карманов) ис 2 A57:A64;

Выходной интервал: адрес ячейки, с которой начинается вывод результатов процедуры Гистограмма;

Вывод графика – поставьте галочку. OK.

 

Рис. 8. Диалоговое окно Гистограмма с заполненными полями.

 

Если в диалоговом окне Гистограммаполе ввода Интервал карманов не заполняется, то процедура вычисляет число интервалов группировки k и границы интервалов автоматически.

 

В результате выполнения процедуры Гистограмма появляется таблица, содержащая границы интервалов группировки (столбец – Карман) и частоту попадания признака выборки в k–ый интервал (столбец Частота).

 

Справа от таблицы – график гистограммы.

 

 

Рис. 9. Фрагмент листа Excel с результатами процедуры Гистограмма

 

Принято столбики гистограммы строить без зазора.

 

Приведите гистограмму к виду как показано на рис. 10.

Для этого щелкните правой кнопкой мыши на столбике диаграммы и выберите Формат ряда данных → Без зазора → Нет заливки.Выберите цвет границ, стили границ и толщину линии границ.

 

 

 

Рис. 10. Гистограмма частот

 

При вычислении моды для интервального вариационного ряда необходимо определить модальный интервал (по максимальной частоте), а затем – значение моды по формуле

 

Модальный интервал

 

 

 


 

 


 

 

 

 


 

Рис 11. График гистограммы с модальным интервалом, интервалом предшествующим модальному и следующим за модальным интервалам.

 

Для рассматриваемого варианта:

 

= 107, = 110 - это границы модального интервала

 

= 8 – частота интервала, предшествующего модальному интервалу;

 

= 14 – частота модального интервала;

 

= 11 – частота интервала, следующего за модальным интервалом.

 

 

 

 

Среднее = 108,9134, Мода = 109 , Медиана = 109,5;

Медиану можно найти графическим способом, построив кумуляту.

 

Для построения кумуляты в таблице Карман-Частота добавьте столбец накопленных эмпирических частот . ( )

 

 

 

 

Рис 12. Таблица Карман-Частота, полученная при построении гистограммы, с добавленным столбцом накопленных эмпирических частот.

 

 

Далее постройте график кумуляты.

 

Медиана соответствует варианте, стоящей в середине ранжированного ряда. Положение медианы определяется ее номером .

На оси графика кумуляты отложите . Найдите соответствующее значение варианты

 

 

 

Рис 13. График кумуляты с определенным графическим способом значением .

 

 

Приблизительное равенство оценок = 108,9134, = 109 и = 109,5 позволяет предположить, что распределения признаков генеральной совокупности имеет нормальныйзакон.

 

По виду гистограммы можно принять гипотезу о нормальном распределении признаков (случайных чисел) выборки.

 

Далее, для того чтобы убедиться в правильности выбранной гипотезы (по крайней мере визуально) надо, первое – построить график гипотетического нормального закона распределения, выбрав в качестве параметров (среднее и среднее квадратическое отклонение) их оценки (оценки среднего и стандартного отклонения), и совместить график гипотетического распределения с графиком гистограммы.

 

И, второе – используя критерий согласия Пирсона установить справедливость выбранной гипотезы.