Возраст

 

Рис.5. Гистограмма распределения студентов по возрасту.

 

Кривая, соединяющая середины прямоугольников, называется полигоном распределения. Так как при достаточно большом числе n случаев, относительная частота появления тех или иных значений случайной величины x соответствует их вероятности Р(x), то можно считать, что площади прямоугольников, составляющих гистограмму, пропорциональны вероятностям попадания случайной величины в соответствующий интервал Dx. Высота прямоугольников будет являться плотностью распределения вероятностей. Функция плотности распределения вероятностей f(х) в этом случае имеет ступенчатый характер. При достаточно большом числе интервалов на гистограмме функция распределения вероятностей приобретает плавный характер (пунктирная линия на рис.5). В пределе, при Dx 0 построенное нами распределение дискретной случайной величины стремится к распределению непрерывной случайной величины. Таким образом, распределение непрерывной случайной величины можно приближенно заменить распределением дискретной случайной величины.

Для ряда непрерывных случайных величин, сгруппированных в классы, математическое ожидание и дисперсия вычисляются по формулам (3), (5), где m – число попаданий в класс, n – общее количество величин, <xi> – средняя величина в классе. В нашем примере:

Таблица 3

№ класса Величина интервала   <xi>   mi   Pi=mi/n   <xi>Pi   (<xi>-M)2   (<xi>-M)2 Pi
[15–18) 16,5 0,09 1,485 23,04 2,0736
[18–21) 19,5 0,48 9,36 3,24 1,5552
[21–24) 22,5 0,25 5,625 1,44 0,36
[24–27) 25,5 0,1 2,55 17,64 1,764
[27–30) 28,5 0,08 2,28 51,84 4,1472

å=100 М(x)=21,3 D(x)=9,9

=3,15

На практике ряд распределения (вариационный ряд) составляют следующим образом:

1. Из имеющихся значений признака x выбирают наименьшее (xmin), наибольшее (xmax), определяют размах распределения

(xmax – xmin).

2. Определяют число классов группировки. Для определения числа классов можно воспользоваться формулой: k=1+3,32·lg n, где n – число измерений. Величину k округляют до целых чисел.

3. Определяют оптимальную величину класса (интервала группировки) Dxi= . Эту величину также можно округлять соответственно точности значений x.

4. Выбирают границы классов. Границы первого класса следует выбрать так, чтобы он содержал наименьшее значение, но не начинался с него, например, класс может начинаться с величины (xmin ). Последующие классы образуются добавлением величины интервала Dxi. Если нижняя граница класса совпадает с верхней границей предыдущего класса, это значение следует отнести к данному классу. Например, [1–2), [2–3) и т.д.

5. Определяют середину интервала <xi>.

Задание: Для ряда измерений роста студентов сгруппировать данные по классам, определить математическое ожидание, дисперсию и среднее квадратическое отклонение. Построить гистограмму и полигон распределения.

148 158 150 162 170 156 186 151 161 152 171 165 174 157 172 172 177 166 157 149 159 154 164 167 173 176 147 163 185 164 161 153 168 162 184 162 169 154 167 163 166 172 158 155 165 179 165 160 159 169

Нормальный закон распределения случайных величин.

 

Для того чтобы обрабатывать результаты экспериментов, важно знать, к какому виду распределения случайных величин относятся полученные результаты. Например, в физике распределение скоростей молекул газа при тепловом движении подчиняется распределению Максвелла. Распределение дискретных случайных величин может подчиняться биномиальному закону, для редких событий справедливо распределение Пуассона и т.д. Важное место в статистике вообще и в биологической статистике в частности, занимает нормальное распределение(распределение Гаусса). Нормальное распределение возникает тогда, когда на изменение случайной величины действует множество различных независимых факторов, каждый из которых в отдельности не имеет преобладающего значения. Многие распределения биологических признаков, характеризующиеся непрерывной вариацией, а также ошибки измерений подчиняются нормальному закону.

Размещение вариант при нормальном распределении характеризуется определенными закономерностями:

Параметр m характеризует математическое ожидание (среднее арифметическое) случайной величины, являясь центром распределения и наиболее вероятным значением. Изменение математического ожидания не влияет на форму кривой, а только вызывает ее смещение вдоль оси x.

Параметр s характеризует изменчивость случайной величины (меру растянутости кривой вдоль оси x): чем большеs, тем больше кривая растянута.

График нормальной кривой симметричен относительно прямой x=m (одинаковые по абсолютной величине отрицательные и положительные отклонения случайной величины от центра равновероятны).

По мере увеличения разности (x–m) значение f(x) убывает. Это значит, что большие отклонения менее вероятны, чем малые. При (x–m) значение f(x) стремится к нулю, но никогда его не достигает.

График функции нормального распределения представляет собой колоколообразную кривую (рис.6).

 
 

Рис.6. Кривая нормального распределения.

 

Для нормального распределения, имеющего математическое ожидание mи среднее квадратическое отклонение s, плотность распределения вероятности имеет вид:

f(x) = , (13)

а функция распределения вероятности равна:

(14)

Для перехода от двух параметров распределения mи s к одному, делают замену переменной:

t= , dx= sdt, (15)

с помощью которой функцию (14) можно привести к виду:

(16)

Функция (16) не выражается через элементарные функции, но для нее составлены таблицы, которые называются таблицами нормального интеграла вероятности. Вероятность того, что значение случайной величины попадет в интервал от а до b:

Р(a<x<b)= (17)

при этом значения функции Ф находят по таблице 1 Приложения. Для нее выполняется соотношение: Ф(–t) = 1– Ф(t).

В нашем примере распределения студентов по возрасту, функция распределения будет иметь вид:

F(x)= dx (18)

Найдем вероятность того, что на первый курс поступят вундеркинды в возрасте младше 16 лет:

P(x<16)= =Ф(–1,6825)=1–0,9535=0,0465=4,65%.

Задание:Анализ веса 75 новорожденных детей показал, что у них в интервал от 1 до 1,9 кг попало 5 новорожденных, 2 – 2,9 кг – 25 новорожденных, 3 – 3,9 кг – 40 новорожденных, 4 – 4,9кг – 5 новорожденных. Записать функции плотности вероятности f(x) и распределения вероятностей F(x) для предполагаемого нормального распределения веса новорожденных, определить вероятность рождения недоношенного ребенка весом <2,5 кг.

Функция нормального закона распределения, как правило, симметрична относительно математического ожидания. Если же варианты накапливаются преимущественно в правой или левой части ряда, то говорят об асимметрии. Мерой скошенности ряда служит коэффициент асимметрии А. Для симметричных кривых распределения А равен нулю, для правоасимметричных А>0, для левоасимметричных А<0. Асимметрия считается незначительной, если А 0,2. При А 0,5 скошенность кривой считается сильной (рис.7а). Показатель эксцесса (Е) характеризует вершину кривой распределения.

А= ; E= – 3 (19)

Для распределений с резко выраженным пиком (островершинных)

Е >0, для плосковершинных Е <0 (рис 7б).

       
   
 

Рис.7а. Рис.7б.

 

Если число измерений в некоторых классах мало, или исследуемый материал не является однородным, можно наблюдать многовершинные распределения.