Задача 2

Задача 1

Для варианта №5 группы 9051 массив чисел выглядит следующим образом:

4, 8, 3, 4, 7, 9, 3, 10, 10, 11, 7, 7, 4, 7, 8, 12, 5, 9, 7, 6, 8, 9, 4, 8, 9, 9, 6, 12, 8, 6.

1.1

Исследуемым признаком Х является ежедневные продажи некоторого товара (в штуках), т.е. случайные величины могут принимать любые целые значения, не зависящие друг от друга. Случайную величину называют дискретной, если она принимает отдельные, изолированные друг от друга значения.

Следовательно, Х – это дискретный признак.

За продажами наблюдали 30 дней, следовательно, объем выборки - 30 значений (n=30)

Для изучения признака Х, прежде всего, сгруппируем данные и представим их в виде дискретного статистического ряда:

(табл. 1.1):

Xi Сумма
νi
Pi 0,067 0,133 0,033 0,1 0,167 0,167 0,167 0,067 0,033 0,067

 

где, Xi - Значение случайной величины;

νi – частота выборки Хi;

Pi – относительная вероятность ( )

Поскольку исследуемый признак является дискретным, то по данным таблицы 1.1. строим полигон частот:

 

 
 

Эмпирическая функция распределения F*(x):

F* ,

где - число элементов выборки , значения которых меньше х.

 

0, х≤3

0, 067 х (3;4]

0,2 x (4;5]

0,233 x (5;6]

0,333 x (6;7]

0,5 x (7;8]

0,667 x (8;9]

0,833 x (9;10]

0,9 x (10;11]

0,933 x (11;12]

1 x>12


1.2

Полигон частот позволяет сравнить визуально и сделать предположения о близости распределения исследуемого признака к тому или иному закону распределения.

По построенному полигону частот можно сделать предположение, что распределение признака Х имеет биномиальное распределение (параметры которого пока что нам неизвестны).

1.3

Найдем выборочную среднюю (

1) Исходные данные представлены простой выборкой:

2) Выборочные данные представлены статистическим рядом (сгруппированные данные):

Выборочную дисперсию (S2) также найдем двумя способами:

1) Вариационный ряд:

S2 =

2) Сгруппированные данные:

S2 =

S2=

Среднее квадратическое (стандартное) отклонение (S):

1.4

0.95 + ((К+М)(mod5))/100) = 0,95+((5+1)(mod5))/100)=0,96

Оценим с надежностью 0,96 среднее значение а и дисперсию σ2.

Приближенные значения неизвестных параметров а и σ2 задаются соответствующими характеристиками, т.е. а ; σ2 S2

Для оценки этих параметров с заданной точностью следует построить доверительные интервалы:

- для теоретического среднего а

Имеем:

Объем выборки: n=30

Доверительная вероятность: γ=0,96

Следовательно, =1-0,96=0,04

Значение найдем по таблице «Квантили стандартного нормального распределения»

Доверительный интервал:

6,412 8,255

Получили доверительный интервал (6,412; 8,255)

 

 

Строим доверительный интервал для дисперсии, соответствующее доверительной вероятности 0,96:

n=30

=1-0,96=0,04

По таблице квантилей χ2-распределения

p=0,98

pЄ[0,975; 0,99]

По таблице квантилей χ2-распределения

p=0,02

pЄ[0,01; 0,025]

Доверительный интервал:

Получили доверительный интервал ( )

 

 

1.5

Уровень значимости 0,05-((К+М)( mod5))/100

0,05-((5+1)(mod5))/100= 0,05-1/100 = 0,04

Проверим нулевую гипотезу Н0:{a= } против альтернативной гипотезы Н1:{a≠ } при уровне значимости α=0,04

Область принятия гипотезы при двусторонней альтернативе определяется неравенством:

, где статистика критерия

т.к. 0,372 < 2,0537 то гипотезу Н0 принимаем в качестве допустимой гипотезы

Проверим нулевую гипотезу Н0:{σ2= } против альтернативной гипотезы Н1:{ σ2 } при уровне значимости α=0,04

Область принятия гипотезы при двусторонней альтернативе определяется неравенством:

, где статистика критерия

Получили неравенство , что не противоречит области принятия гипотезы, поэтому гипотезу Н0 принимаем в качестве допустимой гипотезы.

 

 

1.6

Проверим выдвинутую при решении задачи 1.2гипотезу (H0) о биномиальном распределении исследуемого признака на уровне значимости

Конкурирующая гипотеза (H1) состоит в том, что признак Х имеет любо другое распределение кроме биномиального.

Как известно, биномиальное распределение характеризуется двумя параметрами (m=2): n* и p

n*=max xi=12

Xi νi Pi n*Pi
{0;1;2;3;4} 0,049 1,456 14,189
{5;6} 0,257 7,718 1,791
0,224 6,727 0,443
0,220 6,607 0,391
0,154 4,614 0,032
{10;11;12} 0,096 2,878 1,564
Сумма 1,000 18,411

νi≥4

Если в таблице значения объединены, то соответствующая им вероятность равна сумме вероятностей Ро, Р1, Р2, Р3, Р4 ; Р5, Р6 и Р10, Р11, Р12

= 18,411

Для К=6 промежутков группировки значений признака Х, m=2 оцененных по выборке параметров распределения и заданного уровня значимости α=0,07находим значение квантиля «хи-квадрат» распределения:

(k-m-1) = (6-2-1)= (3)= 7,1894

 

 

рЄ[0,9; 0,95]

(3) = (3) +

Так как = 18,411> (k-m-1) = 7,1894, то нулевая гипотеза Ho о биномиальности распределении исследуемого признака Х противоречит имеющимся данным и её следует отвергнуть в пользу противоположной гипотезы.

 

 

Задача 2

Для 5-ого варианта группы 9051 массив чисел выглядит следующим образом:

48, 70, 31, 55, 32, 69, 75, 65, 52, 65, 41, 56, 62, 67, 54, 80, 34, 69, 52, 46, 45, 71, 32, 66, 70, 76, 72, 31, 62, 58, 71, 43, 51, 69, 46, 77, 34, 50, 54, 62

2.1

Исследуемым признаком Х является продолжительность телефонных разговоров с клиентами некоторой справочной телефонной службы.

Непрерывной называют случайную величину, которая может принимать любые значения из некоторого бесконечного или конечного промежутка, а продолжительность телефонного звонка имеет настолько большое число значений, что их удобнее представлять в виде непрерывных случайных величин.

т.е. тип исследуемой случайной величины – непрерывный.

При выборке, полученной в результате наблюдений над непрерывным признаком, её элементы можно сгруппировать в интервальный статистический ряд. Для этого все n значений выборки следует разбить на k интервалов равной длины h. Число интервалов определяется по формуле Стержесса:

K=1+[log2n] = 1+ [log240] = 1 + 5 = 6

Длина интревалов группировки равна:

,167

 

 

Группируем данные в интервальный статистический ряд:

(табл. 2.1)

Интервалы   Частота, i Относительная частота, Pi(х)
39,167 0,018
39,167 47,333 0,015
47,333 55,5 0,024
55,5 63,667 0,015
63,667 71,833 0,034
71,833 0,015

 

Строим по данным таблицы 2.1 гистограмму частот:

Эмпирическая функция распределения F*(x):

0, x≤31

, x (31;32]

, x (32; 34]

, x (34; 41]

, x (41; 43]

, x (43; 45]

, x (45; 46]

, x (46; 48]

, x (48; 50]

, x (50; 51]

, x (51; 52]

, x (52; 54]

, x (54; 55]

F*(x) , x (55; 56]

, x (56; 58]

, x (58; 62]

, x (62; 65]

, x (65; 66]

, x (66; 67]

, x (67; 69]

, x (69; 70]

, x (70; 71]

, x (71; 72]

, x (72; 75]

, x (75; 76]

, x (76; 77]

, x (77; 80]

1, x>80

 

 

2.2

Построенная гистограмма позволяет предположить, что закон распределения исследуемого признака Х либо нормальный, либо близок к нормальному.

2.3

Найдем выборочную среднюю (вариационный ряд):

48 + 70 + 31 + 55 + 32 + 69 + 75 + 65 + 52 + 65 + 41 + 56 + 62 + 67 + 54 + 80 + 34 + 69 + 52 + 46 + 45 + 71 + 32 + 66 + 70 + 76 + 72 + 31 + 62 + 58 + 71 + 43 + 51 + 69 + 46 + 77 + 34 + 50 + 54 + 62)

для сгруппированных данных:

, где xi – середина интервала

Найдем выборочную дисперсию (вариационный ряд):

Для сгруппированных данных:

S2 = , где xi – середина интервала

Результаты для вариационного рядя, являются более точными.

В дальнейшем будем использовать более точные значения

Среднее квадратическое (стандартное) отклонение (S):

 

2.4

0.95 + ((К+М)(mod5))/100) = 0,95+((5+1)(mod5))/100)=0,96

Оценим с надежностью 0,96 среднее значение а и дисперсию σ2.

Приближенные значения неизвестных параметров а и σ2 задаются соответствующими характеристиками, т.е. а ; σ2 S2

Для оценки этих параметров с заданной точностью следует построить доверительные интервалы:

- для теоретического среднего а

n=40

ά=1-0,96=0,04

Значение найдем по таблице «Квантили стандартного нормального распределения»

Доверительный интервал:

51,950 61,200

Получили доверительный интервал (51,950; 61,200)

Строим доверительный интервал для дисперсии, соответствующее доверительной вероятности 0,96:

n=40

=1-0,96=0,04

По таблице квантилей χ2-распределения

n p 0,975 0,98 0,99
56,895   61,162
58,1185
59,342   63,691

39Є[38;40]

22,9128

n p 0,01 0,02 0,025
20,691   22,878
21,4275 22,9128 23,6555
22,164   24,433

39Є[38;40]

136,275

Получили доверительный интервал (136,275; )

1.5

Уровень значимости 0,05-((К+М)( mod5))/100

0,05-((5+1)(mod5))/100= 0,05-1/100 = 0,04

Проверим нулевую гипотезу Н0:{a= } против альтернативной гипотезы Н1:{a≠ } при уровне значимости α=0,04

Область принятия гипотезы при двусторонней альтернативе определяется неравенством:

, где статистика критерия

т.к. 0,699<2,0537 гипотезу Н0 принимаем в качестве допустимой гипотезы.

Проверим нулевую гипотезу Н0:{σ2= } против альтернативной гипотезы Н1:{σ2 } при уровне значимости α=0,04

Область принятия гипотезы при двусторонней альтернативе определяется неравенством:

, где статистика критерия

Получили неравенство , что не противоречит области принятия гипотезы, поэтому гипотезу Н0 принимаем в качестве допустимой гипотезы

2.6

Проверим гипотезу (Н0) о нормальном распределении исследуемого признака, выдвинутую в задаче 2.2

Уровень значимости

Альтернативная гипотеза (Н1) будет состоять в том, что признак Х имеет любое другое распределение, кроме нормального.

Гипотетический (нормальный) закон распределения исследуемого признака Х имеет вид

и зависит от двух неизвестных параметров (т.е. m=2).

В качестве оценок неизвестных параметров будут фигурировать соответственно , т.е. a*= , *=

интервал νi Pi n*Pi (νi-n*Pi)^2/n*Pi
⁻∞ 39,167 0,111 4,433   0,554
39,167 47,333 0,147 5,896   0,136
47,333 55,5 0,212 8,468   0,026
55,5 63,667 0,221 8,832   1,662
63,667 71,833 0,167 6,690   2,777
71,833 ⁺∞ 0,142 5,682   0,082
Сумма     5,237

 

= 0

= 1

 

= 0,111

= 0,147

= =0,212

= - = 0,221

= =0,167

= - = 0,142

= 5,237

Для К=6 промежутков группировки значений признака Х, m=2 оцененных по выборке параметров распределения и заданного уровня значимости α=0,07находим значение квантиля «хи-квадрат» распределения:

(k-m-1) = (6-2-1)= (3)= 7,1894

рЄ[0,9; 0,95]

(3) = (3) +

Так как = 5,237< (k-m-1) = 7,1894, то нулевая гипотеза Ho о нормальности распределения величины исследуемого признака Х согласуется с имеющимися данными, что подтверждает предположение, сделанное в задаче 2.2

 

 

 

 

Использованная литература:

1. Семенов А.Т., «Методические указания по выполнению индивидуального задания», Новосибирск, 2006.

2. Семенов А.Т., «Таблицы вероятностных распределений и квантилей», Новосибирск, НГАЭиУ, 1998.