Задача 2
Задача 1
Для варианта №5 группы 9051 массив чисел выглядит следующим образом:
4, 8, 3, 4, 7, 9, 3, 10, 10, 11, 7, 7, 4, 7, 8, 12, 5, 9, 7, 6, 8, 9, 4, 8, 9, 9, 6, 12, 8, 6.
1.1
Исследуемым признаком Х является ежедневные продажи некоторого товара (в штуках), т.е. случайные величины могут принимать любые целые значения, не зависящие друг от друга. Случайную величину называют дискретной, если она принимает отдельные, изолированные друг от друга значения.
Следовательно, Х – это дискретный признак.
За продажами наблюдали 30 дней, следовательно, объем выборки - 30 значений (n=30)
Для изучения признака Х, прежде всего, сгруппируем данные и представим их в виде дискретного статистического ряда:
(табл. 1.1):
Xi | Сумма | ||||||||||
νi | |||||||||||
Pi | 0,067 | 0,133 | 0,033 | 0,1 | 0,167 | 0,167 | 0,167 | 0,067 | 0,033 | 0,067 |
где, Xi - Значение случайной величины;
νi – частота выборки Хi;
Pi – относительная вероятность ( )
Поскольку исследуемый признак является дискретным, то по данным таблицы 1.1. строим полигон частот:
Эмпирическая функция распределения F*(x):
F* ,
где - число элементов выборки , значения которых меньше х.
0, х≤3
0, 067 х (3;4]
0,2 x (4;5]
0,233 x (5;6]
0,333 x (6;7]
0,5 x (7;8]
0,667 x (8;9]
0,833 x (9;10]
0,9 x (10;11]
0,933 x (11;12]
1 x>12
1.2
Полигон частот позволяет сравнить визуально и сделать предположения о близости распределения исследуемого признака к тому или иному закону распределения.
По построенному полигону частот можно сделать предположение, что распределение признака Х имеет биномиальное распределение (параметры которого пока что нам неизвестны).
1.3
Найдем выборочную среднюю (
1) Исходные данные представлены простой выборкой:
2) Выборочные данные представлены статистическим рядом (сгруппированные данные):
Выборочную дисперсию (S2) также найдем двумя способами:
1) Вариационный ряд:
S2 =
2) Сгруппированные данные:
S2 =
S2=
Среднее квадратическое (стандартное) отклонение (S):
1.4
0.95 + ((К+М)(mod5))/100) = 0,95+((5+1)(mod5))/100)=0,96
Оценим с надежностью 0,96 среднее значение а и дисперсию σ2.
Приближенные значения неизвестных параметров а и σ2 задаются соответствующими характеристиками, т.е. а ; σ2 S2
Для оценки этих параметров с заданной точностью следует построить доверительные интервалы:
- для теоретического среднего а
Имеем:
Объем выборки: n=30
Доверительная вероятность: γ=0,96
Следовательно, =1-0,96=0,04
Значение найдем по таблице «Квантили стандартного нормального распределения»
Доверительный интервал:
6,412 8,255
Получили доверительный интервал (6,412; 8,255)
Строим доверительный интервал для дисперсии, соответствующее доверительной вероятности 0,96:
n=30
=1-0,96=0,04
По таблице квантилей χ2-распределения
p=0,98
pЄ[0,975; 0,99]
По таблице квантилей χ2-распределения
p=0,02
pЄ[0,01; 0,025]
Доверительный интервал:
Получили доверительный интервал ( )
1.5
Уровень значимости 0,05-((К+М)( mod5))/100
0,05-((5+1)(mod5))/100= 0,05-1/100 = 0,04
Проверим нулевую гипотезу Н0:{a= } против альтернативной гипотезы Н1:{a≠ } при уровне значимости α=0,04
Область принятия гипотезы при двусторонней альтернативе определяется неравенством:
, где статистика критерия
т.к. 0,372 < 2,0537 то гипотезу Н0 принимаем в качестве допустимой гипотезы
Проверим нулевую гипотезу Н0:{σ2= } против альтернативной гипотезы Н1:{ σ2≠ } при уровне значимости α=0,04
Область принятия гипотезы при двусторонней альтернативе определяется неравенством:
, где статистика критерия
Получили неравенство , что не противоречит области принятия гипотезы, поэтому гипотезу Н0 принимаем в качестве допустимой гипотезы.
1.6
Проверим выдвинутую при решении задачи 1.2гипотезу (H0) о биномиальном распределении исследуемого признака на уровне значимости
Конкурирующая гипотеза (H1) состоит в том, что признак Х имеет любо другое распределение кроме биномиального.
Как известно, биномиальное распределение характеризуется двумя параметрами (m=2): n* и p
n*=max xi=12
Xi | νi | Pi | n*Pi | |
{0;1;2;3;4} | 0,049 | 1,456 | 14,189 | |
{5;6} | 0,257 | 7,718 | 1,791 | |
0,224 | 6,727 | 0,443 | ||
0,220 | 6,607 | 0,391 | ||
0,154 | 4,614 | 0,032 | ||
{10;11;12} | 0,096 | 2,878 | 1,564 | |
Сумма | 1,000 | 18,411 |
νi≥4
Если в таблице значения объединены, то соответствующая им вероятность равна сумме вероятностей Ро, Р1, Р2, Р3, Р4 ; Р5, Р6 и Р10, Р11, Р12
= 18,411
Для К=6 промежутков группировки значений признака Х, m=2 оцененных по выборке параметров распределения и заданного уровня значимости α=0,07находим значение квантиля «хи-квадрат» распределения:
(k-m-1) = (6-2-1)= (3)= 7,1894
рЄ[0,9; 0,95]
(3) = (3) +
Так как = 18,411> (k-m-1) = 7,1894, то нулевая гипотеза Ho о биномиальности распределении исследуемого признака Х противоречит имеющимся данным и её следует отвергнуть в пользу противоположной гипотезы.
Задача 2
Для 5-ого варианта группы 9051 массив чисел выглядит следующим образом:
48, 70, 31, 55, 32, 69, 75, 65, 52, 65, 41, 56, 62, 67, 54, 80, 34, 69, 52, 46, 45, 71, 32, 66, 70, 76, 72, 31, 62, 58, 71, 43, 51, 69, 46, 77, 34, 50, 54, 62
2.1
Исследуемым признаком Х является продолжительность телефонных разговоров с клиентами некоторой справочной телефонной службы.
Непрерывной называют случайную величину, которая может принимать любые значения из некоторого бесконечного или конечного промежутка, а продолжительность телефонного звонка имеет настолько большое число значений, что их удобнее представлять в виде непрерывных случайных величин.
т.е. тип исследуемой случайной величины – непрерывный.
При выборке, полученной в результате наблюдений над непрерывным признаком, её элементы можно сгруппировать в интервальный статистический ряд. Для этого все n значений выборки следует разбить на k интервалов равной длины h. Число интервалов определяется по формуле Стержесса:
K=1+[log2n] = 1+ [log240] = 1 + 5 = 6
Длина интревалов группировки равна:
,167
Группируем данные в интервальный статистический ряд:
(табл. 2.1)
Интервалы | Частота, i | Относительная частота, Pi(х) | |
39,167 | 0,018 | ||
39,167 | 47,333 | 0,015 | |
47,333 | 55,5 | 0,024 | |
55,5 | 63,667 | 0,015 | |
63,667 | 71,833 | 0,034 | |
71,833 | 0,015 |
Строим по данным таблицы 2.1 гистограмму частот:
Эмпирическая функция распределения F*(x):
0, x≤31
, x (31;32]
, x (32; 34]
, x (34; 41]
, x (41; 43]
, x (43; 45]
, x (45; 46]
, x (46; 48]
, x (48; 50]
, x (50; 51]
, x (51; 52]
, x (52; 54]
, x (54; 55]
F*(x) , x (55; 56]
, x (56; 58]
, x (58; 62]
, x (62; 65]
, x (65; 66]
, x (66; 67]
, x (67; 69]
, x (69; 70]
, x (70; 71]
, x (71; 72]
, x (72; 75]
, x (75; 76]
, x (76; 77]
, x (77; 80]
1, x>80
2.2
Построенная гистограмма позволяет предположить, что закон распределения исследуемого признака Х либо нормальный, либо близок к нормальному.
2.3
Найдем выборочную среднюю (вариационный ряд):
48 + 70 + 31 + 55 + 32 + 69 + 75 + 65 + 52 + 65 + 41 + 56 + 62 + 67 + 54 + 80 + 34 + 69 + 52 + 46 + 45 + 71 + 32 + 66 + 70 + 76 + 72 + 31 + 62 + 58 + 71 + 43 + 51 + 69 + 46 + 77 + 34 + 50 + 54 + 62)
для сгруппированных данных:
, где xi – середина интервала
Найдем выборочную дисперсию (вариационный ряд):
Для сгруппированных данных:
S2 = , где xi – середина интервала
Результаты для вариационного рядя, являются более точными.
В дальнейшем будем использовать более точные значения
Среднее квадратическое (стандартное) отклонение (S):
2.4
0.95 + ((К+М)(mod5))/100) = 0,95+((5+1)(mod5))/100)=0,96
Оценим с надежностью 0,96 среднее значение а и дисперсию σ2.
Приближенные значения неизвестных параметров а и σ2 задаются соответствующими характеристиками, т.е. а ; σ2 S2
Для оценки этих параметров с заданной точностью следует построить доверительные интервалы:
- для теоретического среднего а
n=40
ά=1-0,96=0,04
Значение найдем по таблице «Квантили стандартного нормального распределения»
Доверительный интервал:
51,950 61,200
Получили доверительный интервал (51,950; 61,200)
Строим доверительный интервал для дисперсии, соответствующее доверительной вероятности 0,96:
n=40
=1-0,96=0,04
По таблице квантилей χ2-распределения
n p | 0,975 | 0,98 | 0,99 |
56,895 | 61,162 | ||
58,1185 | |||
59,342 | 63,691 |
39Є[38;40]
22,9128
n p | 0,01 | 0,02 | 0,025 |
20,691 | 22,878 | ||
21,4275 | 22,9128 | 23,6555 | |
22,164 | 24,433 |
39Є[38;40]
136,275
Получили доверительный интервал (136,275; )
1.5
Уровень значимости 0,05-((К+М)( mod5))/100
0,05-((5+1)(mod5))/100= 0,05-1/100 = 0,04
Проверим нулевую гипотезу Н0:{a= } против альтернативной гипотезы Н1:{a≠ } при уровне значимости α=0,04
Область принятия гипотезы при двусторонней альтернативе определяется неравенством:
, где статистика критерия
т.к. 0,699<2,0537 гипотезу Н0 принимаем в качестве допустимой гипотезы.
Проверим нулевую гипотезу Н0:{σ2= } против альтернативной гипотезы Н1:{σ2≠ } при уровне значимости α=0,04
Область принятия гипотезы при двусторонней альтернативе определяется неравенством:
, где статистика критерия
Получили неравенство , что не противоречит области принятия гипотезы, поэтому гипотезу Н0 принимаем в качестве допустимой гипотезы
2.6
Проверим гипотезу (Н0) о нормальном распределении исследуемого признака, выдвинутую в задаче 2.2
Уровень значимости
Альтернативная гипотеза (Н1) будет состоять в том, что признак Х имеет любое другое распределение, кроме нормального.
Гипотетический (нормальный) закон распределения исследуемого признака Х имеет вид
и зависит от двух неизвестных параметров (т.е. m=2).
В качестве оценок неизвестных параметров будут фигурировать соответственно , т.е. a*= , *=
интервал | νi | Pi | n*Pi | (νi-n*Pi)^2/n*Pi | ||
⁻∞ | 39,167 | 0,111 | 4,433 | 0,554 | ||
39,167 | 47,333 | 0,147 | 5,896 | 0,136 | ||
47,333 | 55,5 | 0,212 | 8,468 | 0,026 | ||
55,5 | 63,667 | 0,221 | 8,832 | 1,662 | ||
63,667 | 71,833 | 0,167 | 6,690 | 2,777 | ||
71,833 | ⁺∞ | 0,142 | 5,682 | 0,082 | ||
Сумма | 5,237 |
= 0
= 1
= 0,111
= 0,147
= =0,212
= - = 0,221
= =0,167
= - = 0,142
= 5,237
Для К=6 промежутков группировки значений признака Х, m=2 оцененных по выборке параметров распределения и заданного уровня значимости α=0,07находим значение квантиля «хи-квадрат» распределения:
(k-m-1) = (6-2-1)= (3)= 7,1894
рЄ[0,9; 0,95]
(3) = (3) +
Так как = 5,237< (k-m-1) = 7,1894, то нулевая гипотеза Ho о нормальности распределения величины исследуемого признака Х согласуется с имеющимися данными, что подтверждает предположение, сделанное в задаче 2.2
Использованная литература:
1. Семенов А.Т., «Методические указания по выполнению индивидуального задания», Новосибирск, 2006.
2. Семенов А.Т., «Таблицы вероятностных распределений и квантилей», Новосибирск, НГАЭиУ, 1998.