Пример решения задачи

ØЗадача 3

В результате наблюдений пары случайных величин и получены данные, которые представлены в виде табл. 13

Таблица 13

-291 -219 -241 -240
-270 -281 -243 -277
-279 -262 -245 -279
-282 -302 -282 -253
-254 -275 -252 -275
-264 -267 -276 -248
-216 -290 -276 -243
-276 -266 -246 -264
-248 -270 -284 -267
-253 -283 -271 -213
-276 -237 -227 -218
-262 -222 -256 -223
-234 -281 -309 -278
-243 -269 -300 -236
-313 -257 -310 -263
-278 -235 -255 -268
-292 -275 -252 -243
-271 -276 -274 -271
-256 -282 -291    
-291 -277 -264    

 

Требуется:

1) построить корреляционную таблицу;

2) построить корреляционное поле;

3) построить уравнение регрессии на ;

4) вычислить выборочный коэффициент корреляции ;

5) сделать вывод о связи переменных и .

Решение

Задачу решаем с помощью электронного процессора MS Excel.

Алгоритм

Шаг 1. Внесём данные в таблицу, состоящую из двух столбцов, не забудьте в первой строке внести обозначения столбцов, в нашем случае это будут и .

Шаг 2. Для каждой из переменных и найдём наибольшее и наименьшее значения, используя статистические функции МИН и МАКС: , ;

, .

Шаг 3. Найдём размах для каждой из переменных и : и соответственно:

;

.

Шаг 4. Положим число интервалов для переменной равно 6, число интервалов для переменной равно 7. Как правило, число интервалов для каждой из переменных берут в пределах от 5 до 11. Критерием выбора числа интервалов служит требование: вариационный ряд не должен быть большим (формула Стерджеса), следовательно, и корреляционная таблица будет обозримой.

Шаг 5. Найдём шаги , для переменных и . В нашем случае

; .

Шаг 6. Для каждой из переменных и найдём начальные значения , первых интервалов, и конечные значения , последних интервалов.

Начальные значения вычисляем как

, .

Для конечных значений , последних интервалов для переменных и должны выполняться условия:

, .

Границы промежуточных интервалов получаем, следуя правилу:

, , .

Для переменной в нашем случае будем иметь:

.

Округляем до целых значений: .

Границы интервалов: ; .

Проверяем выполнение условия, наложенного на конечное значение последнего интервала для переменной :

.

Итак, интервалы для переменной :

).

Для переменной в нашем случае будем иметь:

.

Округляем до целых значений: .

Границы интервалов:

; .

Проверяем выполнение условия, наложенного на конечное значение последнего интервала для переменной :

.

Интервалы для переменной :

,

.

Шаг 7. Скопируем данные на новое место и выполним сортировку данных в порядке возрастания по первому столбцу. Данные в таком виде потребуются для заполнения корреляционной таблицы, а именно для вычисления чисел .

Шаг 8. Построим интервалы для каждой из переменных и , вычислим число значений и , попадающих на каждый из интервалов:

Интервалы Интервалы
   

Значения можно использовать для контроля правильности заполнения корреляционной таблицы.

Шаг 9. Построим корреляционную таблицу:

  (53; 58] (58; 63] (63; 68] (68; 73] (73; 78] (78; 83)
(-321; -304]          
(-304; -287]          
(-287; -270]        
(-270; -253]        
(-253; -236]        
(-236; -219]        
(-219; -202)          

 

Используем полученные ранее значения , чтобы убедиться в том, что корреляционная таблица построена верно, объём выборки , по столбцам:

;

по строкам:

.

Шаг 10. Найдём середины интервалов для переменной :

Интервалы (53; 58] (58; 63] (63; 68] (68; 73] (73; 78] (78; 83)
Середины интервалов 55,5 60,5 65,5 70,5 75,5 80,5

Найдём середины интервалов для переменной :

 

Интервалы (-321; -304] (-304; -287] (-287; -270] (-270; -253]
Середины интервалов -312,5 -295,5 -278,5 -261,5

 

Интервалы (-253; -236] (-236; -219] (-219; -202)
Середины интервалов -244,5 -227,5 210,5

Найдём условные средние :

-213,90 -235,06 -252,15 -273,86 -293,38 -312,50

 

Построим вспомогательную таблицу (табл.14), которая будет основой для построения поля корреляции.

Таблица 14

55,5           -227,5 -210,5 -213,90
60,5         -244,5 -227,5   -237,06
65,5       -261,5 -244,5     -252,15
70,5     -278,5 -261,5       -273,86
75,5   -295,5 -278,5         -293,38
80,5 -312,5             -312,50

 

Построим корреляционное поле (рис. 7).

 

Рис. 7. Поле корреляции

Шаг 11. Подготовим новую таблицу для вычисления коэффициентов системы линейных уравнений (2) относительно . Все вычисления приведены в табл. 15.

Þ Примечание. Следует заметить, что все данные предыдущего шага надо брать из табл. 15.

Шаг 12. Запишем уравнение регрессии на . В нашем случае это будет уравнение

.

Анализируя данное уравнение, можно сказать, что имеем отрицательную (обратную) корреляцию, поскольку коэффициент регрессии .

Шаг 13. Вычислим выборочный коэффициент корреляции (4): . Согласно шкале Чеддока связь между переменными величинами и весьма высокая, согласно шкале Голубкова - сильная.

Шаг 14. Для построения уравнения регрессии сформируем дополнительную табл. 16, содержащую:

- средние значения переменной ,

- средние значения переменной (обозначим ),

- значения переменной , вычисленные на основании уравнения регрессии (обозначим ),

- разность между экспериментальным и теоретическим значениями переменной : , а также для получения оценки метода наименьших квадратов (МНК) [4].

 


Таблица 15

Y\X   (53; 58] (58; 63] (63; 68] (68; 73] (73; 78] (78; 83)          
  ycp\xcp 55,5 60,5 65,5 70,5 75,5 80,5
(-321;-304] -312,5           -937,5 241,5 -75468,75 292968,75
(-304;-287] -295,5           -2068,5 528,5 -156171,75 611241,75
(-287;-270] -278,5         -6962,5 1767,5 -492248,75 1939056,25
(-270;-253] -261,5         -4707,0 1224,0 -320076,00 1230880,50
(-253;-236] -244,5         -3667,5 962,5 -235331,25 896703,75
(-236;-219] -227,5         -1365,0 358,0 -81445,00 310537,50
(-219;-202) -210,5           -842,0 222,0 -46731,00 177241,00
  -20550,0   -1407472,50 5458629,50
  277,50 544,50 1310,00 2326,50 604,00 241,50 5304,00        
  15401,25 32942,25 85805,00 164018,25 45602,00 19440,75   = 6,46  
  -1069,50 -2115,50 -5043,00 -9037,50 -2347,00 -937,50     = -3,97  
  -213,90 -235,06 -252,15 -273,86 -293,38 -312,50          
                  Уравнение регрессии Y на X: y=6,46-3,97*x
Коэффициенты системы относительно ,   =            
  78,0 5304,0 -20550,0   =            
  5304,0 363209,5 -1407472,5   = -785655   Дисп.х: 32,5 Ср_кв_откл для х: 5,7
                Дисп.y: 570,4 Ср_кв_откл для y: 23,9
                         
                         
                             

Из полученной таблицы выпишем коэффициенты системы (2):

Решая систему (2), получаем коэффициенты уравнения регрессии , .

 


Таблица 16

55,5 -213,90 -213,88 -0,0250 0,0006
60,5 -235,06 -233,73 -1,3350 1,7822
65,5 -252,15 -253,58 1,4250 2,0306
70,5 -273,86 -273,43 -0,4350 0,1892
75,5 -293,38 -293,28 -0,1050 0,0110
80,5 -312,50 -313,13 0,6250 0,3906
      4,40

Шаг 15. На основании сформированной табл.16 построим уравнение регрессии на (рис. 7).

 

Рис. 7. Уравнение регрессии и условные средние значения

G Вывод. Между переменными и установлена сильная обратная корреляция, уравнение регрессии на : , выборочный коэффициент корреляции . Из табл. 16 можно увидеть, что [4].

 

 

Варианты заданий

 

В результате наблюдений пары случайных величин и получены данные, которые представлены в виде таблицы.

Требуется:

1) построить корреляционную таблицу;

2) построить корреляционное поле;

3) построить уравнение регрессии на ;

4) вычислить выборочный коэффициент корреляции ;

5) сделать вывод о связи переменных и .

 

 

Вариант 0

Таблица 0

           

.

 

 

PВариант 1

Таблица 1

-201 -237 -226 -279
-199 -209 -218 -259
-206 -243 -245 -251
-221 -239 -247 -207
-238 -221 -201 -257
-256 -238 -215 -227
-222 -238 -209 -214
-230 -223 -212 -243
-234 -207 -203 -214
-217 -237 -252 -196
-253 -216 -251 -239
-228 -228 -206 -210
-230 -193 -214 -221
-201 -234 -227    
-237 -229 -269    

.

 

PВариант 2

Таблица 2

.

 

 

PВариант 3

Таблица 3

.

PВариант 4

Таблица 4

           

.

PВариант 5

Таблица 5

-37 -32 -34 -38
-36 -30 -29 -30
-32 -35 -38 -31
-30 -34 -30 -32
-32 -29 -33 -31
-33 -35 -30 -38
-27 -34 -39 -32
-28 -30 -25 -32
-40 -35 -32 -28
-33 -30 -35 -34
-31 -35 -30 -29
-31 -36 -34 -35
-39 -33 -33 -32
-30 -24 -31 -30
-34 -29 -34 -29
-37 -32 -29 -31

.

PВариант 6

Таблица 6

-262 -256 -273 -270
-261 -288 -270 -264
-268 -269 -266 -269
-255 -276 -264 -268
-261 -266 -270 -262
-275 -248 -285 -280
-263 -281 -268 -263
-279 -266 -268 -289
-269 -282 -272 -278
-276 -281 -269 -279
-274 -265 -273 -265
-272 -288 -283 -273
-284 -290 -269 -283
-276 -278 -284 -252
-275 -282 -270 -283
-276 -276 -271 -285
-250 -271 -271 -279
-278 -279 -289 -264
-268 -273 -294 -270
-288 -271 -271 -281
-266 -264 -271 -268
-275 -270 -279 -277
-285 -261 -277 -273
-259            

.

PВариант 7

Таблица 7

           

.

 

PВариант 8

Таблица 8

.

PВариант 9

Таблица 9