Диаграмма рассеяния (scatterplot)

АНАЛИЗ ПАРНЫХ ВЗАИМОСВЯЗЕЙ

Основные понятия

l Статистическая связь и ее отличие от функциональной.

l Связь как синхронность (согласованность) – корреляционный анализ.

l Связь как зависимость (влияние) – регрессионный анализ (причинно-следственные связи).

l Парная связь как частный случай множественной связи.

l Неучтенные факторы.

Этапы анализа

l Выявление наличия взаимосвязи между признаками;

l Определение формы связи;

l Определение силы (тесноты) и направления связи.

 

Значительная корреляция между двумя случайными величинами всегда является свидетельством существования некоторой статистической связи в данной выборке.

Но эта связь не обязательно должна наблюдаться для другой выборки и иметь причинно-следственный характер. Часто заманчивая простота корреляционного исследования подталкивает исследователя делать ложные интуитивные выводы о наличии причинно-следственной связи между парами признаков, в то время как коэффициенты корреляции устанавливают лишь статистические взаимосвязи. Например, рассматривая пожары в конкретном городе, можно выявить весьма высокую корреляцию между ущербом, который нанес пожар, и количеством пожарных, участвовавших в ликвидации пожара, причём эта корреляция будет положительной. Из этого, однако, не следует вывод «бо́льшее количество пожарных приводит к бо́льшему ущербу. В то же время, отсутствие корреляции между двумя величинами ещё не значит, что между ними нет никакой связи.

 

Выявление наличия связи между признаками

Диаграммы рассеяния

Выявление наличия связи между признаками

l Простейшим визуальным способом выявить наличие взаимосвязи между количественными переменными является построение диаграммы рассеяния (scatterplot). Это график, на котором по горизонтальной оси (X) откладывается одна переменная, по вертикальной (Y) другая. Каждому объекту на диаграмме соответствует точка, координаты которой равняются значениям пары выбранных для анализа переменных.

Диаграмма рассеяния (scatterplot)