Однако большое число единиц в совокупности, а также если одному значению факторного признака соответствует несколько значений результативного признака затрудняет восприятие рядов.

В таких случаях целесообразнее воспользоваться для установления факта наличия связи корреляционными или групповыми таблицами.

Корреляционно-регрессионный анализ

Построение корреляционной таблицы начинают с группировки значений факторного и результативного признаков. Так как в приводимом примере факторный признак представлен всего пятью вариантами повторяющихся значений, достаточно в первом столбце табл. 4 записать эти варианты.

Для результативного признака необходимо определить величину интервала. Для этого воспользуемся формулой Стерджесса:

человек,

где k=1+3,322*lg20=5

В корреляционной таблице факторный признак, как правило, располагают в строках, а результативный признак у — в столбцах (графах) таблицы. Числа, расположенные на пересечении строк и столбцов таблицы, означают частоту повторения данного сочетания значений х и у (табл. 2).

Группировка значений факторного и результативного признаков Таблица 4

  Центральное значение интервала fx х*fx x2*fx
  Группы по у Группы по х 720-816 817-913 914-1010 1111-1107 1108-1207
 
  - -  
  -  
  -  
  - -
  - -
fy -
yfy - - -
xyfy - - -
                     

Примечание. yj—среднее значение результативного признака j-й группы значений факторного признака;

fx — частота повторения данного варианта значения факторного признака для всей совокупности;

fy—частота повторения результативного признака по всей совокупности.

По данной корреляционной таблице можно сделать предположение о наличии или отсутствии связи, а также выяснить ее направление. Если частоты в корреляционной таблице расположены по диагонали из левого верхнего угла в правый нижний угол (т.е. большим значениям фактора соответствуют большие значения функции), то можно предположить наличие прямой корреляционной зависимости между признаками. Если же частоты расположены по диагонали справа налево (из правого верхнего угла в левый нижний угол), то предполагают наличие обратной связи между признаками.

О тесноте связи между признаками x и y можно судить по кучности расположения частот вокруг диагонали. Если клетки заполнены большими цифрами, то связь слабая. Чем ближе частоты (fxy) располагаются к одной из диагоналей, тем теснее связь. Если в расположении частот (fxy) нет системности, то можно судить об отсутствии связи.

Для более четкого выявления основной тенденции связи, можно для каждой строки рассчитать средние значения результативного признака, соответствующие значению признака-фактора.

Среднее число туристов для первой группы, состоящей из трех фирм, которые тратят на рекламу 8 усл. ден. ед., будет равно 800 человек:

человек

Для следующей группы, состоящей из пяти фирм, у которых затраты на рекламу равны 9 усл. ден. ед., = (768*1 + 865*3 + 962*1)/5 = 865 человек и т.д. (рассчитанные таким образом средние представлены в графе 8 табл. 4).

Т.о., увеличение средних значений результативного признака с увеличением значений факторного признака еще раз свидетельствует о возможном наличии прямой корреляционной зависимости числа туристов, воспользовавшихся услугами фирмы, от затрат фирмы на рекламу.

Корреляционная таблица позволяет компактно изложить материал, поэтому все последующие расчеты (показателей тесноты связи и параметров уравнения регрессии) можно вести по корреляционной таблице, что особенно удобно при значительном объеме исходных данных.

Корреляционная зависимость видна отчетливо только при рассмотрении средних значений результативного признака, соответствующих определенным значениям факторного признака.

Т.к., предполагается, что причины, которые носят случайный характер, при определении средней по группам взаимопогашаются, т.е. дают в каждой группе один и тот же результат. Следовательно, различия в величине средних будут связаны только с различиями в величине данного факторного признака. Если бы связи между факторным и результативным признаками не было, то все групповые средние были бы приблизительно одинаковыми по величине.

Другим возможным приемом обнаружения связи является построение групповой таблицы. Все наблюдения разбиваются на группы в зависимости от величины признака-фактора, и по каждой группе вычисляются средние значения результативного признака (табл. 5).

Таблица 5

Группы туристических фирм по затратам на рекламу (в усл. ден. ед.) Число фирм в группе Среднее число туристов, воспользовавшихся услугами данной группы фирм (человек)
Итого -

Примечание. Различие в величине среднего числа туристов каждой группы фирм, вычисленных в корреляционной (см. графу 8 табл. 4) и групповой таблицах (см. графу 3 табл. 5) объясняется тем, что при расчете средних в корреляционной таблице действительные значения результативного признака заменяются центральными значениями интервалов группировки.

Сравнив средние значения результативного признака по группам, можно сделать вывод, что рост затрат туристических фирм на рекламу влечет за собой увеличение числа клиентов, пользующихся услугами фирмы, т. е. в рассматриваемом примере можно предположить наличие прямой корреляционной зависимости между признаками.

Корреляционная зависимость видна отчетливо только при рассмотрении средних значений результативного признака, соответствующих определенным значениям факторного признака.

Т.к., предполагается, что причины, которые носят случайный характер, при определении средней по группам взаимопогашаются, т.е. дают в каждой группе один и тот же результат. Следовательно, различия в величине средних будут связаны только с различиями в величине данного факторного признака. Если бы связи между факторным и результативным признаками не было, то все групповые средние были бы приблизительно одинаковыми по величине.