Отбор исходных данных

Отбор исходных данных для корреляционного анализа необхо­димо производить с определенной степенью осторожности, т.к. от качества и количества этих данных зависит ценность практических результатов. Отобранная для расчетов статистическая совокупность должна быть одновременно и достаточно мошной по объему и дос­таточно однородной по своему составу.

С одной стороны, надежность корреляционных формул непо­средственно зависит от количества данных, используемых при рас­чете, т.к. случайные ошибки статистических оценок определяются

не только величиной их колеблемости, но и размером совокупно­сти.

Например, среднеквадратическая ошибка коэффициента мно­жественной корреляции:

si=(1-R2)/(n-p-1)1/2

где п - количество наблюдений;

р - число факторов;

R - коэффициент множественной корреляции;

R2 - коэффициент множественной детерминации. С другой стороны, включение в расчет дополнительных дан­ных может нарушить однородность изучаемой совокупности, что, в свою очередь, лишает получаемые статистические показатели ре­ального экономического смысла. Поэтому исходный статистиче­ский материал должен тщательно проверяться на однородность со­става.

Например, нецелесообразно объединять в одну совокупность предприятия существенно различных отраслей. Из анализа следует исключить предприятия, резко отличающиеся по своим основным показателям от всей массы предприятий рассматриваемой отрасли.

При отборе исходных данных для корреляционного анализа хо­зяйственной деятельности предприятий той или иной отрасли воз­можно два принципиально различных подхода:

1) сравнение работы предприятий в рассматриваемой отрасли за какой-то один период времени, например, год;

2) сравнение работы предприятий этой отрасли за несколько смежных лет.

В первом случае получаем так называемую пространственную выборку - выборку по множеству. Построенная на ее основе мо­дель будет иметь статический характер.

Во втором случае применяется так называемый метод «заво-до-лет». Сущность его заключается в том, что данные различных лет объединяются в единую совокупность. Это значительно увели­чивает объем наблюдения. Однако каждый завод фигурирует в получаемой таким образом совокупности несколько раз, и между его показателями, относящимися к разным годам, следует ожидать определенной корреляции. Таким образом, исходный статистиче­ский материал не представляет собой совокупности независимых испытаний, что лежит в оспине применения теории корреляции. Это несколько снижает дополнительный усредняющий эффект, возникающий в результате увеличения объема совокупности, но не может устранить его полностью, т.к. экономические показатели ко­леблются не только от предприятия к предприятию, но и от года к году внутри каждого предприятия, Достоинство этого подхода-то, что модель, построенная па основе такой выборки, будет иметь оп­ределенный динамический характер, т.к. и ней фактически учиты­ваются изменения экономических показателей во времени.

Основной источник получения необходимых исходных данных -это официальная статистическая отчетность,

Для корреляционного анализа хозяйственной деятельности ос­новным видом отчетности являются годовые бухгалтерские отчеты предприятий, а также разрабатываемые и издаваемые на базе этих отчетов ежегодные сборники технико-экономических показателей работы предприятий соответствующей отрасли. Однако зачастую ни сами годовые отчеты, пи издаваемые сборники не содержат многих необходимых для корреляционного анализа показателей, которые приходится рассчитывать дополнительно на базе имею­щейся в отчетах и сборниках информации.

Кроме того, не существует методики оценки точности показа­телей в самих годовых отчетах. В отдельных случаях прибегают к специальным обследованиям и опросам.