Отбор исходных данных
Отбор исходных данных для корреляционного анализа необходимо производить с определенной степенью осторожности, т.к. от качества и количества этих данных зависит ценность практических результатов. Отобранная для расчетов статистическая совокупность должна быть одновременно и достаточно мошной по объему и достаточно однородной по своему составу.
С одной стороны, надежность корреляционных формул непосредственно зависит от количества данных, используемых при расчете, т.к. случайные ошибки статистических оценок определяются
не только величиной их колеблемости, но и размером совокупности.
Например, среднеквадратическая ошибка коэффициента множественной корреляции:
si=(1-R2)/(n-p-1)1/2
где п - количество наблюдений;
р - число факторов;
R - коэффициент множественной корреляции;
R2 - коэффициент множественной детерминации. С другой стороны, включение в расчет дополнительных данных может нарушить однородность изучаемой совокупности, что, в свою очередь, лишает получаемые статистические показатели реального экономического смысла. Поэтому исходный статистический материал должен тщательно проверяться на однородность состава.
Например, нецелесообразно объединять в одну совокупность предприятия существенно различных отраслей. Из анализа следует исключить предприятия, резко отличающиеся по своим основным показателям от всей массы предприятий рассматриваемой отрасли.
При отборе исходных данных для корреляционного анализа хозяйственной деятельности предприятий той или иной отрасли возможно два принципиально различных подхода:
1) сравнение работы предприятий в рассматриваемой отрасли за какой-то один период времени, например, год;
2) сравнение работы предприятий этой отрасли за несколько смежных лет.
В первом случае получаем так называемую пространственную выборку - выборку по множеству. Построенная на ее основе модель будет иметь статический характер.
Во втором случае применяется так называемый метод «заво-до-лет». Сущность его заключается в том, что данные различных лет объединяются в единую совокупность. Это значительно увеличивает объем наблюдения. Однако каждый завод фигурирует в получаемой таким образом совокупности несколько раз, и между его показателями, относящимися к разным годам, следует ожидать определенной корреляции. Таким образом, исходный статистический материал не представляет собой совокупности независимых испытаний, что лежит в оспине применения теории корреляции. Это несколько снижает дополнительный усредняющий эффект, возникающий в результате увеличения объема совокупности, но не может устранить его полностью, т.к. экономические показатели колеблются не только от предприятия к предприятию, но и от года к году внутри каждого предприятия, Достоинство этого подхода-то, что модель, построенная па основе такой выборки, будет иметь определенный динамический характер, т.к. и ней фактически учитываются изменения экономических показателей во времени.
Основной источник получения необходимых исходных данных -это официальная статистическая отчетность,
Для корреляционного анализа хозяйственной деятельности основным видом отчетности являются годовые бухгалтерские отчеты предприятий, а также разрабатываемые и издаваемые на базе этих отчетов ежегодные сборники технико-экономических показателей работы предприятий соответствующей отрасли. Однако зачастую ни сами годовые отчеты, пи издаваемые сборники не содержат многих необходимых для корреляционного анализа показателей, которые приходится рассчитывать дополнительно на базе имеющейся в отчетах и сборниках информации.
Кроме того, не существует методики оценки точности показателей в самих годовых отчетах. В отдельных случаях прибегают к специальным обследованиям и опросам.