Корреляционная матрица

 

Признаки Коэффициенты корреляции
Cu Zn V Cорг Zr Ti
Cu 1,00 0,92 0,60 0,82 -0,20 -0,48
Zn 0,92 1,00 0,56 0,79 -0,25 -0,44
V 0,60 0,56 1,00 0,77 -0,24 -0,44
Coрг 0,82 0,79 0,77 1,00 -0,23 -0,54
Zr -0,20 -0,25 -0,24 -0,23 1,00 0,73
Ti -0,48 -0,44 -0,44 -0,54 0,73 1,00

Примечание: коэффициенты корреляции являются значимыми (b=0,05) при их абсолютном значении не менее 0,44.

 

Анализ коэффициентов корреляции показывает, что накопление элемента Cu происходило одновременно с Zn (0,92), Cорг (0,82) и V (0,60), но биполярно и не связано с накоплением элементов Zr и Ti. Содержание элементов Zr и Ti коррелирует между собой (0,73). Эту связь между элементами можно проиллюстрировать на корневой диаграмме признаков для выявления структуры признаков и предварительного анализа факторов.

 


 

 

 

 

Рисунок 5 Диаграмма связи признаков


Основной математический метод выделения факторов и их нагрузок основан на нахождении собственных чисел и собственных векторов корреляционной матрицы.

Таблица 8

Факторные нагрузки, собственные значения и веса признаков

 

Признаки Факторные нагрузки
F1 F2 F3 F4 F5 F6
Cu 0,893 0,291 0,269 -0,005 0,111 -0,180
Zn 0,876 0,266 0,331 -0,146 0,024 0,173
V 0,783 0,154 -0,574 -0,141 0,118 0,015
Coрг 0,914 0,228 -0,123 0,143 -0,276 -0,018
Zr -0,478 0,827 -0,056 0,275 0,085 0,045
Ti -0,724 0,590 -0,006 -0,336 -0,110 -0,049
Собственные значения 3,77 1,26 0,53 0,25 0,12 0,07
Веса факторов, % 62,78 21,06 8,83 4,17 2,04 1,12

Примечание: факторные нагрузки являются значимыми (b=0,05) при их абсолютном значении не менее 0,44

 

Величины собственных чисел (факторные нагрузки ) и векторов (веса факторов,%) факторной нагрузки признаков табл.7 показывают, что песчано-глинистые отложения характеризуются на 62,78% фактором F1 и на 21,06% фактором F2.

На первом этапе анализа необходимо определить минимальное число факторов, адекватно воспроизводящие наблюдаемые корреляции. Анализ признаковой структуры преимущественного фактора F1 (62,78%) показывает, что нагрузка этого фактора имеет сложный характер и определяется как содержанием элементов Cu (0,893), Zn (0,876), Cорг (0,914), V (0,783) так и значимой отрицательной связью Ti (-0,724).

Признаковая структура однополярного фактора F2 (21,06%) характеризует влияние элементов Zr (0,827) и Ti (0,590) на свойства отложения. Влияние элемента V (-0,574) выявляется фактором F3 (8,83%). Наиболее часто число выделяемых факторов определяется количеством собственных чисел больше единицы. В нашем случае это первые два фактора. Другой критерий определяется через графическое изображение собственных чисел. Выделение заканчивается на том факторе, после которого исследуемая зависимость близка к горизонтальной линии. Как видно на рисунке 6, выделяется не более 4 факторов. Окончательное решение должно базироваться на приемлемости с точки зрения научных представлений в данной области.

Рисунок 6

 

Следующим шагом с помощью процедуры вращения выявляются наиболее легко интерпретируемые факторы. Существует три подхода к этой проблеме. Геометрический подход используется, когда число факторов не более двух и имеются отдельные скопления (кластеры) признаков. Аналитический – выбирается критерий, на основе которого производится вращение (ортогональное или косоугольное) осей.

В третьем подходе задается априорная целевая матрица, соответствующая предполагаемой факторной структуре. Целью всех вращений является получение наиболее простой факторной структуры или достижение простоты интерпретации признаков и факторов.

 


1. Рассмотрим случай выделения двух факторов и для вращения будем использовать метод «Варимакс» в предположении, что он дает лучшее разделение факторов.

Таблица 9

Факторные нагрузки, собственные значения и веса признаков

после вращения

 

Признаки Факторные нагрузки
F1 F2
Cu 0,929 0,140
Zn 0,903 0,155
V 0,769 0,214
Cорг 0,920 0,206
Zr -0,056 -0,953
Ti -0,382 -0,852
Собственные значения 3,263 1,767
Веса факторов, % 54,4 29,5

 

Рисунок 7

 

 

 

Рисунок 8

 

В отличие от исходной системы координат теперь факторы разделены на биполярные группы признаков, у которых имеется общая направленность и интерпретируемость (рис. 7,8). В исходных данных можно выделить дополнительные сходные и отличительные свойства.


 

2. Выделяем три фактора и видим, что элемент V по своим свойствам выделяется из первого фактора в отдельный третий фактор F3, а элемент Cорг распределилось по факторам F1 и F3 . В новых координатах можно провести дополнительные исследования свойств залежи.

 

Таблица 10

 

Факторные нагрузки, собственные значения и веса факторов

трех признаков после вращения

 

Признаки Факторные нагрузки
F1 F2 F3
Cu 0,921 0,149 0,290
Zn 0,932 0,168 0,225
V 0,325 0,166 0,912
Cорг 0,698 0,188 0,617
Zr -0,050 -0,954 -0,044
Ti -0,299 -0,847 -0,257
Собственные значения 2,403 1,741 1,416
Веса факторов, % 40,0 29,0 23,6

 


 

3. Задаем требование – выделить четыре фактора и произвести вращение системы координат.

Таблица 11

Факторные нагрузки, собственные значения и веса факторов

четырех признаков после вращения

 

Признаки Факторные нагрузки
F1 F2 F3 F4
Cu 0,916 0,085 0,276 0,181
Zn 0,942 0,159 0,233 0,052
V 0,336 0,140 0,919 0,091
Cорг 0,677 0,056 0,581 0,354
Zr -0,080 -0,981 -0,084 -0,124
Ti -0,263 -0,631 -0,202 -0,691
Собственные значения 2,373 1,415 1,361 0,662
Веса факторов, % 39,5 23,6 22,7 11,0

 

В новой системе координат четвертый фактор F4 определяет накопление Ti в отложениях, однако с такой же долей участия этот элемент входит во второй фактор F2. Видимо, такое положение происходит из-за избыточности четвертого фактора F4. Таким образом, как следует и из графического представления и численных вычислений, два-три фактора наиболее полно характеризуют признаковую структуру данных отложений (рис.9)


 

 

 

Рисунок 9

 

 

Вывод

Анализ признаковой структуры трех выявленных факторов позволяет предполагать, что фактор F1 может быть интерпретирован как действие сульфидного диагенеза в осадке, вызванного разложением органики в анаэробной среде и развитием процессов бактериальной сульфатредукции. С этим процессом и связано образование сульфидов меди, цинка, накопление Сорг. Кроме того, органика выступает еще и как концентратор ванадия, что описывается фактором F3. Фактор F2 может быть интерпретирован как терригенное накопление в осадке аллотигенных минералов титана и циркония.

 

ЗАКЛЮЧЕНИЕ

 

Проведенное рассмотрение показывает, что факторный анализ позволяет не только выявлять причинно-следственные взаимосвязи различных признаков изучаемых геологических объектов, но и решать разнообразные генетические вопросы путем выявления главных действующих факторов, анализа их признаковой структуры и анализа факторной структуры изучаемых признаков различных геологических образований. Более того, метод позволяет воссоздать в факторном координатном пространстве облик изучаемого геологического объекта и указать его характерные признаки и отличительные особенности.

 

Литература

1. Д. Лоули, А. Максвелл Факторный анализ как статистический метод // М.: Изд-во Мир, 1967, 144 с.

2. М. Д. Белонин, В. А. Голубева, Г. Т. Скублов Факторный анализ в геологии // М.: Недра, 1982, 269 с.

3. Дж. Ким, Ч.У. Мюллер, У.Р. Кларк Факторный, дискриминантный и кластерный анализ // М.: Финансы и статистика, 1989, 215 с.

 


[1] Факторная нагрузка - общий термин, означающий коэффициенты матрицы факторного отображения или структуры. По сути, это коэффициенты корреляции между переменными и факторами