Корреляционная матрица
Признаки | Коэффициенты корреляции | |||||
Cu | Zn | V | Cорг | Zr | Ti | |
Cu | 1,00 | 0,92 | 0,60 | 0,82 | -0,20 | -0,48 |
Zn | 0,92 | 1,00 | 0,56 | 0,79 | -0,25 | -0,44 |
V | 0,60 | 0,56 | 1,00 | 0,77 | -0,24 | -0,44 |
Coрг | 0,82 | 0,79 | 0,77 | 1,00 | -0,23 | -0,54 |
Zr | -0,20 | -0,25 | -0,24 | -0,23 | 1,00 | 0,73 |
Ti | -0,48 | -0,44 | -0,44 | -0,54 | 0,73 | 1,00 |
Примечание: коэффициенты корреляции являются значимыми (b=0,05) при их абсолютном значении не менее 0,44.
Анализ коэффициентов корреляции показывает, что накопление элемента Cu происходило одновременно с Zn (0,92), Cорг (0,82) и V (0,60), но биполярно и не связано с накоплением элементов Zr и Ti. Содержание элементов Zr и Ti коррелирует между собой (0,73). Эту связь между элементами можно проиллюстрировать на корневой диаграмме признаков для выявления структуры признаков и предварительного анализа факторов.
Рисунок 5 Диаграмма связи признаков
Основной математический метод выделения факторов и их нагрузок основан на нахождении собственных чисел и собственных векторов корреляционной матрицы.
Таблица 8
Факторные нагрузки, собственные значения и веса признаков
Признаки | Факторные нагрузки | |||||
F1 | F2 | F3 | F4 | F5 | F6 | |
Cu | 0,893 | 0,291 | 0,269 | -0,005 | 0,111 | -0,180 |
Zn | 0,876 | 0,266 | 0,331 | -0,146 | 0,024 | 0,173 |
V | 0,783 | 0,154 | -0,574 | -0,141 | 0,118 | 0,015 |
Coрг | 0,914 | 0,228 | -0,123 | 0,143 | -0,276 | -0,018 |
Zr | -0,478 | 0,827 | -0,056 | 0,275 | 0,085 | 0,045 |
Ti | -0,724 | 0,590 | -0,006 | -0,336 | -0,110 | -0,049 |
Собственные значения | 3,77 | 1,26 | 0,53 | 0,25 | 0,12 | 0,07 |
Веса факторов, % | 62,78 | 21,06 | 8,83 | 4,17 | 2,04 | 1,12 |
Примечание: факторные нагрузки являются значимыми (b=0,05) при их абсолютном значении не менее 0,44
Величины собственных чисел (факторные нагрузки ) и векторов (веса факторов,%) факторной нагрузки признаков табл.7 показывают, что песчано-глинистые отложения характеризуются на 62,78% фактором F1 и на 21,06% фактором F2.
На первом этапе анализа необходимо определить минимальное число факторов, адекватно воспроизводящие наблюдаемые корреляции. Анализ признаковой структуры преимущественного фактора F1 (62,78%) показывает, что нагрузка этого фактора имеет сложный характер и определяется как содержанием элементов Cu (0,893), Zn (0,876), Cорг (0,914), V (0,783) так и значимой отрицательной связью Ti (-0,724).
Признаковая структура однополярного фактора F2 (21,06%) характеризует влияние элементов Zr (0,827) и Ti (0,590) на свойства отложения. Влияние элемента V (-0,574) выявляется фактором F3 (8,83%). Наиболее часто число выделяемых факторов определяется количеством собственных чисел больше единицы. В нашем случае это первые два фактора. Другой критерий определяется через графическое изображение собственных чисел. Выделение заканчивается на том факторе, после которого исследуемая зависимость близка к горизонтальной линии. Как видно на рисунке 6, выделяется не более 4 факторов. Окончательное решение должно базироваться на приемлемости с точки зрения научных представлений в данной области.
Рисунок 6
Следующим шагом с помощью процедуры вращения выявляются наиболее легко интерпретируемые факторы. Существует три подхода к этой проблеме. Геометрический подход используется, когда число факторов не более двух и имеются отдельные скопления (кластеры) признаков. Аналитический – выбирается критерий, на основе которого производится вращение (ортогональное или косоугольное) осей.
В третьем подходе задается априорная целевая матрица, соответствующая предполагаемой факторной структуре. Целью всех вращений является получение наиболее простой факторной структуры или достижение простоты интерпретации признаков и факторов.
1. Рассмотрим случай выделения двух факторов и для вращения будем использовать метод «Варимакс» в предположении, что он дает лучшее разделение факторов.
Таблица 9
Факторные нагрузки, собственные значения и веса признаков
после вращения
Признаки | Факторные нагрузки | |
F1 | F2 | |
Cu | 0,929 | 0,140 |
Zn | 0,903 | 0,155 |
V | 0,769 | 0,214 |
Cорг | 0,920 | 0,206 |
Zr | -0,056 | -0,953 |
Ti | -0,382 | -0,852 |
Собственные значения | 3,263 | 1,767 |
Веса факторов, % | 54,4 | 29,5 |
Рисунок 7
Рисунок 8
В отличие от исходной системы координат теперь факторы разделены на биполярные группы признаков, у которых имеется общая направленность и интерпретируемость (рис. 7,8). В исходных данных можно выделить дополнительные сходные и отличительные свойства.
2. Выделяем три фактора и видим, что элемент V по своим свойствам выделяется из первого фактора в отдельный третий фактор F3, а элемент Cорг распределилось по факторам F1 и F3 . В новых координатах можно провести дополнительные исследования свойств залежи.
Таблица 10
Факторные нагрузки, собственные значения и веса факторов
трех признаков после вращения
Признаки | Факторные нагрузки | ||
F1 | F2 | F3 | |
Cu | 0,921 | 0,149 | 0,290 |
Zn | 0,932 | 0,168 | 0,225 |
V | 0,325 | 0,166 | 0,912 |
Cорг | 0,698 | 0,188 | 0,617 |
Zr | -0,050 | -0,954 | -0,044 |
Ti | -0,299 | -0,847 | -0,257 |
Собственные значения | 2,403 | 1,741 | 1,416 |
Веса факторов, % | 40,0 | 29,0 | 23,6 |
3. Задаем требование – выделить четыре фактора и произвести вращение системы координат.
Таблица 11
Факторные нагрузки, собственные значения и веса факторов
четырех признаков после вращения
Признаки | Факторные нагрузки | |||
F1 | F2 | F3 | F4 | |
Cu | 0,916 | 0,085 | 0,276 | 0,181 |
Zn | 0,942 | 0,159 | 0,233 | 0,052 |
V | 0,336 | 0,140 | 0,919 | 0,091 |
Cорг | 0,677 | 0,056 | 0,581 | 0,354 |
Zr | -0,080 | -0,981 | -0,084 | -0,124 |
Ti | -0,263 | -0,631 | -0,202 | -0,691 |
Собственные значения | 2,373 | 1,415 | 1,361 | 0,662 |
Веса факторов, % | 39,5 | 23,6 | 22,7 | 11,0 |
В новой системе координат четвертый фактор F4 определяет накопление Ti в отложениях, однако с такой же долей участия этот элемент входит во второй фактор F2. Видимо, такое положение происходит из-за избыточности четвертого фактора F4. Таким образом, как следует и из графического представления и численных вычислений, два-три фактора наиболее полно характеризуют признаковую структуру данных отложений (рис.9)
Рисунок 9
Вывод
Анализ признаковой структуры трех выявленных факторов позволяет предполагать, что фактор F1 может быть интерпретирован как действие сульфидного диагенеза в осадке, вызванного разложением органики в анаэробной среде и развитием процессов бактериальной сульфатредукции. С этим процессом и связано образование сульфидов меди, цинка, накопление Сорг. Кроме того, органика выступает еще и как концентратор ванадия, что описывается фактором F3. Фактор F2 может быть интерпретирован как терригенное накопление в осадке аллотигенных минералов титана и циркония.
ЗАКЛЮЧЕНИЕ
Проведенное рассмотрение показывает, что факторный анализ позволяет не только выявлять причинно-следственные взаимосвязи различных признаков изучаемых геологических объектов, но и решать разнообразные генетические вопросы путем выявления главных действующих факторов, анализа их признаковой структуры и анализа факторной структуры изучаемых признаков различных геологических образований. Более того, метод позволяет воссоздать в факторном координатном пространстве облик изучаемого геологического объекта и указать его характерные признаки и отличительные особенности.
Литература
1. Д. Лоули, А. Максвелл Факторный анализ как статистический метод // М.: Изд-во Мир, 1967, 144 с.
2. М. Д. Белонин, В. А. Голубева, Г. Т. Скублов Факторный анализ в геологии // М.: Недра, 1982, 269 с.
3. Дж. Ким, Ч.У. Мюллер, У.Р. Кларк Факторный, дискриминантный и кластерный анализ // М.: Финансы и статистика, 1989, 215 с.
[1] Факторная нагрузка - общий термин, означающий коэффициенты матрицы факторного отображения или структуры. По сути, это коэффициенты корреляции между переменными и факторами