Использование метода нейронных сетей для построения статистических математических моделей

Эффективным математическим аппаратом для обработки результатов измерения, для построения математической модели является метод искусственных нейронных сетей (Neural Networks) [77], получившими название по аналогии с биологическими нейронными сетями. Название метода возникло в процессе разработок в области искусственного интеллекта в 1950-е годы, которые не увенчались успехами, в основном, из-за недостатков аппаратурного и программного обеспечения.

Под экспериментальной математической моделью понимается функция, обеспечивающая отображение входного вектора в выходной вектор . Определение структуры и параметров экспериментальной математической модели проводится на основе обучающей выборки, характеризуемой парами векторов . Наиболее часто применяют регрессионные модели. Однако аппроксимация функциональной зависимости степенным многочленом, используемым в регрессионном анализе, возможна только при малой размерности n вектора входных параметров, т.е. при малом числе частных характеристик. С ростом n резко возрастает число корректируемых параметров многочлена, возникает «проклятие размерностей». Например, для аппроксимации зависимости, имеющей 30 входных переменных, требуется степенной многочлен, содержащий примерно 46 000 корректируемых параметров.

Наиболее известной структурой нейронной сети, используемой для аппроксимации, является многослойный перцептрон (Multilayer Perceptron), т.е. сеть, характеризуемая числом слоев L и количеством нейронов l в l-м слое. Связи между нейронами в каждом слое отсутствуют. Каждый i-й нейрон l-го слоя преобразует входной параметр в выходную скалярную величину (рис.30). Для этого вычисляется функция

где - весовой коэффициент. являющийся настраиваемым параметром и характеризующий связь j-го нейрона l-1 –го слоя с нейроном l-го слоя; - пороговый элемент (поправка).

Посколькуи , далее полученная функция преобразуется в выходную величину .

Нелинейное преобразование задается какой- либо функцией активации, например, сигмоидальной функцией .

 

­Рис.30. Структура нейронной сети в виде многослойного перцептрона

 

Рассмотрим возможность использования нейронных сетей для классификации оцениваемых объектов. В общем виде задача классификации представляет собой задачу отнесения измеряемого параметра или оцениваемого объекта к определенному множеству, классу. Возможны различные способы представления исходных экспериментальных данных. Наиболее распространенным является способ, при котором совокупность значений характеристик представляется вектором, компоненты которого - значения отдельных характеристик. Эти значения влияют на принятие решения о том, к какому классу необходимо отнести оцениваемый объект в соответствии с разработанным ранее классификатором. Этот классификатор служит для разбиения N- мерного пространства (N – количество характеристик объекта), называемого пространством входов.

Для построения классификатора необходимо определить, какие параметры влияют на принятии решения о том, к какому классу принадлежит объект. Если количество параметров мало, один и тот же набор исходных данных будет соответствовать совокупностям характеристик, соответствующих разным классам. Увеличение размерности пространства признаков может привести к тому, что число имеющихся образцовых совокупностей характеристик окажется недостаточным для обучения сети. Выбор объема сети может быть сделан конструктивным или деструктивным методом. Первый метод подразумевает выбор сети минимального размера, и ее последующее увеличение для достижения требуемой точности второй – обратный порядок.

Можно привести обобщенный алгоритм построения классификатора на основе нейронной сети.

Работа с исходными данными заключается в составлении базы имеющихся экспериментальных данных и разбиении всей совокупности данных на два (обучающее и тестовое) или три (обучающее, тестовое и подтверждающее) множества.

Предварительная обработка входных данных состоит в выборе системы признаков и их преобразовании (нормирование, стандартизация и т.д.), а также системы кодирования выходных значений .

Конструирование, обучение и оценка сети состоит в выборе количества нейронов и методики обучения сети (например, определение коэффициентов весомости параметров, функций преобразования), в оптимизации архитектуры (прореживание пространства признаков, уменьшение коэффициентов весомости), в выборе варианта, который обеспечивает наилучшую способность к обобщению, оценке качества работы сети по тестовому множеству.

В процессе использования сети выявляется степень влияния различных факторов на принимаемое решение, оценивается точность классификации (например, по числу неправильно распознанных объектов), вносятся такие необходимые изменения, как способ представления данных.

Важное значение имеет способ представления входных данных для нейронной сети, т.е. способ их нормирования. Нормирование необходимо, т.к. сети работают с данными, представленными числами в диапазоне 0…1, а исходные данные могут иметь произвольный диапазон или быть нечисловыми значениями. Методы нормирования могут быть также любыми, включая линейное преобразование, многомерный анализ параметров и нелинейное нормирование с учетом коэффициентов весомости отдельных параметров.

Деление диапазона значений даже отдельной характеристики не является однозначным, возможно линейное, нелинейное, а также вероятностное разделение.