Экстремальный эксперимент
Задачей планирования при экстремальном эксперименте является минимизация числа опытов при нахождении оптимальных условий. Например, необходимо найти температуру негрева заготовок и скорость деформирования, обеспечивающие минимальную себестоимость поковки при горячей изотермической штамповке
Простейшим методом планирования эксперимента является проведение испытаний при всевозможных сочетаниях факторов (способ перебора). Однако уже при двухфакторном эксперименте для получения полной картины необходимо проведение большого числа испытаний. Поэтому часто при решении экспериментальных задач используют следующий способ: изменяя только один фактор (остальные остаются постоянными), находят частный экстремум по данному фактору; затем последовательно определяют следующие экстремумы путем изменения второго, третьего и следующих факторов. Процедура повторяется до тех пор, пока не будет достигнут оптимум по всем факторам (рисунок 27).
Рисунок 27. Поиск оптимальной области путем последовательного определения частных оптимумов (штриховые линии) и методом крутого восхождения (штрих-пунктирные линии); сплошными
показаны линии равного уровня оптимизируемой функции
Такая схема приводит к значительному уменьшению числа опытов, но также не является оптимальной и иногда приводит к нахождению ложных экстремумов.
Характеристика цели при экстремальном эксперименте, заданная количественно, называется параметром оптимизации. Параметр оптимизации является откликом на воздействие факторов – независимых переменных. Результаты используют для получения математической модели – системы математических соотношений, описывающих изучаемый процесс. В частном случае – это уравнение, связывающее параметр оптимизации с факторами. Такое уравнение называется также функцией отклика.
В общем случае функция отклика может быть представлена выражением
=f(х1, х2,...,хк),
где xi – независимые переменные (факторы).
Функцию отклика, если она неизвестна из теории, можно представить, например, полиномом вида
=0+1Х1+2Х2+12Х1Х2+11Х12+...,
где i – коэффициент регрессии.
По результатам эксперимента можно определить только выборочные коэффициенты регрессии bi, которые являются лишь оценками теоретических коэффициентов i. На первом этапе для определения направления движения к оптимуму и крутого восхождения по поверхности отклика функции отклика выражают полиномом первой степени
у=b0+b1х1+b1х2+b3х3+...+bk хk.
Для определения коэффициентов этого уравнения надо реализовать факторный эксперимент типа 2k. Планы такого эксперимента называются планами первого порядка. Крутое восхождение заканчивают после достижения области оптимума, которую чаще всего удается описать полиномом второй степени:
y=b0+b1х1+...+b12х1х2+...+b11х12+...+bkkхk2.
Чтобы определить все коэффициенты этого уравнения, необходимо реализовать план эксперимента, в котором каждый фактор варьируется не менее чем на трех уровнях. Такие планы называются планами второго порядка.
Итак, стратегия метода при исследовании поверхности отклика с целью нахождения экстремума состоит в следующем. На основе малой серии опытов находится локальное описание поверхности отклика в некоторой исходной области с помощью модели линейного вида. В центре области рассчитывается линейное приближение градиента, и в направлении градиента, т. е. в направлении наискорейшего подъема (крутого восхождения), проводятся опыты до достижения стационарной области, в которой расположен экстремум. Если найденное линейное приближение градиента для центра области существенно отличается от значения градиента в некоторой точке по направлению движения, то можно найти новое описание поверхности отклика с помощью полиномов первого порядка в окрестности этой точки и рассчитать новое значение градиента. В стационарной области линейная модель оказывается уже не адекватной, и для описания поверхности отклика в этой области, как правило, используются полиномы второй и даже третьей степени. В стационарной области требуется провести большее число экспериментов, так как здесь необходимо получить возможно более точное описание.
Вектор-градиент непрерывной функции y=f(x1, x2, … xn) имеет вид
где i, j – единичные векторы по осям переменных x.
Этот вектор перпендикулярен поверхности равного уровня y=const и указывает направление наискорейшего подъема (крутого восхождения). Если модель линейная, то коэффициенты bi являются координатами вектор-градиента. Если изменять факторы пропорционально найденным оценкам этих коэффициентов, то реализуется движение в направлении наискорейшего приближения к оптимуму.
Компоненты градиента экспериментально полученной линейной модели зависят от основного уровня и интервалов варьирования переменных.
Полный факторный эксперимент
Решение задачи оптимизации начинают с выбора области эксперимента на основе априорной информации. В области эксперимента устанавливают основные уровни и интервалы варьирования факторов. Основным, или нулевым, уровнем фактора называется его значение, принятое за исходное в плане эксперимента. Построение плана эксперимента состоит в выборе точек, симметричных относительно исходной точки.
Интервалом варьирования фактора называется число, прибавление которого к основному уровню дает верхний уровень фактора (соответственно – нижний). Уровни факторов кодируют:
Хi=
где – натуральное значение фактора; интервал варьирования (чаще – половина интервала).
Эксперимент, в котором реализуются все сочетания уровней, называется полным факторным экспериментом. Если число уровней m, а факторов – k, то полное число опытов (без учета дублирующих, или параллельных, опытов)
N=mk.
При линейной модели N=2k.
Факторный эксперимент осуществляют с помощью матрицы планирования. Например, для двух факторов матрица планирования показана в виде табл. 1. Число строк в матрице равно числу опытов. Кодированные значения факторов представляют сокращенно: + или -.
Таблица 1
Матрица планирования при числе факторов 2
№ опыта | x1 | x2 | у |
- + - + | - - + + | у1 у2 у3 у4 |
Для движения по градиенту вначале необходима линейная модель. При k=2
у=b0+b1х1+b2х2.
Значения коэффициентов в этом уравнении определяют с помощью значений функции отклика. Их три, а опытов – 4. Разность между числом опытов и числом коэффициентов модели называется числом степеней свободы
f=N-(k +1).
Число степеней свободы может быть использовано для проверки адекватности модели.
Величина и знак коэффициента в уравнении регрессии указывают на вклад данного фактора в общий результат.
Линейным называется эффект, характеризующий линейную зависимость параметра оптимизации от соответствующего фактора. Эффект совместного влияния нескольких факторов называется эффектом взаимодействия. С учетом эффекта взаимодействия при числе факторов k=2 (табл. 2):
у=b0+b1х1+b2х2+b12х1х2.
Здесь х0 – столбец фиктивной переменной. Он вводится для оценки величины b0.
Таблица 2
Матрица планирования при учете эффекта взаимодействия
№ опыта | х0 | х1 | х2 | х1х2 | у |
+ + + + | - + - + | - - + + | + - - + | у1 у2 у3 у4 |
Для построения плана матриц с большим числом факторов можно пользоваться следующим приемом. В первом столбце х, знаки меняются поочередно, во втором – через 2, в третьем – через 4 и т.д.
Дробный факторный эксперимент
Для сокращения числа экспериментов в линейной модели типа 22 можно принять b12=0, а столбец матрицы х1х2 использовать для третьего фактора х3. Тогда
у=b0+b1х1+b2х2+b3х3.
Для определения коэффициентов этого уравнения достаточно провести 4 опыта вместо 8 в полном факторном эксперименте типа 23. План эксперимента, предусматривающий реализацию половины опытов, называется полурепликой. Дробные реплики обозначают 2k-р, где р – число линейных эффектов, приравненных к эффектам взаимодействия. При р=2, получают ¼-реплику, р=3 – 1/8-реплику. Реплики, используемые для сокращения опытов в 2m раз, называются регулярными.
В связи с тем, что в дробных репликах часть взаимодействий замена новыми факторами, найденные коэффициенты уравнения регрессии будут являться совместными оценками линейных эффектов и эффектов взаимодействия. Такие оценки называются смешанными. Линейные эффекты рекомендуется смешивать с теми взаимодействиями, которые согласно априорной информации незначимы.
Число несмешанных эффектов в дробной реплике называется ее разрешающей способностью.
Часто приходится решать задачи, в которых заранее можно полагать, что эффекты взаимодействия, хотя и малы по сравнению с линейными, но все же не равны нулю. В таких случаях необходимо заранее определить, какие коэффициенты являются смешанными оценками. Тогда в зависимости от условий поставленной задачи, подбирается такая дробная реплика, с помощью которой можно извлечь максимальную информацию из эксперимента.
Прямая оценка разрешающей способности дробной реплики затруднена. Поэтому дробные реплики задают с помощью генерирующих соотношений. Генерирующим называется соотношение, которое показывает, какое из взаимодействий принято незначимым и заменено новым фактором (х3=х1х2, например).
Дробная реплика, полученная заменой всех эффектов взаимодействия новыми факторами, называется насыщенной. Адекватность модели в этом случае проверить невозможно, т.к. число степеней свободы равно нулю
.
Свойства матриц полного и дробного факторного
эксперимента
1.Симметричность относительно центра эксперимента – алгебраическая сумма элементов столбца каждого фактора равна нулю:
,
где ϳ – номер опыта; i – номер фактора.
2.Свойство нормировки: сумма квадратов элементов каждого столбца равна числу опытов:
.
3.Свойство ортогональности – сумма построчных произведений элементов любых двух столбцов равна нулю:
,
где i, l – номера факторов, il.
Ортогональность матрицы позволяет оценить все коэффициенты уравнения регрессии независимо друг от друга. Если какой-либо коэффициент регрессии окажется незначимым, его можно отбросить, не пересчитывая остальных.
4.Свойство ротатабельности: точки в матрице планирования подбирают так, что математическая модель, полученная по результатам эксперимента, способна предсказывать значения параметра оптимизации с одинаковой точностью в любых направлениях на равных расстояниях от центра эксперимента.