Организация резерва на уровне компьютера и КС

Резервирование на уровне компьютера. В аппаратуре универсальных компьютеров резервирование встречается на различных уровнях. На уровне компьютера резервирование заключается в наличии большого числа однотипных машин, что необходимо для решения постановленных задач. В этом случае надежность системы оценивается как для систем со скользящим резервированием. В случае универсальных компьютеров целесообразно использовать производительность всех имеющихся процессоров. Тогда свойство системы удобнее характеризовать через эффективную производительность системы.

 

 

где Пi – производительность (число задач выполняемых машиной в единицу времени) i-ой машины;

n – число машин в системе;

Кi – коэффициент готовности i-ой машины.

Если отдельные системы компьютера, объединенные через адаптеры между каналами для периферийных устройств, через общее поле памяти или другим способом, образуют многомашинную (многопроцессорную) КС, то эффективная производительность такой системы

 

,

 

где m – количество состояний системы;

Pj – вероятность того, что система находится j-м состоянии;

Пj – производительность системы в j-м состоянии.

Вероятность Pj определяют методом Марковских цепей. Поскольку конфигурация таких систем может быть самой различной, для оценки вероятности сохранения связности системы следует применять методы расчета надежности систем со сложной структурой, например метод минимальных путей и сечений.

Резервирование на уровне устройств. На более низких уровнях иерархии структуры в универсальных компьютерах резервирование встречается на уровне периферийных устройств (ПУ). Для решения задач требуется некоторое минимальное число ПУ.

Резервирование на уровне кодов – в компьютерах для повышения надежности ОЗУ и ПЗУ применяются коды с обнаружением и исправлением ошибок. Применение этих кодов дает возможность исправлять определенное число ошибок в каналах передачи или восстанавливать информацию в случае отказа некоторых ячеек в ОЗУ и ПЗУ или дорожек (то есть усилителей записи-считывания) в накопителях на магнитных дисках. Надежность таких устройств оценивается как надежность резервированных систем со скользящим резервом.

Резервирование в специализированных и управляющих компьютерах. В специализированных, а особенно в управляющих машинах резервирование применяется значительно шире в связи с высокими требованиями к надежности таких систем.

На уровне компьютера, а иногда на уровне программного обеспечения применяется троирование. Встречаются также системы, где используется несколько резервных машин. В целях повышения надежности часть из них может работать в режиме нагруженного резерва, часть в режиме ненагруженного. Однако резервирование на уровне компьютера не самое экономичное. Для повышения надежности при ограничении массы, стоимости и габаритных размеров КС используется резервирование отдельных устройств машин троированием или применением нескольких нагруженных или ненагруженных резервов. Для повышения надежности самых ответственных узлов применяется троирование или логика с переплетениями (представляется в виде избыточной логической схемы, где ошибки в одном слое корректируются в этом же или следующем слое логических элементов).

Все рассмотренные методы резервирования в КС относятся к пассивному резервированию, так как не предусматривают реконфигурацию системы. Способы резервирования, предусматривающие автоматическую реконфигурацию системы используются в отказоустойчивых компьютерных системах (ОКС). В ОКС используются средства обнаружения, локализации отказа и средства реконфигурации.

Отказы в ОКС обнаруживается при помощи средств контроля, а локализуются при помощи средств диагностики и устраняются автоматической реконфигурацией системы. Реконфигурация заключается в перестройке структуры вычислительных средств таким образом, чтобы ее отказавшие части были устранены от участия в работе.

Контрольные вопросы и задания

 

1. Что такое резервирование?

2. Какие виды структурного резервирования широко распространены на практике?

3. Что такое постоянное (общее) резервирование?

4. Каково значение кратности резервирования при дублировании?

5. Приведите пример комбинированного резерва элементов КТ?

6. Составьте структурную схему надежности устройства состоящего из четырех основных элементов, включенных по схеме раздельного резервирования с нагруженным резервом (m = 1).

7. Как оценивается ВБР при мажоритарном резервировании?

8. Где чаще всего применяется динамическое резервирование?

9. Составьте структурную надежности устройства КС состоящего из 4-х основных элементов, включенных по схеме общего резервирования с нагруженным резервом при m = 2.

10. При каком способе резервирования устройств ИС всегда присутствуют переключающие устройства (коммутатор)?

 

Литература: 1,2,3,5,6, 7.

 


Лекция 7

Тема: Расчет характеристик надёжности невосстанавливаемых резервированных систем

 

План

 

1. Расчетные формулы для общего и раздельного резервирования с постоянно включенным резервом и целой кратностью.

2. Расчетные формулы для общего, раздельного резервирования с замещением с целой и дробной кратностью.

3. Расчетные формулы для скользящего и мажоритарного резервирование устройств ИС.

4. Структурная схема надёжности конкретного устройства ИС. Пример расчета показателей надёжности для экспоненциального закона распределения.

 

 

Ключевые слова

Надёжность, общее резервирование, раздельное резервирование, кратность резервирования, постоянный резерв, резервирование замещением, дробная кратность, структурная схема надёжности, мажоритарное резервирование, скользящий резерв, показатели надёжности, вероятность безотказной работы, экспоненциальный закон.

 

 

Приведем основные расчетные формулы для указанных выше видов резервирования [1, 2, 3, 4, 5, 6].

Общее резервирование с постоянно включенным резервом и целой кратностью. В этом случае ВБР системы равна:

 

, (1)

 

где pi(t) – вероятность безотказной работы i-го элемента в течение времени t;

n – число элементов основной или любой резервной цепи;

m – число резервных цепей (кратность резервирования).

Для последовательного включения элементов отказы являются независимыми случайными событиями, тогда по аксиоме умножения вероятностей ВБР системы:

 

,

 

где pi – ВБР подсистемы.

Для параллельного включения элементов ВБР равна:

 

,

где pj – ВБР подсистемы.

При экспоненциальном законе надежности, когда ВБР ,

 

, (2)

 

средняя наработка до первого отказа

 

, (3)

 

где – интенсивность отказов нерезервированной системы или любой из резервных систем;

Тср.о. – среднее время безотказной работы нерезервированной системы или любой из резервных систем.

Раздельное резервирование с постоянно включенным резервом и целой кратностью

 

, (4)

 

где pi(t) – вероятность безотказной работы i-го элемента;

mi – кратность резервирования i-го элемента;

n – число элементов основной системы.

При экспоненциальном законе, когда , ВБР системы:

 

, (5)

 

где mi – кратность резервирования i-го элемента.

Средняя наработка до первого отказа:

 

 

Общее резервирование с замещением и целой кратностью

 

, (6)

 

где Pm+1(t), Pm(t) – ВБР резервированной системы кратностью m и m+1 соответственно;

P(t-τ) – ВБР основной системы в течение времени (t-τ);

am(τ)– частота отказов резервированной системы кратности m в момент времени τ.

Эта формула позволяет получить расчетные соотношения для устройств любой кратности резервирования. Для получения таких формул необходимо выполнить интегрирование в правой части, подставляя вместо P(t-τ) и am(τ) их значения в соответствии с выбранным законом распределения и состоянием резерва.

При экспоненциальном законе надежности и ненагруженном состоянии резерва:

(7)

 

, (8)

 

где , Тср.0 – интенсивность отказа и средняя наработка до первого отказа основного (нерезервированного) устройства;

m – число резервных цепей (кратность резерва);

 

Раздельное резервирование замещением с целой кратностью

Вероятность безотказной работы в этом случае:

 

, (9)

 

где Pi(t) – ВБР системы i-го типа, резервированных по способу замещения;

Pi(t) – вычисляют по формулам общего резервирования замещением;

n – число элементов основной группы.

 

Скользящее резервирование. Pc(t)определяется:

 

, (10)

 

, (11)

 

где λ0 = λ∙n – интенсивность отказов нерезервированной системы;

λ – интенсивность отказов элемента;

n – число элементов основной системы;

Тср.0 – среднее время безотказной работы нерезервированной системы;

m0 – число резервных элементов

В этом случае кратность резервирования m=m0/n.

 

Мажоритарное резервирование

Вероятность безотказной работы системы:

 

, (12)

 

где Pm(t) – ВБР в течение времени t мажоритарного органа;

P(t) – ВБР в течение времени t одного элемента (для случая когда m=2 и n=1).

 

Обеспечение надежности баз данных ИС

 

Несколько специфичны вопросы обеспечения целостности базы данных в ИС. К надежности баз данных (БД) предъявляется особо жесткие требования, поскольку информация, хранимая в них, используется обычно многократно.

Под целостностью базы данных понимается такое ее состояние, когда имеет место полное и точное сохранение всех введенных в БД данных и отношений между ними, иными словами, если не произошло случайного разрушения или искажения этих данных или их структуры. Для сведения к минимуму потерь от случайных искажений данных необходимо иметь возможность своевременно обнаруживать и устранять ошибки на этапах хранения, обновления и реорганизации базы данных. Это требует большого набора вспомогательных программ обслуживания баз данных.

К ним относятся программы:

- ведения системного журнала, подробно фиксирующего каждую операцию (транзакцию) над базой данных;

- эффективного контроля достоверности;

- репликация для получения копии базы данных (или ее частей) с целью последующего их восстановления при искажении;

- восстановления для возврата базы данных в первоначальное состояние при обнаружении искажения данных (используя копии базы данных и массивы изменений, формируемых в журнале).

Для надежной работы базы данных ИС осуществляются:

- непрерывное администрирование базы данных ИС;

- регистрация каждого имевшего место доступа к базе данных и выполненных изменений в журнале БД. В журнал заносятся:

- текст запроса на изменение БД, содержащий описание транзакции, терминала и пользователя, время, текст исходного сообщения, тип и адрес изменения данных;

- копии файлов БД до внесения в нее изменений;

- использование средств СУБД для санкционированного доступа и защиты данных (формирование подсхем базы данных как подмножества структуры базы данных).

- создание резервных копий БД, «зеркалирование» дисков;

- введение четко регламентированной системы документооборота и форм документов, разрешенных к использованию;

- криптографирование базы данных;

- формирование групп пользователей работы и привилегий доступа к ресурсам БД.

Для обеспечения целостности БД могут устанавливаться специальные режимы использования файлов базы данных:

- монопольный– запрещающий обращения к БД от всех программ кроме одной, вносящей изменения и считывающей информацию из полей базы данных;

- защищенный – вносить изменения в БД вправе лишь одна программа, а остальные программы могут только считывать информацию.

Резервирование и восстановлениебаз данных при аварийных завершениях программы (отказ системы, повреждение носителя) выполняется по нескольким стратегиям. В частности, резервирование файлов базы данных может выполняться:

- в одномпоколении (создание точных копий – дублей файлов БД);

- в разных поколениях (хранятся дубли нескольких временных поколений файлов: «дед», «отец», «сын», и т.д., а также ведется системный журнал изменений);

- смешанное резервирование, использующее совместно две первые стратегии.

Контрольные точки(точки рестарта, точки отката) – место повторного запуска программы при аварийном ее завершении. В контрольных точках обычно выполняются: внесение изменений в БД, разблокирование всех файлов, на обращение к которым был заложен запрет, запись информации о контрольной точке в системный журнал.

Использование массивов RAID (Redundant Array of Inexpensive Disks – избыточный массив недорогих дисков) существенно уменьшает риск простоя системы из-за отказов накопителей на магнитных дисках, которые являются одним из наименее надежных компонентов современных компьютеров.

В качестве наиболее эффективных мер комплексного обеспечения надежности ИС можно назвать кластеризацию компьютеров и использование отказоустойчивых компьютеров.

 

 

Контрольные вопросы и задания

 

1. Приведите аналитическое выражение для оценки ВБР при общем (постоянном) резервировании?

2. Составьте структурную схему надежности устройства состоящего из четырех основных элементов, включенных по схеме раздельного резервирования с нагруженным резервом (m = 1).

3. Как оценивается ВБР при мажоритарном резервировании?

4. Как определить наработку на отказ при скользящем резервировании?

5. Где чаще всего применяется динамическое резервирование?

6. Как оценить частоту отказа в случае раздельного резервирования системы?

7. При каком способе резервирования резервный элемент работает одновременно с основным?

8. Определите структурную схему надежности невосстанавливаемого резервированного устройства, где безотказность следует рассчитывать по формуле:

9. Определить наработку на отказ при экспоненциальном законе надежности и ненагруженном состоянии резерва.

10. Какие осуществляются меры для надежной работы базы данных?

11. Что напоминается под целостностью базы данных?

12. В каких случаях может, выполнятся резервирование файлов данных?

13. Дайте определение понятиям: монопольный, защищенный и разделенный режимы использования файлов БД.

14. Для чего в КС используют RAID – массивы?

 

Литература: 1,2,3,6,10.


Лекция 8

Тема: Надёжность резервированных устройств с последовательно-параллельной структурой (метод свертки)

 

 

План

 

1. Метод свертки, оценка надёжности для последовательно-параллельных систем с нагруженным резервом.

2. Расчетные формулы для оценки количественных характеристик методом свертки.

3. Основные достоинства и недостатки метода свертки.

 

 

Ключевые слова

Показатели надёжности, метод свёртки, нагруженный резерв, последовательно-параллельная структура, схема основного соединения, преобразование формул, вероятность безотказной работы, интенсивность отказов, этапы преобразования, структурная схема надёжности.

 

 

Для последовательно-параллельных невосстанавливаемых структур технических систем (ИС) эффективным методом оценки надежности является метод свертки.

Данный метод является точным методом и основан на последовательном преобразовании структуры устройств ИС и сведения её к основному соединению элементов. Покажем применение данного метода на примере структуры, показанной на рис. 1.

 

 

 

Рис. 1. Структурная схема надежности последовательно-параллельной структуры ТС

 

Пусть каждый элемент рассматриваемой структуры характеризуется вероятностью безотказной работы Pi. Необходимо определить вероятность безотказной работы, системы.

Метод свертки состоит из нескольких этапов.

На первом этапе рассматриваются все параллельные соединения, которые заменяются эквивалентными элементами с соответствующим показателем надежности. В рассматриваемом примере такими параллельными элементами являются: 1 и 2; 3, 4 и 5; 6 и 7.

После первого этапа преобразований схема примет вид (рис. 2).

 

 

Рис. 2. Схема после первого этапа преобразований

 

Характеристики надежности элементов схемы равны (согласно формуле: , где Pj – вероятность безотказной работы подсистем).

На втором этаперассматриваются все последовательные соединения, которые заменяются эквивалентными элементами.

Здесь последовательными элементами являются 8 и 9; 12 и 13. после второго этапа преобразований схема примет вид, показанный на рис. 3.

 

 

Рис. 3. Схема после второго этапа преобразований

 

Характеристики надежности элементов определяются с помощью следующих выражений ( ):

 

Р21 = Р12 ∙ Р13 = [1-(1-P3)(1-P4)(1-P5)][1-(1-P6)(1-P7)];

 

Р228∙Р9

 

На третьем этапе вновь, рассматриваются все параллельные соединения, которые заменяются эквивалентными элементами.

В рассматриваемом примере такими параллельными элементами являются 21 и 22.

После третьего этапа преобразований схема примет вид, показанной на рис. 4.

 

 

Рис. 4. Схема после третьего этапа преобразований

 

Характеристики надежности элементов определяются с помощью следующих выражений.

Р31 =1-(1-P21)(1-P22)=1-{1-[1-(1-P3)(1-P4)(1-P5)][1-(1-P6)(1-P7)]}(1-P8P9);

 

На четвертом этапе для последовательной структуры устройств ИС определяется ВБР системы.

Рс =P11∙P31 P10=[1-(1-P1)(1-P2)]{1-{1-[1- (1-P3)(1-P4)(1-P5)]

[1-(1-P6)(1-P7)]}(1-P8P9)} ∙Р10;

 

Пример. Определим показатели надежности системы при условии, что вероятности безотказной работы элементов соответственно равны:

 

Р1=0,8; Р2=0,9; Р3=0,7; Р4=0,8;

Р6=0,9; Р7=0,95; Р8=0,95; Р9=0,9;

Р5=0,9;

Р10=0,98.

 

Результаты расчета вероятности безотказной работы сведем в таблицу 1.

 

Таблица 1.

Исходные данные расчета 1-й этап расчета 2-й этап расчета 3-й этап расчета 4-й этап расчета
Р1=0,8 Р11=0,98 Р11=0,98 Р11=0,98 Рс=0,959
Р2=0,9 Р12=0,994 Р21=0,991 Р31=0,999  
Р3=0,7 Р13=0,995 Р22=0,855 Р10=0,98  
Р4=0,8 Р8=0,95 Р10=0,98    
Р6=0,9 Р9=0,9      
Р7=0,95 Р10=0,98      
Р8=0,95        
Р9=0,9        
Р5=0,9        
Р10=0,98        

 

Как видно из приведенного примера, метод свертки является весьма эффективным методом определения показателей надежности невосстанавливаемых параллельно-последовательных структур.

Число элементов мало влияет на сложность проведения расчетов, в основном происходит увеличение числа этапов расчета.

Недостатком метода свертки является его ограниченность параллельно-последовательными схемами. Например, показатели надежности мостиковой структуры ИС с помощью указанного метода определить невозможно.

 

Контрольные вопросы и задания

 

1. К какому способу оценки надежности относится метод свертки?

2. Составьте структурную надежности устройства ИС состоящего из 4-х основных элементов, включенных по схеме общего резервирования с нагруженным резервом при m = 2.

3. В каком случае резервный элемент, обладает идеальной надежностью?

4. Какой из характеристик надежности устройств КТ относится к показателям безотказности?

5. Какую формулу необходимо использовать при расчете вероятности отказа ИС.

6. Определите значение интенсивности отказов высоконадежных устройств ИС.

7. Дайте классификацию видов резервирования.

8. Укажите основные достоинства и недостатки метода свертки для расчета надежности последовательно-параллельных структур.

9. На чем основан метод свертки?

10. Как влияет число элементов в устройстве на сложность проведения расчетов методом свертки?

 

Литература: 1,2,3,5,6, 7.

 


Лекция 9

Тема: Оценка надежности методом путей и сечений. Логико-вероятностные методы анализа сложных систем

 

План

 

1. Метод минимальных путей и сечений для расчета показателей надежности систем с разветвленной структурой.

2. Основные определения и понятия логико-вероятностных методов анализа и оценка надежности ИС.

3. Сущность метода кратчайшего пути успешного функционирования и минимального сечения отказов.

4. Расчет функции работоспособности и функции отказа для мостиковой структуры.

5. Области применения этих методов. Статистическое моделирование для оценки надежности ИС.

 

 

Ключевые слова

Показатели надежности, разветвленная структура ИС, минимальных путь, сечение, логико-вероятностный метод, мостиковая схема, функция работоспособности, кратчайший путь успешного функционирования, минимальное сечение отказов, вероятность безотказной работы, функция алгебры логики, структурная схема расчета надежности.

 

 

Встречаются структуры и способы организации ИС, когда резервирование имеет место, но его нельзя представить по схеме последовательного и параллельного включения элементов или подсистем. Для анализа надежности таких структур используют метод минимальных путей и сечений, который относится к приближенным методам и позволяет определить граничные оценки надежности сверху и снизу [1, 2, 3, 5, 6].

Путем в сложной структуре называется последовательность элементов, обеспечивающих функционирование (работоспособность) системы.

Сечением называется совокупность элементов, отказы которых приводят к отказу системы.

Вероятность безотказной работы последовательно включенных параллельных цепей дает верхнюю оценку для ВБР системы данной структуры. Вероятность безотказной работы параллельно включенных последовательных цепей из элементов путей дает нижнию оценку для ВБР системы данной структуры. Фактическое значение показателя надежности находится между верхней и нижней границами.

Рассмотрим мостиковую схему соединения элементов системы, состоящей из пяти элементов (рис. 1).

 

 

Рис. 1. Мостиковая схема соединения элементов (подсист.)

 

Здесь набор элементов образует минимальный путь, если исключение любого элемента из набора приводит к отказу пути. Из этого вытекает, что в переделах одного пути элементы находятся в основном соединении, а сами пути включаются параллельно. Набор минимальных путей для мостиковой схемы представлен на рис. 2. Пути образуют элемента 1, 3; 2, 4; 1, 5, 4; 2, 5, 3.

 

 

Рис. 2. Набор минимальных путей.

 

Для всех элементов схемы известны ВБР Р1, Р2, Р3, Р4, Р5 и соответствующие им вероятности отказа типа «обрыв» Q1÷Q5, необходимо определить вероятность наличие цепи между точками а и в. Поскольку один и тот же элемент включается в два параллельных пути, то в результате расчета получается оценка безотказности сверху.

 

Рв = 1-Q13∙Q24∙Q154∙Q253 = 1- (11Р3)(12Р4)(11Р5Р4)(12Р5Р3)

 

При определении минимальных сечений осуществляется подбор минимального числа элементов, перевод которых из работоспособного состояния в неработоспособное вызывает отказ системы.

При правильном подборе элементов сечения возвращение любого из элементов в работоспособное состояние восстанавливает работоспособное состояние системы.

Поскольку отказ каждого из сечений вызывает отказ системы, то первые соединяются последовательно. В переделах каждого сечения элементы соединяются параллельно, так как для работы системы достаточно наличия работоспособного состояния любого из элементов сечения.

Схема минимальных сечений для мостиковой схемы приведена на рис. 3. Так как один и тот же элемент включается в два сечения, то полученная оценка является оценкой снизу.

Pн = P12∙P34∙P154∙P253 = (1-q1q2)(1-q3q4)(1-q1q5q4)(1-q2q5q3)

 

 

 

Рис. 3. Набор минимальных сечений

 

Вероятность безотказной работы системы Рс оценивается тогда по двойному неравенству

Рн≤Рс≤Рв

 

Таким образом, данный метод позволяет представить систему с произвольной структурой в виде параллельных и последовательных цепей. (При составлении минимальных путей и сечений любая система преобразуется в структуру с параллельно-последовательным или последовательно-параллельным соединением элементов). Метод прост, но требует точного определения всех путей и сечений. Он получил широкое применение при расчете надежности подсистем АСУТП, особенно применительно к системам защиты и логического управления. Его используют в системах регулирования мощности реактора, предусматривающая возможность перехода от одной неисправной цепи регулирования к другой, находящийся в резервном состоянии.