Архивация данных
Защита (сохранность) информации
В большинстве информационных систем (ИС) стоимость хранимой информации превышает стоимость аппаратуры и программного обеспечения данной ИС. Поэтому обеспечение максимальной сохранности данных - одна из важнейших задач как разработчиков ИС, так и тех, кто ее обслуживает (администраторов, системных программистов и т.д.).
К защищаемой информации (информационным ресурсам системы) относятся электронные документы и спецификации, программное обеспечение, структуры и базы данных и др.
Создать абсолютно надежную ИС (в том смысле, чтобы существовала гарантия бессбойной и безошибочной работы ИС в течении нескольких лет) невозможно. Поэтому, говоря о защите информации в ИС следует говорить о таких понятиях, как среднее время простоя в год, вероятность сбоя, время восстановления работоспособности системы после сбоя и т.д. В любом из этих случаев обязательным является требование сохранить всю информацию или, в крайнем случае, минимизировать потери информации.
Выделим основные причины, по которым информация может быть утрачена:
1. Отказ оборудования.
2. Ошибка в прикладном ПО. Например, программа может неправильно формировать критерий удаления данных и пользователь, сам того не желая, может удалить несколько нужных записей вместо одной, неправильно введеной.
3. Ошибка персонала. Администратор может отформатировать старый диск с важными данными. Сюда же стоит отнести и преднамеренное уничтожение информации.
Решение проблемы обеспечения сохранности информации это тот или иной способ дублирования данных. Дублирование данных может быть постоянным, то есть данные системы постоянно копируются в некоторую резервную среду хранения и, соответственно, резервные данные соответствуют текущему состоянию данных. Другой вариант дублирования данных - это архивация, то есть создание некоторой копии данных в их текущем состоянии и консервация этой копии.
Для защиты информации на дисках от потери следует регулярно создавать резервные (архивные) копии файлов. Если для копирования файлов использовать обычные команды копирования, то архивные копии будут занимать такой же объем памяти, как и исходные файлы. Поэтому для выполнения резервного копирования (архивации) файлов и их восстановления (backup/restore) существуют специальные программные продукты. Эти программные продукты позволяют создавать сжатые копии файлов и извлекать информацию из них в первоначальном виде. При этом экономия памяти может составлять 60-70% для текстовых файлов и 20-30% для готовых к выполнению файлов. Архивный файл это имеющий оглавление набор из одного или нескольких файлов в сжатом виде. Оглавление позволяет узнать, какие файлы содержатся в архиве.
Теоретически существует только три способа уменьшения избыточности данных. Это либо изменение содержания данных, либо изменение их структуры, либо и то и другое вместе.
Целью процесса сжатия, как правило, есть получение при помощи некоторого их преобразования более компактного выходного потока информационных единиц из некоторого изначально некомпактного входного потока.
Основными техническими характеристиками процессов сжатия и результатов их работы являются:
· степень сжатия (compress rating) или отношение (ratio) объемов исходного и результирующего потоков;
· скорость сжатия - время, затрачиваемое на сжатие некоторого объема информации входного потока, до получения из него эквивалентного выходного потока;
· качество сжатия - величина, показывающая, как сильно упакован выходной поток, при помощи применения к нему повторного сжатия по этому же или иному алгоритму.
Если при сжатии данных происходит изменение их содержания, метод сжатия необратим, т.е. при восстановлении данных из сжатого файла не происходит полного восстановления исходной последовательности. Такие методы называют также методами сжатия с регулируемой потерей информации. Они применимы к данным, для которых формальная утрата части содержания не приводит к значительному снижению потребительских свойств. Это видеоряды, музыкальные записи, рисунки. Методы сжатия с потерей информации нельзя применять к текстовым документам, базам данных и, тем более, к программному коду. Характерными форматами сжатия с потерей информации являются:
•. JPG для графических данных;
• .MPG для видеоданных;
• .МРЗ для звуковых данных.
Метод сжатия данных обратим, если при сжатии происходит только изменение структуры данных, т.е. исходный массив данных можно восстановить применением обратного метода. Обратимые методы можно применять для любых типов данных. Распространенными форматами сжатия без потери информации являются:
.ZIP, .ARJ, .RARдля любых типов данных, в частности текстов;
.GIF, TIF, .PCXдля графических данных.
Современные программные средства для создания и обслуживания архивов имеют большие функциональные возможности, часто выходящие за рамки простого сжатия данных. В этом смысле современные средства архивации данных называют диспетчерами архивов.
К базовым функциям, которые выполняют большинство современных диспетчеров архивов, относятся:
• извлечение файлов из архивов;
• создание новых архивов;
• добавление файлов в имеющийся архив;
• создание самораспаковывающихся архивов;
• создание распределенных архивов на носителях малой емкости;
• тестирование целостности структуры архивов;
• полное или частичное восстановление поврежденных архивов;
• защита архивов от просмотра и несанкционированной модификации.
Наиболее распространенные программные средства, предназначенные для
создания и обслуживания архивов WinZip, WinRAR, WinArj.